R Spatial : hijrah dari GIS ke statistik ruang

Ada menu baru di sini, R Spatial. Kombinasi dari GIS dan RStatistics. Meskipun judulnya migrasi dari GIS ke statistik ruang, bukan berarti benar-benar meninggalkan GIS. Software ini yang telah menghidupi saya sejak proyekan dulu sewaktu mahasiswa hingga sekarang. Jadi sangat tidak mungkin kalau ditinggalkan begitu saja. Hanya memberikan variasi statistik saja, mencoba lebih konsen ke RStatistics berbasis keruangan. Selama ini GIS menjadi end product berupa visualisasi peta ataupun data, tetapi sekarang harus berubah fungsi. Software GIS baik QGIS maupun ArcGIS akan menjadi produsen data yang kemudian akan ditransformasi ke RStatistics untuk memperkuat modeling matematikanya. Memang dunia teknik tidak bisa lepas dengan dunia hitung – menghitung.

Di menu baru ini, saya tidak akan share mengenai teori-teori keruangan, apalagi tutorial-tutorial detail mengenai how to. Tetapi lebih akan bercerita mengenai pengalaman termasuk setiap error yang dihadapi saat menjalankan RStatistics untuk analisis keruangan. Banyak fungsi-fungsi QGIS dan ArcGIS yang sebenarnya bisa kita manfaatkan untuk analisis statistik keruangan tetapi kekuatan terbesarnya tetap di ruang dan bukan di statistik. Oleh karena itu, besar harapan dengan hijrah ini akan memperkuat modeling kuantitatifnya. Bisa membongkar bagaimana perilaku data yang membentuk model dan pada akhirnya bisa disimpulkan sebagai finding atau result.

Tidak ada pilihan memang, harus melangkah kesini. Itu adalah alasan utamanya. Gara-gara model statistik yang belum mumpuni untuk dijadikan sebagai begini lho hasilnya maka mau tidak mau harus membongkar data. Harus diotak-atik, dibongkar setiap rumus statistik hingga bagaimana data-data tersebar hingga membentuk model matematika. Sebaran data, bagaimana pola data hingga apa yang bisa kita sebut sebagai data behavior. Data yang digunakan tidak 100, tidak pula menggunakan sampel tetapi data populasi yang jumlahnya ribuah hingga jutaan. Data terakhir yang diolah saja hampir berjumlah 2 juta hingga komputer harus loading lebih lama dan bahkan nge-hang. Ini menjadi alasan selanjutnya.

Isi yang akan berada dikategori menu baru ini adalah hasil-hasil olah data dari riset terpublikasi atau dari visualisasi data yang tidak digunakan, entah karena gagal atau mungkin saja berganti. Berubah dan gagal itu adalah hal yang wajar di dalam riset. Namanya saja research, yang bisa diartikan secara translasi sebagai mencari kembali. Itu adalah konsekuensi dari proses bertingkat dari satu temuan ke temuan lainnya. Di kala mencoba membuktikan satu hipotesa dan ternyata hasilnya tidak terlalu berbeda dengan riset sebelumnya maka tidak menutup kemungkinan harus menggeser arah riset. Dan itu pernah dilakukan. Bukan hanya itu, data control yang digunakan untuk menjelaskan variabel juga bisa saja berganti sesuai dengan diskusi ilmiah global. Sebagai contoh, tahun 1960-an penelitian mengenai hedonic regression model menggunakan jarak euclidean sebagai data control kemudian berubah menjadi jarak terpendek menurut jaringan jalan dan sekarang berubah menjadi jarak tercepat. Apakah evolusi ini cukup? Saya rasa tidak, sangat mungkin berubah lagi karena yang ingin diukur sebenarnya bukan jarak tetapi travel cost. Asumsi yang dibangun adalah semakin pendek jarak maka semakin murah biaya transportasi. Yang berevolusi saat ini adalah bagaimana menghitung jarak terpendek itu sebagai data control biaya transportasi. Dan sekali lagi ini hanya contoh.

Tentu setiap perubahan satuan data akan mengubah model secara keseluruhan. Regresi yang selama ini dipahami sebagai pemodelan sederhana kenyataannya banyak sekali ragam modelnya. Di spatial regression sendiri ada 4 model sederhana yang saya tahu, dan ada 4 model complex lainnya. Dan ini adalah seni dari statistik itu sendiri. Tidak bisa berhenti hanya menggunakan model yang sudah dibangun oleh tokoh-tokoh top terdahulu, tetapi harus membongkar bagaimana konstruksi rumusnya. Dan software GIS sulit mencapainya. Memang tidak ada pilihan lain, harus migrasi ke R Spatial berbasis pemrograman.

Tidak berbeda jauh dengan statistik umum sebenarnya hanya ada faktor keruangan yang kemudian dipertimbangkan di dalam analisis. Itu saja sebenarnya. Kenapa ini penting? Saya sendiri baru mempelajarinya, belum begitu menguasai. Tetapi yang pasti ternyata ada faktor-faktor spatial baik lokal maupun global yang berpengaruh terhadap pemodelan kita. Contohnya begini ternyata ada penelitian yang mampu mengungkapkan pengaruh meledaknya pembangkit listrik tenaga nuklir di Jepang terhadap harga rumah di sekitarnya. Apakah ini normal? – Iya itu sangat normal. Tetapi ternyata di belahan bumi lain yang juga memiliki pembangkit nuklir dimana tidak meledak juga mengalami pengaruh yang sama. Ada fenomena spillover effect. Nah ini yang tidak bisa dijelaskan hanya mengandalkan statistik umum harus ke spatial statistics terutama global spatial statistics. Fenomena lain adalah apa yang disebut dengan ripple effect yaitu suatu effek menjalar dari satu titik ke daerah sekitarnya. Ini biasanya ditemukan pada local spatial regression. Dan apakah ini bisa dieksekusi di QGIS atau ArcGIS? – Saya tidak yakin.