R-square kurang dari .42, tidak robust sama sekali, tidak hepi. Pertengahan tahun ini, di saat memaparkan hasil analisis statistik. Nilai r-square-nya rendah sekali yang secara statistik perlu dipertimbangkan sebagai model yang tidak kuat/ tidak robust. Saya mengeluh karenanya, model itu tidak bisa diinterpretasi. Bagaimana menginterpretasi kalau modelnya saja tidak bagus atau tidak kuat? Sudah bisa dipastikan bahwa pengaruh setiap variabel ke dalam model juga perlu dipertanyakan. Dari 600.000-an dataset yang diolah menggunakan spatial statistik, ternyata tidak mudah. Sepertinya data sudah bersih, tidak ada outlier. Namun dikala masuk keperhitungan statistik menghasilkan model yang sama sekali tidak robust. Itu menjadi alasan saya untuk mengeluh: modelnya tidak robust, variabel yang kita amati tidak menunjukkan signifikansi, dan sebagainya. Dan feedback apa yang saya dapatkan dari mereka? Tidak, progress kamu sudah bagus, mungkin perlu eksplorasi dari sisi lain.
Dari hasil yang tidak memuaskan itu saya merasa bahwa pemodelan statistiknya gagal, tidak bagus sama sekali. Padahal di balik itu komputer saya menyala 24 jam selama hampir 2 bulan tanpa berhenti. Dikala saya tidur, komputer tetap bekerja. Dia adalah asisten pribadi yang melakukan pekerjaan crawling data dari layanan Google Cloud Platform, dilanggan untuk beberapa fasilitas layanannya. Kami membayar google untuk mempermudah melakukan spatial BigQuery melalui beberapa API yang mereka berikan dari google street view, direction hingga places API. Lebih banyak bekerja di 3 API itu dari serentetan layanan google. Proses crawling dilakukan untuk 600.000 titik data ke hampir 200 titik fasilitas perkotaan. Artinya bukan 600.000 x 200 melainkan 600.000 x 200 faktorial. Banyak banget, itu yang menjadi alasan kenapa komputer harus bekerja ekstra yaitu 24 jam selama hampir 2 bulan tanpa berhenti. Apakah komputer bekerja dengan lancar? Tidak, sering sekali mengalami syntax error yang mengharuskan ditangani secara manual. Dan tentu dibalik penanganan manual ini seringkali harus mencari jawaban dari forum-forum syntax seperti di stackoverflow dan sebagainya. Artnya bahwa komputer bekerja ekstra tetapi tetap harus ada penanganan manual.
Itu yang menjadi alasan kenapa harus mengeluh atas hasil yang tidak sesuai dengan ekspektasi. Ada kebaruan data yang di penelitian sebelumnya terbukti bagus, ternyata di research saya tidak menunjukkan kontribusi yang positif sama sekali. Di sisi lain, itulah yang menjadi alasan utama kenapa harus melanggan google cloud platform sebagai instrumen tambahan BigQuery. Mengetahui hal itu, mereka mengatakan: “coba eksplorasi dari sisi lain”. Sebelum mengatakan itu banyak sekali apresiasi yang saya dengar keluar dari mereka berdua. Dari progress yang sudah lumayan hingga data yang sudah bersih. “mungkin kamu butuh perspektif lain” – itu yang terus disampaikan. Tidak berhenti disitu, beberapa referensi juga sempat dikirimkan baik melalui email maupun dicarikan secara langsung saat kami melakukan diskusi. Coba baca ini, coba baca itu. Mungkin bisa diarahkan ke sini, atau mungkin diarahkan ke situ dan seterusnya.
Dan benar, alhamdulillah dari proses coba-coba, kami bisa menunjukkan dinamika perubahan pasar properti yang memperkuat teori lawas tahun 1968-an mengenai neighborhood change. Teori ini sebenarnya sudah muncul jauh sebelum tahun itu, namun di tahun 1968 itulah ada pendekatan baru untuk menyempurnakannya dari sisi pasar properti. Saya rasa tidak perlu menceritakan bagaimana perjalanan evolusi teori itu, toh tujuan dari tulisan ini bukanlah itu melainkan apreasiasi dan support. Mencoba dari sisi lain ternyata justru bisa memperkuat teori itu dari bukti-bukti statistik yang sebelumnya tidak robust. Harus ada perlakuan spatial, lagi-lagi data memiliki perilaku, kita harus paham atasnya (baca di sini). Tanpa apresiasi yang membesarkan hati dan tanpa support yang akhirnya melihat dari sisi yang berbeda (baca di sini, membangun sudut pandang), mungkin hasil itu tidak akan dipahami.
Itu budaya, lebih dari ucapan
Sekecil apapun progress, mendapatkan apresiasi. Saya memaparkan hasil statistik yang tidak robust/ tidak bagus. Ibarat mengerjakan PR matematika, soal-soal itu sudah saya coba kerjakan hingga menghabiskan berpuluh-puluh lembar kertas buram. Namun saya belum mendapatkan hasilnya. Saya membuat kesalahan atasnya, apakah demikian? usaha dan progress sepertinya tetap mendapatkan posisi yang mungkin justru sama tinggi atau justru lebih tinggi dengan hasilnya. Dari hasil yang tidak benar, sedangkan sudah mencoba dengan berbagai progress-progress statistik ternyata banyak sekali pelajaran yang bisa kita tambang darinya. Lagi-lagi, kekeliruan di dalam bahasa Inggris diartikan sebagai mistake dan itu dianggap normal di dalam belajar. Lagi! I is Amin (bukan I’m Amin), apa komentar anda jikalau saya memperkenalkan diri saya seperti itu. I is Amin dan bukanlah I’m Amin. Baik, simpan komentar itu untuk anda saja. Yang pasti, saya pernah mendengar itu secara langsung dari seseorang berambut pirang tapi bukan native English. Tahap selanjutnya adalah bahasa. Itu bukan bahasa ibu. Harus belajar bukan hanya bagaimana menyusun kata menjadi kalimat S + P + O + K yang mungkin saja kalo di scan menggunakan grammarly, sudah centang biru semua. Sudah oke menurut grammarly tapi dikala masuk ke mereka, bukanlah demikian. Ini salah, itu salah, kamu butuh belajar ini lagi, dan seterusnya – apakah itu yang dikatakan mereka? Sama sekali bukan itu. Saya persilahan anda menduganya. Lagi..lagi itu adalah budaya bukan sekedar ucapan.
Tidak berhenti di sini! di kala mau mengambil kopi, tidak sengaja berpapasan dengan salah satu dari mereka, ternyata juga mau ambil kopi. Ngobrollah kami, dan dia tertarik atas salah satu visualisasi data (cuma grafik) yang menunjukkan penurunan harga properti di daerah banjir. Dia minta ijin untuk menggunakannya di slide powerpoint yang akan dipaparkan di salah satu conference. Dia datang ke meja kerja saya, bertanya apakah boleh digunakan, dan juga bertanya mengenai detail informasi lainnya. Saya mengijinkannya, justru senang karena ada nilai yang lebih dari pekerjaan yang dilakukan. Saya menduga bahwa nama saya akan tertulis di grafik itu – mungkin di sumber, selayaknya pengutipan karya ilmiah selama ini. Etikanya memang demikian, sumbernya dari mana dan tuliskan di bagian bawah grafik. Ternyata dugaan itu tidak benar. Nama saya justru tidak ditulis sebagai sumber pembuatan grafik namun justru di cover, dimana secara budaya akademik itu bisa diartikan sebagai salah satu pencetus atau pembuat naskah. Ternyata begitu nilai dari sebuah ide, sebuah karya dan sebuah usaha yang mungkin di pihak lain itu tidak ada nilainya. Besar sekali apresiasi atas sebuah proses melebihi apa yang kita duga.