Jakarta -
Adanya informasi 'peningkatan suhu' di siang hari, dengan informasi 'peningkatan kepakan' sayap lalat, yang berfrekuensi statistik tinggi, menghasilkan pengetahuan oleh keterkaitan alamiah: pengaruh suhu terhadap gerakan lalat.
Demikian pula dari informasi 'keinginan mengonsumsi makanan berkuah panas' dengan informasi 'waktu mengonsumsinya' di jam 11-12 dini hari, terdapat keterkaitan, walaupun tak langsung. Tambahan informasi 'suhu udara terdingin saat terjaga', menjelaskan adanya keterkaitan sosialnya. Suhu udara terdingin, jadi penyebab dikonsumsinya makanan hangat.
Keterkaitan-keterkaitan alamiah maupun sosial antar peristiwa nyata itu, disebut relasi positif. Seluruhnya jadi pembentuk pengetahuan yang dapat diterima.
ADVERTISEMENT
SCROLL TO CONTINUE WITH CONTENT
Sedangkan pada informasi 'adanya kebun binatang', dengan informasi 'rendahnya kriminalitas' di sebuah kota, tak mudah ditemukan kaitan alamiah maupun sosialnya. Adanya penelusuran lebih lanjut, baru diketahui: adanya kebun binatang menyiratkan pendapatan penduduknya yang lebih tinggi, dibanding kota lain.
Lebih tingginya ini, menyebabkan pergeseran pemenuhan kebutuhan dari primer ke sekunder. Bahkan ke tingkat berikutnya. Kota dengan kebun binatang, lebih sejahtera. Warganya dapat memenuhi kebutuhan pokoknya, hingga kebutuhan hiburan. Niat bertindak kriminal tereliminasi, terbaca sebagai rendahnya tingkat kriminalitas.
Namun tak jarang juga, pada keadaan semacam di atas, benar-benar tak ada kaitan sebab-akibatnya. Informasi berfrekuensi statistik tinggi belaka. Terlebih ketika pada kota yang tak ada kebun binatangnya, kriminalitas juga rendah. Kesejahteraan ekonomi memang jadi penyebab rendahnya kriminalistas. Namun rendahnya kesejahteraan ekonomi, bukan prediktor tingginya kriminalitas.
Aneka relasi positif semacam ilustrasi di atas, menarik perhatian pengembang ilmu pengetahuan. Salah satunya filsuf terkemuka Perancis, Isidore Auguste Marie François Xavier Comte. Ia lebih dikenal sebagai August Comte. Hidup pada tahun 1798-1857. Penyelidikannya berkembang sebagai Filsafat Positivisme, yang mendasari kelahiran Sosiologi modern.
Menurut Filsafat Positivisme, suatu pernyataan diterima sebagai pengetahuan, jika data dan informasinya bersumber dari pengalaman panca indera. Ini disebut pengalaman empiris. Aneka pengalaman empiris yang dihubungkan secara positif, juga menghasilkan pengetahuan. Pernyataan intuisi, keyakinan, maupun spekulasi yang dihasilkan para filsuf awal, ~kecuali jika disusun dari fenomena yang dapat diamati, diukur dan dibuktikan secara obyektif~ tak diterima sebagai pengetahuan. Karenanya, pernyataan abstrak-metafisis bukan hasil sensasi inderawi, ditolak.
Hari ini saat big data berkembang intensif, kemampuan memperlakukan data turut meningkat. Kriteria volume, velocity, variety, veracity, viability dan value data, dapat diproses dan tuntas dianalisa. Hasilnya, pengetahuan dari keterkaitan-keterkaitan yang semula tak dikenali. Bahkan di antaranya merupakan keterkaitan yang ganjil. Contohnya, kebiasaan menggigit kuku dengan tingginya tingkat kecerdasan. Atau kebiasaan sulit membuang barang bekas, dengan depresi yang dialami seseorang.
Keterkaitan antar informasi itu, bisa jadi akibat belum tersedianya data. Dengan adanya analisa big data, terbuka sumber pengetahuan baru. Namun bisa juga, data hanya mengantarkan pada keterkaitan palsu. Keadaan ini sering jadi fenomena, yang menjangkiti "positivisme digital".
Pada "From Digital Positivism and Administrative Big Data Analytics Towards Critical Digital and Social Media Research!", Christian Fuchs, 2017, menyebutkan positivisme digital, sebagai implikasi mengemukanya analisa big data seiring perkembangan dan pemanfaatan teknologi digital. Paradigma positivisme menempati cara pandang utama, kajian media digital maupun fenomena sosial.
Paradigma ini menyebut, pengetahuan dapat berkembang obyektif dan tanpa bias selama berpijak pada asal-usul data yang diperoleh dari observasi empiris maupun pencarian kebenaran universal. Seluruhnya konsisten dengan Filsafat Positivisme. Positivisme digital merupakan kelanjutan positvisme tradisional, di dunia digital.
Analisa big data berparadigma positivisme, beroperasi mengikuti kaidah statistik dan komputasional dalam memahami realitas. Jeffrey Richman, 2023, dalam "Big Data Analytics: What It Is, How It Works, & Examples" menyebut urut-urutan kerjanya. Umumnya melalui 5 tahap. Dimulai dari pengumpulan data, penyimpanan data, pemrosesan data, analisa data, hingga diperolehnya hasil berupa pola dan keteraturan.
Organisasi mengumpulkan data dari berbagai sumber, seperti media sosial, website, aplikasi maupun perangkat sensor dalam menangkap suatu fenomena. Data disimpan dalam gudang data, untuk dianalisa. Dari analisa ini, fenomena yang semula tampak acak jadi terlihat polanya. Juga keterkaitannya.
Jika dikaitkan dengan tuntutan data yang empiris dan obyektif, analisa big data bersumber data obyektif dari peristiwa yang nyata. Dikumpulkan saat sumber data dalam kesadaran praktis. Data yang diberikan dalam kesadaran praktis, didasari kebiasaan spontan yang alamiah. Misalnya saat mengomentari konten sosial media pengguna lain, perilaku menggunggah ulang konten yang menarik, karya kreatif meme dalam menanggapi suatu kejadian. Juga penentuan pilihan warna produk maupun jenis kuliner, saat berbelanja.
Memberikan data dalam kesadaran praktis, berbeda keadaannya dengan perilaku yang sama dalam kesadaran diskursif. Dalam kesadaran diskurif, sumber data terlebih dahulu berdiskusi dengan dirinya sendiri. Dipertimbangkan konsekuensi atas data yang diberikannya. Jika berakibat baik akan dilanjutkan. Jika sebaliknya, akan diubah sebagai pernyataan lain. Memang seluruhnya merupakan tindakan yang rasional, namun tak merepresentasikan keadaan apa adanya. Ini sering jadi kelemahan pengumpulan data secara tradisonal, lewat survey. Jawaban telah disesuaikan.
Pada pengumpulan untuk analisa big data terpenuhi persyaratan empiris dan obyektif. Analisa dengan cara ini dianggap terbaik, dalam memahami fenomena alamiah maupun sosial. Demikian pula ketika proses analisanya, yang bertumpu pada sistem yang telah diprogram. Pengungkapan realitasnya mengikuti kaidah statistik dan komputasional. Ini memberikan hasil yang terbebas dari tafsir manusia, yang sering mengandung bias. Hasil analisa big data memenuhi tuntutan obyektivitas.
Positivisme digital, tampaknya mampu memberikan alternatif cara memahami realitas alamiah maupun sosial. Juga menghasilkan pengetahuan baru, yang semula bersembunyi di balik keterbatasan data. Keterkaitan antara kebiasaan menggigit kuku dengan kecerdasan seseorang tersingkap oleh data: orang yang cerdas adalah individu pembosan. Kecerdasannya menyebabkan mampu memahami kaitan antar fenomena, dengan cepat. Tanpa permasalahan baru yang menantang kecerdasannya, hanya bosan yang dialami. Menggigit kuku jadi pengalih kebosanan.
Hari ini, saat analisa big data diikuti pengembangan yang berbasis artificial intelligence (AI), apakah ketakterandalan analisa makin terpenuh? Tampaknya muncul tantangan baru. Fuchs melanjutkan dalam tulisannya di atas: positivisme digital bergeser jadi masalah, ketika big data maupun pengukuran digital secara membabi buta diandalkan sebagai satu-satunya sumber kebenaran. Fenomena sosial yang sumber datanya adalah perilaku manusia, diabaikan kompleksitasnya. Demikian pula konteks sosial yang sering luput dari perhatian. Seluruhnya ini diikuti adanya potensi bias data yang memandu pada melesetnya hasil analisa.
Mengandalkan analisa dengan kelemahan-kelemahan di atas, dapat mengantar pada ketersesatan memahami realitas. Tak mustahil pula jadi keputusan yang mengakibatkan diskriminasi sosial maupun kerugian ekonomi. Seluruhnya akibat terabaikannya kompleksitas relasi maupun konteks peristiwa. Membicarakan kriminalitas di Texas misalnya, hampir pasti pelakunya adalah individu berkulit hitam. Ini lantaran Texas adalah negara bagian di Amerika, dengan penduduk berkulit hitam terbanyak.
Demikian pula dengan penderita kanker otak di Indonesia, hampir seluruhnya adalah pemakan nasi. Ini karena sebagian besar penduduk Indonesia adalah pemakan nasi. Namun ketika diajukan pertanyaan lebih lanjut: mengapa orang kulit hitam sering jadi pelaku utama kriminalitas?" juga "apakah nasi jadi penyebab kanker otak?" Mengacu pada data, jawabannya jadi ganjil.
Konteks pengumpulan data, proses pembentukan keterkaitannya yang kompleks--seluruhnya merupakan aspek non data--tak dapat diabaikan dalam pembentukan pengetahuan. Di baliknya, ada realitas yang tak dikenali. Dalam keadaan tak sepenuhnya mengenali, memaksakan keterkaitannya akibat frekuensi statistiknya yang tinggi, hanya menghasilkan pengetahuan yang seolah-olah empiris dan obyektif.
Cristian S. Calude dan Giuseppe Longo, 2016 dalam 'The Deluge of Spurious Correlations in Big Data', menyebut fenomena di atas sebagai 'korelasi palsu'. Keadaan yang juga dikenal sebagai spurious correlation. Terjadinya oleh keterkaitan yang ditunjukkan skor statistik antara dua informasi berfrekuensi tinggi, pada big data. Sesungguhnya, hubungan antara keduanya tak ada. Korelasi palsu, juga bisa muncul akibat faktor tersembunyi atau bias. Keterkaitan yang menyesatkan ini bukan hubungan sebab akibat yang alamiah.
Maka dalam keterbatasan ini, bukankah wajar jika harus kritis menggunakan big data, bahkan yang dipercanggih AI? Realitas kompleks yang tersingkap oleh data besar pun, ternyata bisa palsu.
Firman Kurniawan S. Pemerhati Budaya dan Komunikasi Digital. Pendiri LITEROS.org.
(rdp/rdp)