Utama

Menguji kebenaran sebuah pernyataan di era data raksasa

Contoh #2: Pernyataan situasi

Dalam banyak pernyataan yang kita temui sehari-hari, tidak banyak kesempatan kita untuk mendapatkan data. Meskipun tersedia di internet, tentu kita tidak selalu bisa mengumpulkan dan mengolahnya seperti di atas. Untuk itu, dalam contoh kedua, kita akan coba pendekatan umum saja. Kita akan gunakan contoh situasi politik. Hal ini karena sekarang terdapat fenomena di banyak negara dimana pikiran orang disesatkan demi kepentingan kubu politik masing-masing.

“Partai ungu berisi orang-orang yang menyudutkan agama kita.”

Apriorism:

  1. Akui ketidaktahuan/keterbatasan: Saya hanya tahu partai ungu itu dipimpin oleh X dan setahu saya X beragama sama dengan kita. Saya hanya tahu kejadian itu yang dijadikan alasan kenapa partai ungu dituduh demikian.
  2. Cari tahu informasi yang ada: Saya mencoba kata kunci ‘partai ungu’ dan ‘agama kita’ di Google. Saya berusaha mencari jumlah artikel yang membenarkan dan menyalahkan tuduhan itu, misal masing-masing 10 artikel. Saya juga mencari siapa saja tokoh partai ungu dalam artikel-artikel itu. Lalu, sekilas memasukkan nama-nama mereka di Google untuk mencari tahu siapa saja mereka. Apakah persamaan dan perbedaan tindakan mereka selama 5-10 tahun terakhir? Saya juga mencari kejadian agama kita disudutkan dan didukung, tanpa memandang partai ungu.
  3. Buat dugaan sementara: Saya menduga partai ungu berisi orang-orang yang menyudutkan agama kita.
  4. Perkirakan atau cari tahu peluang kejadian: Dari beberapa artikel, berapa saja contoh kejadian agama kita disudutkan dan berapa saja contoh agama kita didukung, tanpa memandang partai ungu (prior probability).

Bayesianism:

  1. Ya dan Ya: Adakah orang partai ungu dan menyudutkan agama kita?
  2. Ya dan Tidak: Adakah orang partai ungu dan mendukung agama kita?
  3. Tidak dan Ya: Adakah orang bukan partai ungu dan menyudutkan agama kita?
  4. Tidak dan Tidak: Adakah orang bukan partai ungu dan mendukung agama kita?

Contingency:

  1. Ya dan Ya: Berapa besar peluang kejadian yang menyudutkan agama kita juga melibatkan orang partai ungu (posterior probability)?
  2. Tidak dan Ya: Berapa besar peluang kejadian yang menyudutkan agama kita tetapi tidak melibatkan orang partai ungu (posterior probability)?
  3. Bandingkan: Mana yang peluang lebih besar di antara keduanya?

Tentu, tidak ada perhitungan matematika disini. Saya sengaja tidak melakukannya karena sulit untuk mengambil data yang mewakili kesimpulan umum. Namun, khususnya pada prinsip contingency, Anda harus memahami bahwa tidak ada manapun dari 4 kemungkinan Bayesian di atas yang 100% terjadi. Dalam contoh ini, tahap apriorism sangat vital. Itulah sebabnya saya lebih mendorong Anda menggunakan mesin pencari seperti Google, daripada ‘pasrah’ menelan semua informasi di timeline atau tren di medsos Anda. Algoritma untuk timeline itu dirancang untuk membuat Anda betah berlama-lama di medsos. Dengan kata lain, cenderung memberikan yang Anda sukai. Oleh karena itu, akan cenderung bias (tidak sesuai dengan fakta sebenarnya).

Dalam apriorism di atas, ada bagian dimana Anda mencari tahu konsistensi kejadian dari orang yang sama dalam kurun waktu yang cukup lama. Ini merupakan prinsip yang saya sederhanakan dari Hidden Markov Chain model, sebuah algoritma komputer untuk menemukan data tersembunyi dari data yang tersedia (berupa data yang melibatkan waktu). Namun, tentu saja dalam situasi dalam contoh ini, perlu punya kemampuan ekstraksi data massif dari internet untuk dapat menelaah nya dengan bias yang rendah. Tentu, tidak semua orang bisa begitu sehingga kita hanya perlu melakukan telaah secara umum.

Silakan lanjut ke halaman berikutnya.