Utama

Menguji kebenaran sebuah pernyataan di era data raksasa

Contoh #1: Pernyataan obat herbal

Klaim kesembuhan dengan obat herbal tidak jarang mengandung kesesatan fakta. Saya akan jelaskan secara rinci untuk contoh pertama ini. Sekarang kita coba menerapkan tiga prinsip yang telah kita pelajari. Misal, terdapat pernyataan berikut:

“Konsumsi timun menyembuhkan sakit COVID-19.”

Apriorism:

  1. Akui ketidaktahuan/keterbatasan: Saya tidak pernah dengar informasi ini sebelumnya.
  2. Cari tahu informasi yang ada: Saya hanya tahu bahwa timun diyakini dapat menurunkan darah tinggi.
  3. Buat dugaan sementara: Saya menduga konsumsi timun menyembuhkan sakit COVID-19.
  4. Perkirakan atau cari tahu peluang kejadian: Dari semua yang sakit COVID-19, 80% diantaranya sembuh (prior probability).

Bayesianism:

  1. Ya dan Ya: Adakah orang konsumsi timun dan sembuh COVID-19?
  2. Ya dan Tidak: Adakah orang konsumsi timun dan tidak sembuh COVID-19?
  3. Tidak dan Ya: Adakah orang tidak konsumsi timun dan sembuh COVID-19?
  4. Tidak dan Tidak: Adakah orang tidak konsumsi timun dan tidak sembuh COVID-19?

Contingency:

  1. Ya dan Ya: Berapa besar peluang sembuh COVID-19 jika konsumsi timun (posterior probability)?
  2. Tidak dan Ya: Berapa besar peluang sembuh COVID019 jika tidak konsumsi timun (posterior probability)?
  3. Bandingkan: Mana yang peluang lebih besar di antara keduanya?

Pernyataan seperti ini sering disesatkan dengan data, misal, 72% penderita COVID-19 yang konsumsi timun mengalami kesembuhan. Hal ini sudah diuji coba pada 50 orang yang konsumsi dan 50 orang yang tidak konsumsi timun. Kita seringkali asal membenarkan hanya karena terdapat angka. Seolah setiap angka adalah fakta, dan setiap fakta adalah kebenaran.

Mari kita gunakan prinsip ABC dalam perhitungan nyata. Pertama, kita buat tabel antara konsumsi timun dan sembuh COVID-19.

Semua akibat kita simbolkan A, dalam hal ini adalah sembuh COVID-19.
Semua sebab kita simbolkan B, dalam hal ini adalah konsumsi timun.

Pada prinsip apriorism, kita sudah tahu bahwa 80% pasien COVID-19 itu sembuh. Sekarang, kita lengkapi tabel dengan prinsip Bayesianism. Jika 72% sembuh dari 50 orang, maka kita bisa mengisinya seperti ini.

Jika 72% dari 50 adalah 36 (Ya dan Ya),
maka sisanya 14 orang (Ya dan Tidak).
Jika dianggap 80% dari 100 orang yang sakit COVID-19,
maka kita bisa hitung 80-36=44 (Tidak dan Ya) serta 20-14=6 (Tidak dan Tidak).

Pada prinsip contingency, kita perlu menghitung kemungkinan atau peluang (P) konsumsi timun (A+) dari total yang sembuh COVID-19 (B+) . Kita bisa simbolkan dan hitung sebagai berikut:

P(B+|A+) = 36 timun ÷ 80 sembuh = 0.45

Artinya, 45% dari yang sembuh COVID-19 (A+) termasuk kelompok yang konsumsi timun (B+).

Untuk menghitung, kita juga perlu menghitung peluang konsumsi timun dari total yang tidak sembuh COVID-19:

P(B+|A-) = 14 timun ÷ 20 tidak sembuh = 0.7

Artinya, 70% dari yang tidak sembuh COVID-19 termasuk kelompok yang konsumsi timun.

Kita perlu menyesuaikan peluang masing-masing di atas dengan peluang sembuh dan tidak sembuh COVID-19 , atau prior probability, yaitu 80% sembuh dan 20% tidak sembuh. Maka, dapat dihitung masing-masing sebagai berikut:

P1 = P(B+|A+) × P(A+) = 0.45 × 0.8 = 0.36

P2 = P(B+|A-) × P(A-) = 0.7 × 0.2 = 0.14

Pertanyaan pertama adalah kebalikan dari P(B+|A+), yaitu berapa peluang sembuh COVID-19 jika konsumsi timun (Ya dan Ya):

P(A+|B+)

Cara menghitungnya adalah dengan menggunakan peluang-peluang yang sudah disesuaikan di atas:

P(A+|B+) = P1 ÷ ( P1 + P2 ) = 0.36 ÷ ( 0.36 + 0.14 ) = 0.72

Artinya, 72% yang konsumsi timun mengalami sembuh COVID-19, sebagaimana telah diklaim di atas.

Namun, kita perlu membandingkan dengan jawaban dari pertanyaan kedua, berapa peluang sembuh COVID-19 jika tidak konsumsi timun (Tidak dan Ya). Maka, kita perlu mengulang proses di atas untuk B- sebagai berikut:

P(B-|A+) = 44 tidak timun ÷ 80 sembuh = 0.55

P(B-|A-) = 6 tidak timun ÷ 20 tidak sembuh = 0.3

P1 = P(B-|A+) × P(A+) = 0.55 × 0.8 = 0.44

P2 = P(B-|A-) × P(A-) = 0.3 × 0.2 = 0.06

P(A+|B-) = P1 ÷ ( P1 + P2 ) = 0.44 ÷ ( 0.44 + 0.06 ) = 0.88

Sekarang, kita bandingkan:

  1. 72% yang konsumsi timun mengalami sembuh COVID-19 (Ya dan Ya) atau P(A+|B+)
  2. 88% yang tidak konsumsi timun mengalami sembuh COVID-19 (Tidak dan Ya) atau P(A+|B-)

Dengan demikian, kita tidak menerima dugaan “konsumsi timun menyembuhkan sakit COVID-19“.

Tentu, dalam penelitian, masih ada uji statistik untuk menilai seberapa bermakna perbedaan 72% dan 88%. Jika bermakna, artinya Anda tidak disarankan konsumsi timun jika sakit COVID-19. Jika tidak bermakna, artinya konsumsi ataupun tidak konsumsi timun sama saja efeknya terhadap sakit COVID-19. Ketiga prinsip dan perhitungannya ini adalah penyederhanaan dari metode ilmiah saja.

Silakan lanjut ke halaman berikutnya.