Utama

3 Alasan Kenapa Semua Orang Perlu Belajar R

Gambar lebih mudah dibanding angka, apalagi dibanding uji statistik

Jika Anda pikir, belajar R itu karena uji statistik, itu sangatlah absurd (artinya tidak masuk akal). Tanpa ketik kode ini itu, klik-klik saja sudah cukup untuk uji statistik dengan software bajakan #eh

Kekuatan R itu ada pada kemampuan visualisasi angka. Khususnya, kalau pakai RStudio dan ggplot2. (Apa pula ini?)

R itu bahasa pemrograman, ibaratnya seperti program pengolah teks. RStudio itu software untuk R, ibaratnya seperti Microsoft Word atau merek lain seperti Google Docs, dll. Sedangkan ggplot2 itu ibarat fitur untuk membuat grafik di dalam software tadi. Bedanya, fitur ini tidak aktif dari awal, tetapi Anda yang memutuskan untuk mengaktifkannya atau tidak.

Hari ini saya tidak akan bicara teknis. Cukup kita tahu terlebih dahulu kenapa harus belajar R, meskipun bukan statistikawan ataupun orang komputer.

Sekarang kita buat contoh. Dengan data yang pernah saya bagikan di artikel sebelumnya Kecerdasan Buatan (Artificial Intelligence) untuk Pelayanan Kesehatan.

Silakan unduh file contoh training set di bawah:
tanja_premru_srsen_2018_doi_10.17632_zsjhvy9ytx.1.csv

Apa yang bisa Anda lihat dari deretan angka itu? Susah kan?

Satu kotak sama dengan satu kolom, kecuali kolom outcome.
Garis merah milik outcome=0, sedangkan biru (cyan) milik outcome=1.

Sekarang apa yang bisa Anda lihat dari deretan gambar itu? Mana yang gunungnya memisah?

Saat Anda melihat deretan angka, ada jumlah maksimal baris yang bisa ‘dirangkul’ oleh luas pandang mata Anda. Namun, tidak peduli seberapa banyak data, bisa digambar dan ‘dirangkul’ oleh luas pandang mata Anda.

Inilah kekuatan visualisasi.

Satu kotak adalah data dari satu subjek. Sebelah kanan Anda adalah 4 subjek dengan outcome=1, sedangkan sebelah kiri Anda adalah 4 subjek dengan outcome=0. Warna dari hitam sampai biru itu menunjukkan angka terendah sampai tertinggi. Setiap kata adalah data dari satu kolom.

Apa lagi yang bisa Anda lihat dari gambar di atas? Apa pola yang Anda lihat? Mana saja predictor yang berwarna sama dengan outcome di kelompoknya tetapi tidak sama dengan predictor itu di kelompok lain.

Apakah Anda pernah melihat jenis-jenis grafik seperti ini?

Inilah kekuaran visualisasi R, yaitu kustomisasi.

Dengan demikian, Anda bisa menggambar beberapa jenis grafik hingga menemukan pola yang tepat.

Tentu saja, Anda tidak bisa menggantikan uji statistik hanya berdasarkan gambar. Namun, dengan cara ini, kemungkinan mendapatkan hal baru dari data Anda akan jauh lebih banyak.

Namun, dibandingkan dengan 2 alasan yang sudah dijelaskan, alasan terakhir ini justru paling penting untuk mengolah setiap data.

Silakan lanjut ke halaman berikutnya.