Machine LearningUtama

Hanya Punya Data Diagnosis Penyakit? Begini Cara Menggali Data Klinik Anda (Data Mining)

Tanpa kita sadari, banyak data yang sudah tersedia tetapi tidak kita manfaatkan untuk membantu pekerjaan kita. Jika Anda bekerja di bidang pelayanan kesehatan, data ini sesungguhnya dapat membantu Anda mengurangi pekerjaan. Masalahnya? Kebanyakan data, termasuk di Indonesia, itu tidak terstruktur. Lebih tepatnya lagi: tidak diketik rapi dan tersimpan dalam komputer. Masih banyak tulisan tangan.

Dalam artikel ini, saya pada akhirnya akan mengarahkan Anda untuk membuat data yang akan digunakan untuk membuat prediksi penyakit (baca juga: Cara Membuat Prediksi Penyakit dengan Benar)

Namun, di era BPJS Kesehatan, setiap fasilitas kesehatan (faskes), baik klinik, rumah sakit, ataupun praktik pribadi, paling tidak memiliki dua data ini tersimpan komputernya, yaitu buku/ daftar/ register/ tabel berisi:

  • Identitas pasien: nomer rekam medik, tahun lahir, jenis kelamin, dll
  • Kunjungan pasien: tanggal, diagnosis (bahkan kode ICD-10), dll

Banyak data seperti ini, tapi mau diapakan? Kebanyakan orang mengharapkan data laboratorium, anamnesis, dan pemeriksaan fisik (yang sudah diketik rapi), dan sebagainya. Namun, kemungkinan besar kita sulit mendapatkannya. Selain itu, siapa yang rajin membongkar data rekam medik secara manual? Kalaupun bisa, sanggup banyak atau tidak (misal, 1000 sampel)?

Perlu Anda ketahui pula, data seperti ini sudah disediakan oleh BPJS Kesehatan. Isinya sekitar >1.6 juta baris data. Namun, karena isinya hanya diagnosis dan biaya klaim, masih banyak yang bingung cara menggali data seperti ini. Kalau Anda ingin mendapatkan data BPJS Kesehatan ini, silakan kunjungi:

Saya tidak bisa memandu Anda mendapatkan data tersebut saat ini (selain itu, bisa saja aturan berubah-ubah setiap saat). Silakan belajar berurusan mengambil data. 😀

Mungkin Anda berpikir, apa data sesederhana ini dapat diterima secara ilmiah? Apa mungkin bisa digunakan sampai terbit dalam publikasi ilmiah? Kalau tidak percaya, pecahkan mitos yang Anda yakini dengan membaca artikel ilmiah berikut:

https://www.sciencedirect.com/science/article/pii/S2352396420300852

Sekarang, mari kita pelajari bersama bagaimana menggali data yang hanya terdiri atas informasi diagnosis saja. Proses gali data (data mining) ini kita bagi menjadi beberapa langkah berikut:

  1. Kenali dan sederhanakan tabel untuk eksplorasi
  2. Tentukan outcome dan predictor
  3. Tentukan target populasi, kriteria seleksi, dan desain data
  4. Nilai kecukupan besar sampel
  5. Ekstraksi predictor (feature extraction/ predictor extraction) >> materi paling penting

Silakan lanjut ke halaman berikutnya.