Machine LearningUtama

Hanya Punya Data Diagnosis Penyakit? Begini Cara Menggali Data Klinik Anda (Data Mining)

Kenali dan sederhanakan tabel untuk eksplorasi

Saya akan mengambil contoh data dari BPJS Kesehatan tersebut. Secara umum, banyak data di faskes juga seperti ini. Bedanya, data BPJS Kesehatan mencakup lebih dari 1 jenis faskes.

Dalam dataset BPJS Kesehatan, terdapat 4 tabel:

  1. Tabel identitas pasien. Satu baris sama dengan satu pasien. Satu kolom sama dengan satu jenis data. Misal, ada tabel 100 × 10 (baris × kolom). Hal ini berarti ada 100 pasien dengan 10 jenis data seperti nomer ID pasien, tanggal lahir, jenis kelamin, kelas, kota, provinsi, dst.
  2. Tabel kunjungan berbasis kapitasi.
  3. Tabel kunjungan berbasis non kapitasi.
  4. Tabel kunjungan berbasis InaCBGs.

Apapun nama ketiga tabel terakhir, itu tidak penting. Ketiga tabel itu punya kemiripan. Satu baris sama dengan satu kunjungan pasien. Satu kolom sama dengan satu jenis data seperti nomer ID pasien, tanggal kunjungan, diagnosis (misal, dalam kode ICD10), dst.

Tentu, tidak semua pasien di tabel identitas memiliki baris di tabel kunjungan. Hal ini karena tidak semua pasien pernah sakit. Mungkin mereka sudah mendaftar BPJS Kesehatan, tetapi belum perlu menggunakannya.

Mari sekarang kita sederhanakan lagi:

  • Fokus hanya ada 3 kolom di tabel identitas, yaitu nomer ID, tanggal lahir, dan jenis kelamin. Dalam tabel ini, satu nomer ID hanya memiliki 1 baris dan tidak ada nomer ID yang ganda.
  • Fokus hanya ada 3 kolom di tabel kunjungan, yaitu nomer ID, tanggal kunjungan, dan kode diagnosis ICD-10. Dalam tabel ini, satu nomer ID dapat memiliki >1 baris dan tentu ada banyak nomer ID yang ganda, atau tidak ada, karena pasien mungkin pernah beberapa kali, atau tidak pernah berkunjung ke klinik/rumah sakit.

Sekarang Anda hanya fokus 2 jenis tabel. Pertama adalah tabel b x 3 dan kedua adalah tabel b x 3 dimana keduanya memiliki kesamaan pada satu kolom, yaitu nomer ID, yang akan menjadi ‘pengikat’ kedua tabel.

Kode diagnosis ICD-10 dan tanggal kunjungan adalah kekuatan utama data seperti ini. Jika Anda tahu menggali data dengan bentuk ini, Anda hampir dapat melakukan apapun.

Sebelum lanjut ke langkah berikutnya, coba urutkan tanggal kunjungan mulai dari terlama hingga terbaru. Berapa lama periode rekam data yang Anda miliki? Hal ini akan diperlukan karena penyakit dapat berupa akut (berproses dalam jangka pendek) ataupun kronis (berproses dalam jangka panjang).

Silakan lanjut ke halaman berikutnya.