Machine LearningUtama

Hanya Punya Data Diagnosis Penyakit? Begini Cara Menggali Data Klinik Anda (Data Mining)

Ekstraksi predictor (feature extraction/ predictor extraction)

Selanjutnya, untuk ekstraksi predictor, tentukan terlebih dahulu rentang waktunya. Tentukan tanggal diagnosis setiap subjek. Jika predictor harus berada pada waktu tertentu, misal selama hamil, maka tentukan tanggal lahir setiap subjek, karena kita tidak ingin predictor pada ibu yang terjadi setelah lahir ikut terhitung. Misal, predictor yang dipilih adalah riwayat penyakit infeksi pada ibu. Kita tidak ingin infeksi paru yang baru terdiagnosis setelah lahir ikut teridentifikasi.

Kita juga mungkin berpikir semua riwayat sebelum hamil tidak ada hubungannya. Maka, kita tentukan awal kehamilan, misalkan dengan menggunakan kode periksa kehamilan berupa Z33 s.d. Z37 dan semua kode berawalan O. Tentukan tanggal paling awal antara kode-kode tersebut pada setiap ibu dari subjek. Sekarang kita mendapatkan tanggal paling awal kode periksa kehamilan hingga tanggal lahir subjek.

Selanjutnya, kita cari kode predictor dalam rentang kedua tanggal. Jika ada, maka predictor positif. Sebaliknya, maka predictor negatif. Kita lakukan hal ini pada setiap predictor.

Ada banyak cara untuk melakukan variasi ekstraksi. Hal ini akan berkembang seiring bertambahnya pengalaman Anda mengolah data.

Dengan demikian, Anda telah memiliki data yang lengkap, terdiri atas beberapa kolom predictor berupa positif atau negatif, dan satu kolom outcome berupa positif dan negatif.

Silakan lanjut ke halaman berikutnya.