Review makalah: Automatic Rule Generator via FP-Growth for Eye Diseases Diagnosis

Judul

Automatic Rule Generator via FP-Growth for Eye Diseases Diagnosis

ISSN

2088-5334

Jurnal

International Journal on Advanced Science, Engineering and Information Technology

Volume & Halaman

Vol.9 No. 3

Tahun

2019

Penulis

Rahmad Kurniawan, Mohd Zakree Ahmad Nazri, Siti Norul Huda Sheikh Abdullah, Jemaima Che Hamzah, Rado Yendr , Westi Oktaviana

Reviewer

Tengku Syaid Rian Fadhilah

NIM

11751101351

Kelas

Data mining G


 
Tujuan Penelitian

Perkembangan sistem pakar berbasis aturan atau rule-based terus berkembang. Namun sebuah study membuktikan bahwa rules-based memiliki sebuah penghalan dalam proses pengembangan sistem pakar, halangan tersebut adalah pada saat akusisi pengetahuan. Membuat kesalahan saat mengambil pengetahuan dari berbagai sumber mungkin akan menyebabkan tidak akuratnya keputusan yang dibuat dan membuat sistem pakar tidak efektif. Kesalahan juga dapat terjadi dikarenakan konflik kepentingan dan waktu yang terbuang saat melakukan wawancara dengan seorang pakar.

Ada dua orang terpenting dalam proses pengambilan pengetahuan yaitu programmer dan pakar. Dengan skill set yang tepat, seorang programmer bisa mendapatkan informasi dan pengetahuan dari para pakar selama sesi wawancara. Programer juga harus terlatih dengan baik menentukan kualitas dan efektivitas seorang ahli. Meskipun terdapat bentuk standar dari proses pengambilan pengetahuan seperti wawancara. Namun hal tersebut tergantung pada transfer manual pengetahuan dari pakar dengan programmer. Oleh karena itu, pencapaian perolehan pengetahuan sangat tergantung dengan kemampuan programmer untuk mendapatkan informasi. Selanjutnya kurangnya komunikasi dan sedikit persiapan antara programmer dan ahli juga membuat pengetahuan kurang memadai dan tidak jelas selama proses akusisi. Terkadang, banyak istilah dari pakar tertentu yang dapat menimbulkan kendala dalam memahami dan berkomentar langsung. Terlepas dari istilah yang membingungkan. Dibeberapa kasus pakar tidak familiar dengan teknologi dan menolak untuk ikut ambil bagian dari pengembangan sistem pakar, dan terkadang mereka menolak menerapkan sistem pendukung untuk pemecahan masalah yang rumit maupu tidak. Apalagi ahli tertentu kadang berpikir bahwa sistem pakar dapat melemahkan peran dan pekerjaan mereka menjadi tidak lagi berguna, sehingga pengambilan pengetahuan menjadi tidak mungkin dilakukan.

         Pendekatan konvensional dalam mengembangkan sistem pakar berbasis aturan biasanya berlaku membosankan, panjang dan mahal dalam proses akusisi pengetahuannya.  Dimana,Akuisisi pengetahuan dengan cara manual biasanya dapat menyebabkan kesalahan dalam pengambilan keputusan dan fungsi tidak efektif saat merancang sebuah sistem pakar. Tujuan dari penelitian ini adalah untuk meningkatkan akuisisi tingkat pengetahuan menggunakan teknik data mining. Makalah ini menyelidiki efektivitas pengambilan teknik aturan asosiasi dalam menghasilkan aturan baru untuk sistem pakar. pada makalah ini menggunakan FP-Growth untuk memperoleh aturan-aturan dari catatan diagnosis penyakit mata yang dikumpulkan dari rumah sakit Sumatra aye center (SMEC) di pekanbaru. Saat ini FP-Growth merupakan salah satu algoritma tercepat diantara aturan asosiasi. FP-Growth adalah salah satu metode alternatif untuk menentukan item data yang paling sering muncul dalam data set.

Metode penelitian

    Pada makalah ini menggunakan data dari rekam medis di rumah sakit sumatera aye center (SMEC) pekanbaru. Dengan data rekam medis tahun 2016 yang mengandung 1.600 pasien dengan enam atribuat  (No MedicalCatat, Tanggal, Jenis Kelamin, Umur, Gejala, dan Diagnosis). Pada makalah ini mengambil review pakar atau opini pakar dan juga eksperimen ekstensif sesuai dengan metodologi standar penelitian dari prosedur.

    Pada Gambar dibawah  mengilustrasikan siklus proses akuisisi pengetahuan, dimulai dengan membuat aturan berdasarkan FP Algoritma aturan asosiasi pertumbuhan maka tahap terakhir adalah membandingkan hasil keputusan ahli dan rules penyakit mata yang telah divalidasi. peneliti melakukan prosedur analisis untuk memvalidasi aturan penyakit sebagai berikut:


Ada empat langkah untuk merancang percobaan menggunakan algoritma FP-Growth:

1.    Seleksi

Pada makalah ini data rekam medis di rumah sakit tersebut disimpan dalam bentuk manual. Kemudian, penyakit mata manual tersebut di digitalkan menggunakan data processing tools. Untuk data nomor rekam medik, nama dan tanggal akan diseleksi dan jenis kelamin, usia, gejala dan diagnosis penyakit akan diambil untuk menemukan hubungan antara usia, jenis kelamin, gejala dan penyakit.

2.     Pre-processing

Langkah selanjutnya adalah data pre-processing dimana peneliti menghilangkan noise atau membersihkan data yang hilang, tidak konsistem ataupun outliers. Proses ekstrasi data cukup menantang dikarenakan atribut kadang tidak relevan, berlebihan, memiliki noise, tidak dapat diandalkan dan ketidaksesuaian metode untuk mendapatkan pola tak teridentifikasi dari data yang mana dapat mempengaruhi hasil yang tidak akurat. Pada makalah ini menggunakan beberapa teknik dalam menghadapi missing value. Seperti, mengganti missing value dengan mean value dan menghapus kolom yang memiliki lebih dari dua missing value. Untuk data usia, peneliti menggunakan teknik bernama missing completely at random (MCAR).

3.     Transformasi Dara

Tahap selanjutnya adalah transformasi data dengan mengubah dan menyimpan data penyakit mata ke dalam format khusus, yaitu format file relasi-atribut. Pada tahap ini, kita menginisialisasi atribut dan memodifikasi tipe datanya, seperti konversi tipe data numerik menjadi binominal.

4.     Contoh menghasilan aturan menggunakan FP-Growth

Disini penuli mengilustraskan dalam 20 kasus data sempel rekam medis penyakit mata untuk mengetahui hubungan antara usia, jenis kelamin, gejala dan jenis penyakit mata.


            Dalam sampel ini, peneliti mengasumsikan bahwa support count ≥ 10%.Nilai support count ini mempengaruhi konstruksi pohon FP. Support count 10% sebagai ambang batas untuk memfilter set item,yaitu hanya set item yang memiliki jumlah dukungan yang sama, atau lebih dari 10% yang akan muncul. peneliti menggambarkan pola pencarian proses seperti yang ditunjukkan pada Tabel III. Kita dapat mengamati bahwa item U3,U6, U2, G9, G12, P2 dan U4 belum muncul di tabel.Item terbaik berdasarkan program dukungan minimum berfungsi sebagai berikut:



    Langkah selanjutnya adalah memindai data dan mengatur ulang data minimum support. Confidence dan support value untuk mengukur aturan terbaik. Data yang tidak memenuhi minimum support dan tidak mengandung antecedent akan dihapus dari transaksi. Atribut yang menjadi anteseden adalah usia, jenis kelamin, gejala ,sedangkan konsekuensinya adalah penyakit .

    Langkah selanjutnya adalah konstruksi FP-Tree berdasarkan scan transaksi Berdasarkan data sampel yang diberikan, P1,P2, P3, P4, P5, P6, P7, P8 dan P9 adalah konsekuensinya, tetapi hanya P3 dan P4 yang memenuhi minimum support. Langkah selanjutnya adalah untuk mendapatkan set item yang sering dengan conditional pattern base kemudian membuat aturan dengan menghitung confidence setiap kombinasi aturan. Konstruksi FP-Tree berfungsi sebagai berikut:

    Setelah aturan didapat dari frequent itemset, maka langkah selanjutnya adalah mengevaluasi aturan asosiasi yang kuat yang diperoleh dengan menggunakan rasio angkat. Rasio angkat adalah rasio antara confidence suatu aturan dan nilai keyakinan tolok ukur.Keyakinan, Benchmark adalah perbandingan antara jumlah konsekuensi dengan total transaksi. Kita pertimbangkan rasio peningkatan lebih dari 1 menunjukkan sebagai aturan yang memungkinkan. 

Hasil

    Implementasinya dilakukan dengan minimum support dan parameter minimum confidence. Minimum support digunakan dalam 3%, 10% dan 20% sedangkan untuk minimum confidence digunakan dalam 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% dan 100%. Minimum support dan minimum confidence mempengaruhi aturan yang dihasilkan. peneliti memulai dengan nilai tinggi dalam minimum support dan confidence, dan kemudian peneliti mengurangi nilai-nilai sampai menemukan nilai yang menghasilkan pola yang cukup. Dengan nilai minimum support dan confidence semakin tinggi maka aturan yang didapat akan semakin sedikit seperti pada table dibawah:

 

    Dari tes yang dilakukan, Peneliti berhasil menggunakan algoritma FP-Growth sebagai produsen aturan dengan akurasi yang baik dengan 88%. Dan berdasarkan hasil penelitian didapat konjungtivitas dan penyakit presbyopia merupakan penyakit yang paling dominan diderita dengan 225 dan 167 kasus. Dengan laki-laki atau perempuan dengan umur 31-59 tahun sangat dominan menderita conjunctivitis dan presbyopia.





Komentar