Review makalah: Automatic Rule Generator via FP-Growth for Eye Diseases Diagnosis
|
Judul |
Automatic
Rule Generator via FP-Growth for Eye Diseases Diagnosis |
|
ISSN |
2088-5334 |
|
Jurnal |
International
Journal on Advanced Science, Engineering and Information Technology |
|
Volume
& Halaman |
Vol.9
No. 3 |
|
Tahun |
2019 |
|
Penulis |
Rahmad
Kurniawan, Mohd Zakree Ahmad Nazri, Siti Norul Huda Sheikh Abdullah, Jemaima
Che Hamzah, Rado Yendr , Westi Oktaviana |
|
Reviewer |
Tengku
Syaid Rian Fadhilah |
|
NIM |
11751101351 |
|
Kelas |
Data
mining G |
Perkembangan
sistem pakar berbasis aturan atau rule-based terus berkembang. Namun sebuah
study membuktikan bahwa rules-based memiliki sebuah penghalan dalam proses
pengembangan sistem pakar, halangan tersebut adalah pada saat akusisi
pengetahuan. Membuat kesalahan saat mengambil pengetahuan dari berbagai sumber
mungkin akan menyebabkan tidak akuratnya keputusan yang dibuat dan membuat
sistem pakar tidak efektif. Kesalahan juga dapat terjadi dikarenakan konflik
kepentingan dan waktu yang terbuang saat melakukan wawancara dengan seorang
pakar.
Ada
dua orang terpenting dalam proses pengambilan pengetahuan yaitu programmer dan
pakar. Dengan skill set yang tepat, seorang programmer bisa mendapatkan
informasi dan pengetahuan dari para pakar selama sesi wawancara. Programer juga harus terlatih dengan baik menentukan kualitas dan efektivitas seorang
ahli. Meskipun terdapat bentuk standar dari proses pengambilan pengetahuan
seperti wawancara. Namun hal tersebut tergantung pada transfer manual
pengetahuan dari pakar dengan programmer. Oleh karena itu, pencapaian perolehan
pengetahuan sangat tergantung dengan kemampuan programmer untuk mendapatkan
informasi. Selanjutnya kurangnya komunikasi dan sedikit persiapan antara
programmer dan ahli juga membuat pengetahuan kurang memadai dan tidak jelas
selama proses akusisi. Terkadang, banyak istilah dari pakar tertentu yang dapat
menimbulkan kendala dalam memahami dan berkomentar langsung. Terlepas dari
istilah yang membingungkan. Dibeberapa kasus pakar tidak familiar dengan
teknologi dan menolak untuk ikut ambil bagian dari pengembangan sistem pakar,
dan terkadang mereka menolak menerapkan sistem pendukung untuk pemecahan
masalah yang rumit maupu tidak. Apalagi ahli tertentu kadang berpikir bahwa
sistem pakar dapat melemahkan peran dan pekerjaan mereka menjadi tidak lagi
berguna, sehingga pengambilan pengetahuan menjadi tidak mungkin dilakukan.
Pendekatan konvensional
dalam mengembangkan sistem pakar berbasis aturan biasanya berlaku membosankan,
panjang dan mahal dalam proses akusisi pengetahuannya. Dimana,Akuisisi pengetahuan dengan cara
manual biasanya dapat menyebabkan kesalahan dalam pengambilan keputusan dan
fungsi tidak efektif saat merancang sebuah sistem pakar. Tujuan dari penelitian
ini adalah untuk meningkatkan akuisisi tingkat pengetahuan menggunakan teknik
data mining. Makalah ini menyelidiki efektivitas pengambilan teknik aturan
asosiasi dalam menghasilkan aturan baru untuk sistem pakar. pada makalah ini
menggunakan FP-Growth untuk memperoleh aturan-aturan dari catatan diagnosis
penyakit mata yang dikumpulkan dari rumah sakit Sumatra aye center (SMEC) di pekanbaru.
Saat ini FP-Growth merupakan salah satu algoritma tercepat diantara aturan
asosiasi. FP-Growth adalah salah satu metode alternatif untuk menentukan item
data yang paling sering muncul dalam data set.
Metode
penelitian
Pada makalah ini menggunakan data dari rekam medis di rumah sakit sumatera aye center (SMEC) pekanbaru. Dengan data rekam medis tahun 2016 yang mengandung 1.600 pasien dengan enam atribuat (No MedicalCatat, Tanggal, Jenis Kelamin, Umur, Gejala, dan Diagnosis). Pada makalah ini mengambil review pakar atau opini pakar dan juga eksperimen ekstensif sesuai dengan metodologi standar penelitian dari prosedur.
Pada
Gambar dibawah mengilustrasikan siklus proses
akuisisi pengetahuan, dimulai dengan membuat aturan berdasarkan FP Algoritma
aturan asosiasi pertumbuhan maka tahap terakhir adalah membandingkan hasil
keputusan ahli dan rules penyakit mata yang telah divalidasi. peneliti
melakukan prosedur analisis untuk memvalidasi aturan penyakit sebagai berikut:
Ada
empat langkah untuk merancang percobaan menggunakan algoritma FP-Growth:
1. Seleksi
Pada
makalah ini data rekam medis di rumah sakit tersebut disimpan dalam bentuk
manual. Kemudian, penyakit mata manual tersebut di digitalkan menggunakan data
processing tools. Untuk data nomor rekam medik, nama dan tanggal akan diseleksi
dan jenis kelamin, usia, gejala dan diagnosis penyakit akan diambil untuk
menemukan hubungan antara usia, jenis kelamin, gejala dan penyakit.
2. Pre-processing
Langkah
selanjutnya adalah data pre-processing dimana peneliti menghilangkan noise atau
membersihkan data yang hilang, tidak konsistem ataupun outliers. Proses ekstrasi
data cukup menantang dikarenakan atribut kadang tidak relevan, berlebihan,
memiliki noise, tidak dapat diandalkan dan ketidaksesuaian metode untuk
mendapatkan pola tak teridentifikasi dari data yang mana dapat mempengaruhi
hasil yang tidak akurat. Pada makalah ini menggunakan beberapa teknik dalam
menghadapi missing value. Seperti, mengganti missing value dengan mean value
dan menghapus kolom yang memiliki lebih dari dua missing value. Untuk data
usia, peneliti menggunakan teknik bernama missing completely at random (MCAR).
3.
Transformasi Dara
Tahap
selanjutnya adalah transformasi data dengan mengubah dan menyimpan data
penyakit mata ke dalam format khusus, yaitu format file relasi-atribut. Pada
tahap ini, kita menginisialisasi atribut dan memodifikasi tipe datanya, seperti
konversi tipe data numerik menjadi binominal.
4. Contoh
menghasilan aturan menggunakan FP-Growth
Disini
penuli mengilustraskan dalam 20 kasus data sempel rekam medis penyakit mata
untuk mengetahui hubungan antara usia, jenis kelamin, gejala dan jenis penyakit
mata.
Dalam sampel ini, peneliti mengasumsikan
bahwa support count ≥ 10%.Nilai support count ini mempengaruhi konstruksi pohon
FP. Support count 10% sebagai ambang batas untuk memfilter set item,yaitu hanya
set item yang memiliki jumlah dukungan yang sama, atau lebih dari 10% yang akan
muncul. peneliti menggambarkan pola pencarian proses seperti yang ditunjukkan
pada Tabel III. Kita dapat mengamati bahwa item U3,U6, U2, G9, G12, P2 dan U4
belum muncul di tabel.Item terbaik berdasarkan program dukungan minimum
berfungsi sebagai berikut:
Langkah
selanjutnya adalah memindai data dan mengatur ulang data minimum support. Confidence
dan support value untuk mengukur aturan terbaik. Data yang tidak memenuhi minimum
support dan tidak mengandung antecedent akan dihapus dari transaksi. Atribut
yang menjadi anteseden adalah usia, jenis kelamin, gejala ,sedangkan
konsekuensinya adalah penyakit .
Langkah
selanjutnya adalah konstruksi FP-Tree berdasarkan scan transaksi Berdasarkan
data sampel yang diberikan, P1,P2, P3, P4, P5, P6, P7, P8 dan P9 adalah
konsekuensinya, tetapi hanya P3 dan P4 yang memenuhi minimum support. Langkah
selanjutnya adalah untuk mendapatkan set item yang sering dengan conditional
pattern base kemudian membuat aturan dengan menghitung confidence setiap
kombinasi aturan. Konstruksi FP-Tree berfungsi sebagai berikut:
Setelah aturan didapat dari frequent itemset, maka langkah selanjutnya adalah mengevaluasi aturan asosiasi yang kuat yang diperoleh dengan menggunakan rasio angkat. Rasio angkat adalah rasio antara confidence suatu aturan dan nilai keyakinan tolok ukur.Keyakinan, Benchmark adalah perbandingan antara jumlah konsekuensi dengan total transaksi. Kita pertimbangkan rasio peningkatan lebih dari 1 menunjukkan sebagai aturan yang memungkinkan.
Hasil
Implementasinya
dilakukan dengan minimum support dan parameter minimum confidence. Minimum support
digunakan dalam 3%, 10% dan 20% sedangkan untuk minimum confidence digunakan dalam
10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% dan 100%. Minimum
support dan minimum confidence mempengaruhi aturan yang dihasilkan. peneliti
memulai dengan nilai tinggi dalam minimum support dan confidence, dan kemudian
peneliti mengurangi nilai-nilai sampai menemukan nilai yang menghasilkan pola
yang cukup. Dengan nilai minimum support dan confidence semakin tinggi maka
aturan yang didapat akan semakin sedikit seperti pada table dibawah:
Dari tes yang dilakukan, Peneliti
berhasil menggunakan algoritma FP-Growth sebagai produsen aturan dengan akurasi
yang baik dengan 88%. Dan berdasarkan hasil penelitian didapat konjungtivitas
dan penyakit presbyopia merupakan penyakit yang paling dominan diderita dengan
225 dan 167 kasus. Dengan laki-laki atau perempuan dengan umur 31-59 tahun
sangat dominan menderita conjunctivitis dan presbyopia.



Komentar
Posting Komentar