Implementasi Algoritma Random Forest Berbasis Oversampling SMOTE Untuk Klasifikasi Penyakit Alzheimer

Galung Reinan, Agung Nilogiri, Wiwik Suharso

Abstract


Penyakit Alzheimer merupakan bentuk paling umum dari demensia yang menjadi masalah kesehatan global, terutama pada lanjut usia. Deteksi dini sangat penting untuk memperlambat perkembangan penyakit dan meningkatkan kualitas hidup pasien melalui intervensi medis yang tepat waktu. Namun, diagnosis konvensional sering kali memerlukan waktu lama, biaya tinggi, serta bergantung pada tenaga ahli. Penelitian ini bertujuan mengimplementasikan algoritma Random Forest untuk klasifikasi penyakit Alzheimer secara otomatis, efisien, dan akurat. Dataset yang digunakan berasal dari Kaggle, terdiri atas 2.149 data pasien dengan 35 atribut terkait. Proses pengolahan data mengikuti kerangka kerja CRISP-DM yang mencakup enam tahap: Business Understanding, Data Understanding, Data Preparation, Modeling, Evaluation, dan Deployment. Untuk mengatasi ketidakseimbangan kelas, digunakan teknik oversampling SMOTE. Evaluasi model dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil yang diperoleh menunjukkan bahwa algoritma Random Forest dapat digunakan sebagai sistem pendukung keputusan dalam deteksi dini Alzheimer secara praktis dan berbasis data.

Kata Kunci: Alzheimer, Klasifikasi, Machine Learning, Random Forest.


Full Text:

PDF

References


Alzheimer’s Association. (2019). 2019 Alzheimer’s disease facts and figures includes a special report on Alzheimer’s detection in the primary care setting: connecting patients and physicians. Retrieved from

https://alz.org/media/Documents/alzhei mers-facts-andfigures-2019-r.pdf.

Aziz, M.I., et al. 2023. “Analisis Metode Ensemble Pada Klasifikasi Penyakit Jantung Berbasis Decision Tree”, Jurnal Media Informatika Budidarma, 7(1), 1 – 12.

Berry, M. J. ., & Linoff, G. S. (2004). Data Mining Techniques. United States: Wiley Publishing, Inc.

Breiman, L. (2001). Random forests. Machine Learning, 45(1), 5–32.

Devella, S. Y. Yohannes, and F. N. Rahmawati, “Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT,” JATISI (Jurnal Tek. Inform. dan Sist. Informasi), vol.7, no. 2, pp. 310–320, 2020.

Dewi, N.R., et al. 2023. “Algoritma K-Nearest Neighbor (K-NN) dan Single Layer Perceptron (SLP) Untuk Klasifikasi Penyakit Alzheimer”, 9(2), 92 – 101.

Dinova, D. B., & Prasetiyo, B. 2024. “Implementasi Random Forest dalam Klasifikasi Kanker Paru-Paru”. Journal Of Informatics Engineering, 5(2), 27 –31.

Dominicus, D. A., Setiawan, N. Y., & Wicaksono, S. A. (2020). Prediksi Kecenderungan Pelanggan Telat Bayar pada Layanan Pembiayaan Adira Finance Saluran E-Commerce. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 4(4), 1300–1307.

Freund, Y., & Schapire, R. E. (1999). A Short Introduction to Boosting. Journal of Japanase Society for Artificial Intelligence, 14(5), 771–780.

Handayani, P., dkk. 2024. “Machine Learning Klasifikasi Status Gizi Balita Menggunakan Algoritma Random Forest ”. Kajian Ilmiah Informatika dan Komputer, 4(6), 3064 – 3072.

Lakhan, S. E. (2019, December 4). Alzheimer Disease Clinical Presentation: History, Physical Examination, Stages of Alzheimer Disease. Retrieved January 12, 2020, from https://emedicine.medscape.com/article

/1134817-clinical#b4.

Liu, J., Kong, X., Xia, F., Bai, X., Wang, L., Qing, Q., & Lee, I. 2018. Artificial Intelligence in the 21st century. IEEE Acces, 34403-34421.

Lorase, D. T. 2005. Discovering Knowledge In Data. Canada: Wiley Interscience.

M. A. Hasanah, S. Soim, dan A. S. Handayani. (2021). “Implementasi CRISP-DM Model Menggunakan Metode Decision Tree dengan Algoritma CART untuk Prediksi Curah Hujan Berpotensi Banjir,” vol. 5, no. 2.

Mantas, C. J., & Abellan, J. 2014. Credal-C4.5: Decision Tree Based on Imprecise Probabilities to Classify Noisy Data. Expert System With Application, 4625– 4637.

Muzaky, A., dkk. 2024. “Menerapkan Metode Klasifikasi pada Data Uji Emisi Kendaraan di Jakarta dengan Menggunakan Jupyter Notebook”. JPSII (Jurnal Pengembangan Sistem Informasi dan Informatika), 5(2), 74 –84.

Prasetyo, E. 2014. Mengolah Data Menjadi Informasi Menggunakan Matlab. Yogyakarta: Andi.

Putri, R, A,. 2024. “Pemodelan Algoritma Random Forest Untuk Klasifikasi Log Acces Jenis Domain Pada PANDI (Pengelola Nama Domain Internet Indonesia)”. Jakarta: Program Studi Teknik Informatika Universitas Islam Negeri Syarif Hidayatullah.

Rahman, S., et al. 2023. Python: Dasar-dasar Pemrograman Berorientasi Objek. Deli Serdang: CV TAHTA MEDIA GROUP.

Rozy, A. 2024. “Penerapan Random Forest Untuk Prediksi Virus Hepatitis C”. FIMERKOM: Journal of Information Systems and Technology, 1(1), 19 -23.

Santosa, B. 2007. Data Mining : Teknik Pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu.

Sidiq, S., Alfian, A. and Mabrur, N.S., 2025. Pengembangan Model Prediksi Risiko Diabetes Menggunakan Pendekatan AdaBoost dan Teknik Oversampling SMOTE. Jurnal Ilmiah Informatika dan Ilmu Komputer (JIMA- ILKOM), 4(1), pp.13-23.

Utami, S.F. 2020. “Penerapan Data Mining Algoritma Decision Tree Berbasis PSO”. Jurnal SAINTEKS ( Seminar Nasional Teknologi Komputer & Sains), Februari: 677 – 681.

Wildah, S.K., et al. 2020. “Deteksi Penyakit Alzheimer Menggunakan Algoritma Naïve Bayes dan Correlation Based Feature Selection”, 7(2), 166 – 173.

Wu, Xi., Kumar, V., Quinlan, J. R., Ghosh, J., Yang, Q., Motoda, H., … Steinbarg. (2008). Top 10 algorithm in data

mining. Knowl Inf Syst, 14, 1–37.


Refbacks

  • There are currently no refbacks.


Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.