KINERJA ALGORITMA MULTINOMIAL NAÏVE BAYES (MNB), MULTIVARIATE BERNOULLI DAN ROCCHIO ALGORITHM DALAM KLASIFIKASI KONTEN BERITA HOAX BERBAHASA INDONESIA DENGAN JUPYTER NOTEBOOK

Hamdhan Ashari, Deni Arifianto Arifianto, Habibatul Azizah Al Faruq

Abstract


Berita hoax adalah informasi palsu atau bohong yang disebarkan untuk orang banyak namun diterima sebagai berita yang benar. Penyebaran informasi di era modern saat ini sangat cepat. Salah satu media penyebarannya adalah media sosial. Pada penelitian ini dilakukan klasifikasi dokumen terhadap konten berita hoax berbahasa Indonesia pada situs resmi turnbackhoax.id. Metode klasifikasi pada penelitian ini adalah membandingkan antara algoritma Multinomial Naive Bayes (MNB), Multivariate Bernoulli dan Rocchio. Hasil yang didapatkan dari penelitian ini adalah pada algoritma Multinomial Naive Bayes (MNB) didapatkan hasil akurasi sebesar 74%, presisi 83,33% dan recall 60%. Pada algoritma Multivariate Bernoulli mendapatkan hasil akurasi sebesar 70%, presisi 62,50% dan recall 100%. Pada algoritma Rocchio mendapatkan hasil akurasi sebesar 76%, presisi 88,24% dan recall 60%.

 


Keywords


Klasifikasi dokumen; Hoax; Multinomial Naive Bayes (MNB); Multivariate Bernoulli; Rocchio;

References


Feldman, R & Sanger, J., (2007). Text Mining Handbook: Advanced Approaches in Analyzing Unstructered Data. New York: Cambridge University Press.

Han, J., Kamber, M, & Pei, J. 2011. Data Mining: Concept and Techniques, Third Edition. New York: Elsevier.

Harlian, M. 2006. Machine Learning Text Categorization. University of Texas, Austin.

Hermawati, F.A. 2013. Data Mining. Surabaya: Andi.

Havrlant, L., & Kreinovich, V. 2014. “A Simple Probabilistic of Term Frequency-Invers Document Frequency (TF-IDF)”. International Journal of General System. University of Texas.

Karunia, S.A., Saptono, R., & Anggrainingsih, R. 2017. “Online News Classification Using Naïve Bayes Classifier with Mutual Information for Feature Selection”. ITSMART Vol. 6 No.1. Universitas Sebelas Maret.

Kuhn, M., & Johnson, K. 2013. Applied Predictive Modeling. New York: Springer.

Larose, D.T. 2005. Discovering Knowledge in Data: An Introduction to Data Mining. New Jersey: John Willey & Sons, Inc.

Manning, C., Raghavan, P., & Schutze, H. 2015. Introduction to Information Retrieval. New York: Cambridge University Press.

McCallum, A., & Nigam, K. 1998. A Comparison of Event Models for Naïve Bayes Text Classification. Pittsburgh: Carnegie Mellon University.

Pantouw, J.C.W. 2017. Perbandingan Klasifikasi Rocchio dan Multinomial Naïve Bayes pada Analisis Sentimen Data Twitter Bahasa Indonesia. Institut Pertanian Bogor, Bogor.

Priansya, S. 2017. Social Media Text Normalization Using Word2vec, Levenshtein Distance, & Jaro-Winkler Distance. Institut Teknologi Sepuluh Nopember Surabaya, Final Project-KS 141501.

Rahman, A., Wiranto, & Doewes, A. 2017. “Online News Classification Using Multinomial Naive Bayes”. ITSMART Vol. 6 No.1. Universitas Sebelas Maret.

Rasywir, E., & Purwarianti, A. 2015. “Eksperimen pada Sistem Klasifikasi Berita Hoax Berbahasa Indonesia Berbasis Pembelajaran Mesin”. Jurnal Cybermatika Vol. 3 No.2. Institut Teknologi Bandung.

Taprial, V., & Kanwar, P. 2012. Understanding Social Media. New York: Bookboon.

Triawati., & Chandra. 2009. Metode Pembobotan Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia. Institut Teknologi Telkom, Bandung.

Turban, E., Aronson, J.E., & Liang, T.P. 2005. Decision Support System and Intelligent System. Yogyakarta: Andi Offset.

Wisaksono, A., & Mujiyatna, I.G. 2017. Klasifikasi Berita Berkategori Olahraga dengan Algoritma Multivariate Bernoulli Naïve Bayes dan Multinomial Naïve Bayes. Gadjah Mada University Press, Yogyakarta.

Zhang, Y., Gong, L., & Wang, Y. 2005. “An improved TF-IDF approach for text classification”. Journal of Zhejiang University SCIENCE Vol. 6 No.1. Tersedia di https://doi.org/10.1631/jzus.2005.A0049.

Manning, C., Raghavan, P., & Schutze, H. 2015. Introduction to Information Retrieval. New York: Cambridge University Press.




DOI: https://doi.org/10.32528/jasie.v2i2.5839

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 JASIE: Jurnal Aplikasi Sistem Informasi dan Elektronika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.