ANALISIS SENTIMEN PASCA PERTANDINGAN SEPAK BOLA INDONESIA MELAWAN ARGENTINA PADA UNGGAHAN MEDIA SOSIAL TWITTER MENGGUNAKAN METODE MULTINOMIAL NAÏVE BAYES DAN GAUSSIAN NAÏVE BAYES
Abstract
Timnas Indonesia baru saja menjadi tuan rumah pertandingan persahabatan melawan Argentina yang digelar di Gelora Bung Karno Jakarta yang menjadi perbincangan hangat masyarakat terutama di twitter. Pada penelitian ini akan dilakukan analisis sentimen pasca pertandingan sepak bola Indonesia melawan Argentina pada twitter dengan sejumlah 700 tweet data. Metode yang digunakan adalah Multinomial Naïve bayes dan gaussian Naïve Bayes. Namun dalam proses klasifikasi, seringkali terdapat masalah yang ditemukan oleh peneliti yaitu ketidakseimbangan data. Maka dari itu, pada penelitian ini menambahkan teknik balancing data, Random Oversampling, Undersampling dan SMOTE. Teknik balancing diharapkan dapat meningkatkan hasil pada klasifikasi. Seluruh data akan diproses menggunakan metode K-Fold Cross Validation dengan variasi nilai K 2, 5, 7 dan 10. Hasil pengujian metode Multinomial Naïve bayes tanpa menggunakan teknik balancing mendapatkan nilai akurasi tertinggi sebesar 69%, presisi 69% dan recall 69%. Metode gaussian Naïve Bayes tanpa teknik balancing mendapatkan nilai akurasi tertinggi sebesar 58%, presisi 58% dan recall 57%. Sedangkan hasil uji menggunakan metode Multinomial Naïve bayes dengan menambahkan teknik balancing dapat diketahui jika menggunakan Random Oversampling mendapatkan nilai akurasi tertinggi sebesar 80%, presisi 81% dan recall 80%. Untuk metode gaussian Naïve Bayes dengan menambahkan teknik balancing dapat diketahui jika menggunakan SMOTE mendapatkan nilai akurasi tertinggi sebesar 79%, presisi 79% dan recall 79%. Dapat disimpulkan bahwa metode Multinomial Naïve bayes pada penelitian ini lebih efektif dibandingkan dengan Gaussian Naïve Bayes.
The Indonesian national football team recently hosted a friendly match against Argentina at Gelora Bung Karno Stadium in Jakarta, sparking widespread discussions, especially on Twitter. This research focuses on sentiment analysis post the Indonesia vs. Argentina football match on Twitter, utilizing a dataset of 700 tweets. The methods employed include Multinomial Baive Bayes and Gaussian Naive Bayes. However, during the classification process, researchers encountered data imbalance issues. Therefore, this study incorporates data balancing techniques such as Random Oversampling, Undersampling, and SMOTE to enhance classification results. The entire dataset will be processed using K-Fold Cross Validation with varying K values of 2, 5, 7, and 10. Testing the Multinomial Naive Bayes method without balancing techniques yielded the highest accuracy of 69%, precision of 69%, and recall of 69%. The Gaussian Naive Bayes method without balancing techniques achieved the highest accuracy of 58%, precision of 58%, and recall of 57%. In contrast, testing the Multinomial Naive Bayes method with the addition of balancing techniques revealed that using Random Oversampling resulted in the highest accuracy of 80%, precision of 81%, and recall of 80%. For the Gaussian Naive Bayes method with balancing techniques, using SMOTE achieved the highest accuracy of 79%, precision of 79%, and recall of 79%. In conclusion, the Multinomial Naive Bayes method in this study proved to be more effective than the Gaussian Naive Bayes method.
Keywords
Full Text:
PDF (Bahasa Indonesia)References
Astari, N. M. A. J., Dewa Gede Hendra Divayana, & Gede Indrawan. (2020). Analisis Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan Metode Naive Bayes Classifier. Jurnal Sistem Dan Informatika (JSI), 15(1), 27–29. https://doi.org/10.30864/jsi.v15i1.332
Diantika, S. (2023). Penerapan Teknik Random Oversampling Untuk Mengatasi Imbalance Class Dalam Klasifikasi Website Phishing Menggunakan Algoritma Lightgbm. JATI (Jurnal Mahasiswa Teknik Informatika), 7(1), 19–25. https://doi.org/10.36040/jati.v7i1.6006
Ernayanti, T., Mustafid, M., Rusgiyono, A., & Hakim, A. R. (2023). Penggunaan Seleksi Fitur Chi-Square Dan Algoritma Multinomial Naïve Bayes Untuk Analisis Sentimen Pelangggan Tokopedia. Jurnal Gaussian, 11(4), 562–571. https://doi.org/10.14710/j.gauss.11.4.562-571
Fariz, M. I., Arifianto, D., Rahayu, Y. D., Informatika, T., Teknik, F., Jember, U. M., Sentimen, A., & Distance, L. (2021). OPTIMASI METODE MULTINOMIAL NAÏVE BAYES. 2(2), 84–91.
Kasanah et al. (2021). Penerapan Teknik Kombinasi Oversampling Dan Undersampling Untuk Mengatasi Permasalahan Imbalanced Dataset. JIKO (Jurnal Informatika Dan Komputer), 4(1), 38–43. https://doi.org/10.33387/jiko.v4i1.2561
Kaur, P., & Gosain, A. (2018). Comparing the behavior of oversampling and undersampling approach of class imbalance learning by combining class imbalance problem with noise. Advances in Intelligent Systems and Computing, 653(January), 23–30. https://doi.org/10.1007/978-981-10-6602-3_3
Mujahidin, S., Prasetio, B., & Utomo, M. C. C. (2022). Implementasi Analisis Sentimen Masyarakat Mengenai Kenaikan Harga BBM Pada Komentar Youtube Dengan Metode Gaussian naïve bayes. Voteteknika (Vocational Teknik Elektronika Dan Informatika), 10(3), 17. https://doi.org/10.24036/voteteknika.v10i3.118299
Prasetyo, D., & Pradana, M. (2021). Analisis Sentimen Media Sosial Terhadap Bank Rakyat Indonesia (bri) Sebagai Sponsor Resmi Liga Sepak Bola Indonesia (liga 1). EProceedings …, 8(6), 8556–8561. https://openlibrarypublications.telkomuniversity.ac.id/index.php/management/article/view/17081%0Ahttps://openlibrarypublications.telkomuniversity.ac.id/index.php/management/article/view/17081/16793
Sanrilla, S., Ransi, N., La Surimi, L. S., Andi Tenriawaru, A. T., & La Ode Saidi, L. O. S. (2022). Analisis Sentimen Masyarakat Terhadap Toko Online Aplikasi Shopee Menggunakan Metode Multinomial Naïve Bayes. Jurnal Matematika Komputasi Dan Statistika, 2(2), 68–75. https://doi.org/10.33772/jmks.v2i2.9
Saputro, E., & Rosiyadi, D. (2022). Penerapan Metode Random Over-Under Sampling Pada Algoritma Klasifikasi Penentuan Penyakit Diabetes. Bianglala Informatika, 10(1), 42–47. https://doi.org/10.31294/bi.v10i1.11739
Siregar, R. R. A., Sinaga, F. A., & Arianto, R. (2017). Aplikasi Penentuan Dosen Penguji Skripsi Menggunakan Metode TF-IDF dan Vector Space Model. Computatio : Journal of Computer Science and Information Systems, 1(2), 171. https://doi.org/10.24912/computatio.v1i2.1014
Syukron, A., & Subekti, A. (2018). Penerapan Metode Random Over-Under Sampling dan Random Forest Untuk Klasifikasi Penilaian Kredit. Jurnal Informatika, 5(2), 175–185. https://doi.org/10.31311/ji.v5i2.4158
Tarju, T., & Wahidi, R. (2017). Pengaruh Metode Latihan Terhadap Peningkatan Passing Dalam Permainan Sepak Bola. JUARA : Jurnal Olahraga, 2(2), 66. https://doi.org/10.33222/juara.v2i2.35
Verawati, I., & Audit, B. S. (2022). Algoritma Naïve Bayes Classifier Untuk Analisis Sentiment Pengguna Twitter Terhadap Provider By.u. Jurnal Media Informatika Budidarma, 6(3), 1411. https://doi.org/10.30865/mib.v6i3.4132
DOI: https://doi.org/10.32528/jasie.v5i2.22315
Refbacks
- There are currently no refbacks.
Copyright (c) 2024 Jurnal Aplikasi Sistem Informasi dan Elektronika
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
Penerbit : | Pengelola : |