PERBANDINGAN OPTIMASI ALGORITMA RANDOM FOREST MENGGUNAKAN TEKNIK BOOSTING TERHADAP KASUS KLASIFIKASI CHURN PELANGGAN DI INDUSTRI TELEKOMUNIKASI

Noeril Agian Septa Dinata, Ginanjar Abdurrahman, Nur Qodariyah Fitriyah

Abstract


Industri telekomunikasi berkembang sangat pesat dan perusahaan telekomunikasi terus melakukan berbagai inovasi untuk mendukung persaingan bisnis yang benar-benar sengit dan semakin sulit mendapatkan pelanggan. Persaingan ini menghasilkan churn pelanggan. Churn pelanggan yang tinggi adalah salah satu tingkat kegagalan perusahaan, oleh karena itu churn harus dikurangi. Algoritma Random Forest dipilih karena memiliki kemampuan untuk mengklasifikasikan data yang tidak lengkap dan dapat menangani data sampel yang besar. Tujuan khusus dari penelitian ini adalah untuk membandingkan kinerja algoritma Random Forest dengan optimasi menggunakan teknik boosting (XGBoost dan AdaBoost). Pada penelitian menggunakan Upsampled untuk mengatasi data yang tidak seimbang dan metode interquartile range dalam mengatasi pencilan. Hasil penelitian ini menujjukkan bahwa optimasi algoritma Random Forest menggunakan boosting AdaBoost menghasilkan kinerja yang paling optimal dengan hasil akurasi (99.13%), presisi (98.31%), recall (100%) dan f1-score (99.15%).


Keywords


Telekomunikasi; Churn; Optimasi; Random Forest; Boosting; XGBoost; AdaBoost

References


Andreyestha & Subekti, A. (2020). Analisa Sentiment Pada Ulasan Film Dengan Optimasi Ensemble Learning. Jurnal Informatika, Vol.7 No.1, pp. 15–23.

Arina, F. & Ulfah, M. (2022). Analisa Survival Untuk Mengurangi Customer Churn Pada Perusahaan Telekomunikasi. Journal Industrial Servicess, vol. 8, no. 1, Juni 2022.

Atthariq, A. S. (2020). Klasifikasi Customer Churn Berdasarkan Segmentasi Pelanggan Menggunakan Algoritma Naïve Bayes (Studi Kasus : Esl Express Tasikmalaya). Sarjana thesis, Universitas Siliwangi.

Bhatele, K. R. & Bhadauria, S. S. (2020). Glioma segmentation and classification system based on proposed texture features extraction method and hybrid ensemble learning. Traitement du Signal. Vol. 37, No. 6, December, 2020, pp. 989-1001.

Elfaladonna, F. & Rahmadani, A. (2019). Analisa Metode Classification-Decission Tree Dan Algoritma C.45 Untuk Memprediksi Penyakit Diabetes Dengan Menggunakan Aplikasi Rapid Miner. SINTECH Journal, vol. 2, no. 1, pp. 10–17.

El Kassem, E. A., Hussein, S. A., Abdelrahman, A. M., & Alsheref, F. K. (2020). Customer Churn Prediction Model and Identifying Features to Increase Customer Retention based on User Generated Content. (IJACSA) International Journal of Advanced Computer Science and Applications, Vol. 11, No. 5, pp. 522–531.

Fadli, A. (2020). Konsep Dasar Data Science. Komunitas eLearning IlmuKomputer, pp. 1–7.

Hashmi, N., Butt, N.A., & Iqbal, M. (2013). Customer Churn Prediction in Telecommunication: A Decade Review and Classification. International Journal of Computer Science Issues, Vol. 10, Issue 5, No 2, September 2013, pp. 271–282, 2013.

Husein, A.M., Harahap, M., & Fernandito, P. (2021). Pendekatan Data Science untuk Menemukan Churn Pelanggan Pada Sector Perbankan dengan Machine Learning. Jurnal Data Science Indonesia (DSI), vol. 1, no. 1, pp. 8–13, 2021.

Iwendi, C., Bashir, A.K., Peshkar, A., Sujatha, R., Chatterjee, J.M., Pasupuleti, S., Mishra, R., Pillai, S. & Jo, O. (2020). COVID-19 Patient Health Prediction Using Boosted Random Forest Algorithm. Front. Public Health 8:357

Lukas, S., Vigo, O., Krisnadi, D. & Widjaja, P. (2022). Perbandingan Performa Bagging Dan Adaboost Untuk Klasifikasi Data Multi-Class. Journal Information System Development (ISD), vol 7, no 2, p. 7 - 12.

Mirabdolbaghi, S. M. S. & Amiri, B. (2022). Model Optimization Analysis of Customer Churn Prediction Using Machine Learning Algorithms with Focus on Feature Reductions. Discrete Dynamics in Nature and Society, vol. 2022.

Mutmainnah, S. (2020). Optimasi Algoritma C4. 5 Menggunakan Teknik Bagging Pada Data Kadar Karat Emas. Universitas Muhammadiyah Jember.

Pamungkas, F. S., Prasetya, B. D., & Kharisudin, I. (2020). Perbandingan Metode Klasifikasi Supervised Learning pada Data Bank Customers Menggunakan Python. PRISMA, Prosiding Seminar Nasional Matematika, 3, 692-697.

Prasetio, R. T. & Susanti, S. (2019). Prediksi Harapan Hidup Pasien Kanker Paru Pasca Operasi Bedah Toraks Menggunakan Boosted k-Nearest Neighbor. Jurnal Responsif, vol. 1, no. 1, pp. 64–69.

Pristyanto, Y. (2019). Penerapan Metode Ensemble Untuk Meningkatkan Kinerja Algoritme Klasifikasi Pada Imbalanced Dataset. Jurnal Teknoinfo, vol. 13, no. 1, p. 11.

Rachmi, A.N. (2020). Implementasi Metode Random Forest Dan Xgboost Pada Klasifikasi Customer Churn. Universitas Islam Indonesia.

Raju, V. N. G., Lakshmi, K. P., Jain, V. M., Kalidindi, A., & Padma, V. (2020). Study the Influence of Normalization/Transformation process on the Accuracy of Supervised Classification. Third International Conference on Smart Systems and Inventive Technology (ICSSIT), Tirunelveli, India, pp. 729-735.

Saputra, F.D. (2021). Prediksi Churn Dan Strategi Retensi Pada Kasus Perusahaan Telekomunikasi. Tesis, pp. 1–120, 2021.

Silva, A., Kocayusufoglu, F., Jafarpour, S., Bullo, F., Swami, A. & Singh, A. (2021). Combining Physics and Machine Learning for Network Flow Estimation. International Conference on Learning Representations, vol. 1, pp. 1–18.

Singgalen, Y. (2022). Analisis Sentimen Wisatawan Melalui Data Ulasan Candi Borobudur di Tripadvisor Menggunakan Algoritma Naïve Bayes Classifier. Building of Informatics, Technology and Science (BITS), 4(3), 1343−1352.

Siringoringo, R. (2018). Klasifikasi Data Tidak Seimbang Menggunakan Algoritma Smote Dan K-Nearest Neighbor. Journal Information System Development (ISD), vol. 3, no. 1, pp. 44–49.

Siringoringo, R., Angin, R. P., & Rumahorbo, B. (2022). Model Klasifikasi Genetic-XGBoost Dengan T-Distributed Stochastic Neighbor Embedding Pada Peramalan Pasar. Jurnal Times, vol. XI, no. 1, pp. 30–36.

Sitorus, Y. W., Sukarno, P., & Mandala, S. (2021). Analisis Deteksi Malware Android menggunakan metode Support Vector Machine & Random Forest. e-Proceeding of Engineering: Vol.8, No.6. pp. 12500–12518.

Thara D.K., PremaSudha, B. G., & Xiong, F. (2019). Auto-detection of epileptic seizure events using deep neural network with different feature scaling techniques. Pattern Recognition Letters, volume 128, p 544-550.

Wicaksono, A., Anita, & Padilah, T. N. (2021). Uji Performa Teknik Klasifikasi untuk Memprediksi Customer Churn. Bianglala Inform, vol. 9, no. 1, pp. 37–45.

Yulianti, S. E. H., Soesanto, O., & Sukmawaty, Y. (2022). Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit. Journal of Mathematics: Theory and Applications, vol. 4, no. 1, pp. 21–26.

Zhang, W., Wu, C., Zhong, H., Li, Y., & Wang, L. (2021). Prediction of undrained shear strength using extreme gradient boosting and random forest based on Bayesian optimization. Geoscience Frontiers, vol. 12, no. 1, pp. 469–477.




DOI: https://doi.org/10.32528/jasie.v5i1.18820

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 JASIE: Jurnal Aplikasi Sistem Informasi dan Elektronika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.