Penerapan Metode Cosine Similarity dan Pembobotan TF/IDF pada Sistem Klasifikasi Sinopsis Buku di Perpustakaan Kejaksaan Negeri Jember
Abstract
Selama ini perpustakaan Kejaksaan Negeri Jember belum dikelola dengan baik. Pada saat pegawai perpustakaan ingin mengetahui macam-macam judul buku sesuai kategori yang mereka inginkan, pegawai perpustakaan mencari satu persatu di katalog bukunya. Sehingga kondisi demikian akan menyulitkan pegawai perpustakaan dalam mencari judul buku sesuai kategori yang diinginkan. Hal ini dapat mengakibatkan pegawai perpustakaan kewalahan. Pelayanan yang sangat baik jika pengguna perpustakaan merasa puas dengan pelayananya. Semakin banyaknya dokumen buku yang ada di perpustakaan semakin banyak tenaga dan waktu yang diperlukan. Maka memerlukan sebuah sistem aplikasi untuk mengklasifikasikan dokumen buku berdasarkan kategori buku secara otomatis. Untuk mendapatkan hasil yang optimal dalam mengklasifikasikan sebuah dokumen maka diperlukan sebuah metode untuk mengklasifikasikan dokumen. Metode yang digunakan adalah pembobotan TF/IDF dan cosine similarity pada model vector space model. Untuk mengukur tingkat kemiripan suatu dokumen dengan menggunakan sinopsis buku.
Pengujian aplikasi terdapat 120 dokumen sinopsis dengan 10 kategori dan menghasilkan nilai precision sebesar 90,91% pada threshold 0,1 dan nilai recall sebesar 100% pada threshold 0,1 dan 0,2. Ketepatan akurasi pada sistem aplikasi yang diuji adalah 80,83%.
kata kunci: Klasifikasi Dokumen, Sinopsis Buku, Perpustakaan Kejaksaan Negeri Jember, Pembobotan TF/IDF dan Cosine Similarity
Full Text:
PDFReferences
Prastowo, A. (2013). Manajemen perpustakaan sekolah profesional.Yogyakarta: DIVA Press
Mark A. Hall., & Lloyd A. Smith. (1999). Feature Selection for Learning: Comparing a Correlation a Corelation-based Filter Approach to the Wrapper . In FLAIRS Conference
Kaplan, R.M. (1995). A Methode for Tokenizing Text. Palo Alto Research Center (Festscrift in The Honor of Prof. Kimmo Koskenniemi's 60 th Anniversary)
Porter, M.F.2001. Snowball: A language for Stemming Algorithms Computer Laboraty, Cambridge (England)
Feldman, R dan Sanger, J., (2007). Text Mining Handbook: Advanced Approaches in Analyzing Unstructered Data. New York: Cambridge University Press
Robertson, S.. (2005). Understanding Inverse Document Frequency: On Theoretical Arguments for IDF. England: Journal of Documentation, Vol. 60, 502-520
Sulistyo, W. & Sarno, R. (2008), Auto Matching Antar Dokumen dengan Metode Cosine Measure, Seminar Nasional Teknologi Informasi dan Komunikasi, Indonesia.
DOI: https://doi.org/10.32528/justindo.v3i1.2345
Refbacks
- There are currently no refbacks.
Copyright (c) 2018 Moh. Mahdi Sya’bani, reni umilasari
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.