Penerapan Metode Cosine Similarity dan Pembobotan TF/IDF pada Sistem Klasifikasi Sinopsis Buku di Perpustakaan Kejaksaan Negeri Jember

Moh. Mahdi Sya’bani, reni umilasari

Abstract


Selama ini perpustakaan Kejaksaan Negeri Jember belum dikelola dengan baik. Pada saat pegawai perpustakaan ingin mengetahui macam-macam judul buku sesuai kategori yang mereka inginkan, pegawai perpustakaan mencari satu persatu di katalog bukunya. Sehingga kondisi demikian akan menyulitkan pegawai perpustakaan dalam mencari judul buku sesuai kategori yang diinginkan. Hal ini dapat mengakibatkan pegawai perpustakaan kewalahan. Pelayanan yang sangat baik jika pengguna perpustakaan merasa puas dengan pelayananya. Semakin banyaknya dokumen buku yang ada di perpustakaan semakin banyak tenaga dan waktu yang diperlukan. Maka memerlukan sebuah sistem aplikasi untuk mengklasifikasikan dokumen buku berdasarkan kategori buku secara otomatis. Untuk mendapatkan hasil yang optimal dalam mengklasifikasikan sebuah dokumen maka diperlukan sebuah metode untuk mengklasifikasikan dokumen. Metode yang digunakan adalah pembobotan TF/IDF dan cosine similarity pada model vector space model. Untuk mengukur tingkat kemiripan suatu dokumen dengan menggunakan sinopsis buku.

Pengujian aplikasi terdapat 120 dokumen sinopsis dengan 10 kategori dan menghasilkan nilai precision sebesar 90,91% pada threshold 0,1 dan nilai recall sebesar 100% pada threshold 0,1 dan 0,2. Ketepatan akurasi pada sistem aplikasi yang diuji adalah 80,83%.

kata kunci: Klasifikasi Dokumen, Sinopsis Buku, Perpustakaan Kejaksaan Negeri Jember, Pembobotan TF/IDF dan Cosine Similarity

 


Full Text:

PDF

References


Prastowo, A. (2013). Manajemen perpustakaan sekolah profesional.Yogyakarta: DIVA Press

Mark A. Hall., & Lloyd A. Smith. (1999). Feature Selection for Learning: Comparing a Correlation a Corelation-based Filter Approach to the Wrapper . In FLAIRS Conference

Kaplan, R.M. (1995). A Methode for Tokenizing Text. Palo Alto Research Center (Festscrift in The Honor of Prof. Kimmo Koskenniemi's 60 th Anniversary)

Porter, M.F.2001. Snowball: A language for Stemming Algorithms Computer Laboraty, Cambridge (England)

Feldman, R dan Sanger, J., (2007). Text Mining Handbook: Advanced Approaches in Analyzing Unstructered Data. New York: Cambridge University Press

Robertson, S.. (2005). Understanding Inverse Document Frequency: On Theoretical Arguments for IDF. England: Journal of Documentation, Vol. 60, 502-520

Sulistyo, W. & Sarno, R. (2008), Auto Matching Antar Dokumen dengan Metode Cosine Measure, Seminar Nasional Teknologi Informasi dan Komunikasi, Indonesia.




DOI: https://doi.org/10.32528/justindo.v3i1.2345

Refbacks

  • There are currently no refbacks.


Copyright (c) 2018 Moh. Mahdi Sya’bani, reni umilasari

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

View My Stats