// <![CDATA[ANALISIS PERBANDINGAN ALGORITMA COSINE SIMILARITY, RABIN-KARP, DAN LEVENSHTEIN DISTANCE UNTUK MENDETEKSI PLAGIARISME PADA DOKUMEN]]> Dr. Jasman Pardede, S.Si., M.T. Dosen Pembimbing 1 AGIL YUDISTIRA / 152019132 Penulis
Pencegahan dan pendeteksian plagiarisme menjadi hal yang penting, khususnya dalam dunia akademik. Terdapat beberapa algoritma yang dapat digunakan untuk mendeteksi plagiarisme pada dokumen, di antaranya adalah Algoritma Cosine Similarity, Rabin-Karp, Levenshtein Distance, Hamming Distance, Euclidean Distance, Edit Distance, Ratcliff/Obershelp, Winnowing, Wu Palmer, Brute Force, Boyer-Moore, dan Knuth Morris Pratt. Berdasarkan tinjauan pustaka dari penelitian sebelumnya, didapatkan 3 algoritma terbaik, yaitu Cosine Similarity, Rabin-Karp, dan Levenshtein Distance. Namun, belum ada penelitian yang menganalisis perbandingan dari ketiga algoritma tersebut. Oleh karena itu, penelitian ini akan menganalisis perbandingan dari masing-masing algoritma, serta menentukan algoritma terbaik untuk mendeteksi plagiarisme pada dokumen berdasarkan nilai kemiripan dan waktu eksekusi. Objek penelitian menggunakan sampel dokumen berupa judul dan abstrak dari jurnal bidang informatika dalam bahasa Indonesia sebanyak 40 dokumen uji dan 400 dokumen pembanding. Algoritma Cosine Similarity memiliki rata-rata kemiripan sebesar 40.80% dan waktu eksekusi 0.45 detik, Algoritma Rabin-Karp dengan 4 k-gram memiliki rata-rata kemiripan 47.13% dan waktu eksekusi 10.70 detik, lalu Algoritma Levenshtein Distance memiliki rata-rata kemiripan 20.61% dan waktu eksekusi 0.22 detik. Algoritma Cosine Similarity lebih baik dibandingkan yang lainnya untuk mendeteksi plagiarisme pada dokumen, karena menghasilkan nilai rata-rata kemiripan tertinggi, dengan waktu eksekusi yang tergolong cepat.