// <![CDATA[PERBANDINGAN N-GRAM TECHNIQUE DAN RABIN KARP PADA APLIKASI PENDETEKSI PLAGIARISME DOKUMEN TEKS BAHASA INDONESIA]]> Jasman Pardede, S.Si., MT. Yusup Miftahuddin, S.kom., MT. Acep Andi Andriani/ 15-2012-093 Penulis
Plagiarisme adalah penjiplakan atau pengambilan karya, karangan dan sebagainya dari orang lain yang seolah diakui sebagai karangan sendiri. Deteksi plagiarisme dapat dilakukan dengan cara pencocokan dokumen uji dan dokumen sumber. Dalam pendeteksian terdapat beberapa tahapan, yaitu tahap preprocessing, proses pembobotan TF-IDF, proses deteksi. Proses deteksi dilakukan dengan metode N-Gram Technique dan Rabin Karp. N-gram dilakukan pemecahan kalimat berdasarkan panjang karakter yang ditentukan, selanjutnya dilakukan pencocokan karakter dan dihitung nilai persentase similarity. Sedangkan pada pendeteksian Rabin Karp dilakukan pemecahan kalimat berdasarkan panjang karakter, selanjutnya dihitung nilai hash kemudian dicocokan, jika nilai hash sama maka selanjutnya dilakukan pencocokan kata, serta dihitung nilai persentase similarity. Dari hasil penelitian yang dilakukan pembobotan TF-IDF dapat dimanfaatkan untuk pendeteksian plagiarisme. Dari kedua metode yang dibandingkan N-Gram dan Rabin Karp menghasilkan nilai similarity yang sama, tetapi waktu pendeteksian berbeda. Waktu proses pendeteksian N-Gram lebih cepat dari Rabin Karp.