// <![CDATA[ADAPTIVE SYNTHETIC SAMPLING UNTUK IMBALANCE DATASET PADA KLASIFIKASI MENGGUNAKAN MULTINOMIAL NAÏVE BAYES]]> 0422106801 - Dewi Rosmala , S.Si, M.IT. Dosen Pembimbing 1 MUHAMMAD RAZI SAEFUNAZAR / 152017038 Penulis
Studi ini membahas mengenai klasifikasi dengan dataset yang tidak seimbang dalam klasifikasi teks jenis kejahatan dengan menggunakan kombinasi metode Adaptive Synthetic Sampling (ADASYN) dan algoritma Multinomial Naive Bayes. Klasifikasi, yang bertujuan menentukan kategori data berdasarkan atribut tertentu, sering kali menghadapi tantangan ketika dataset tidak seimbang. Dalam konteks ini, ADASYN digunakan untuk meningkatkan representasi kelas minoritas dengan menghasilkan sampel sintetis, sementara Multinomial Naive Bayes diaplikasikan untuk klasifikasi berdasarkan fitur yang diperoleh melalui teknik TF-IDF. Penelitian ini berfokus pada analisis teks kriminal dari berita online dengan sembilan kategori kejahatan. Hasil penelitian menunjukkan bahwa penggunaan ADASYN berhasil meningkatkan keseimbangan dataset dan performa klasifikasi, dengan model yang dilatih pada dataset yang telah di-oversample menunjukkan peningkatan signifikan dalam metrik evaluasi. Model mencapai precision 96%, recall 81%, f1-score 89%, dan accuracy 91%, menegaskan efektivitas kombinasi ADASYN dan Naive Bayes dalam menangani ketidak seimbangan kelas serta meningkatkan akurasi prediksi pada klasifikasi teks jenis kejahatan. Kata kunci : Klasifikasi, Dataset Tidak Seimbang, ADASYN, Multinomial Naive Bayes, TF-IDF.