// <![CDATA[KLASIFIKASI EMOSI DENGAN MULTINOMIAL NAÏVE BAYES PADA IMBALANCE DATASET]]> 0422106801 - Dewi Rosmala , S.Si, M.IT. Dosen Pembimbing 1 Muhammad Naufal Zharfan Suprayogi / 152017031 Penulis
Penelitian ini bertujuan untuk mengembangkan model klasifikasi untuk menentukan emosi pada lirik lagu Bahasa Indonesia menggunakan metode Multinomial Naïve Bayes. Tantangan utama dalam penelitian ini adalah mengatasi masalah ketidakseimbangan data, di mana kelas emosi memiliki jumlah sampel yang lebih besar daripada kelas emosi lainnya. Penelitian ini mencakup pengumpulan data lirik lagu berjumlah 727 data berupa lirik lagu berbahasa Indonesia dari berbagai genre yang dilabeli secara otomatis dengan metode NRC Emotion Lexicon.Data dibagi menjadi 80% data train dan 20% data test.SMOTE digunakan untuk mengatasi masalah Imbalance data dengan membuat dataset sintetis untuk menyeimbangkan jumlah data minoritas dan mayoritas.Hasil evaluasi menunjukkan bahwa model Multinomial Naïve Bayes dengan SMOTE mencapai akurasi 94%, jauh lebih tinggi dibandingkan tanpa menggunakan SMOTE dengan akurasi 48%. Peningkatan akurasi ini menunjukkan bahwa penggunaan SMOTE cukup efektif dalam menangani ketidakseimbangan sampel data kelas emosi. Temuan ini mengindikasikan bahwa kombinasi SMOTE dan Multinomial Naïve Bayes andal untuk klasifikasi pada data yang tidak seimbang. Kata kunci: Multinomial Naïve Bayes, NRC Emotion Lexicon Imbalance Dataset, SMOTE, Klasifikasi Emosi.