// <![CDATA[PENGARUH TEKNIK DATA BALANCED TERHADAP KINERJA MODEL KLASIFIKASI]]> Dr. Jasman Pardede, S.Si., M.T. Dosen Pembimbing 1 Dika Prasetia Pamungkas / 152019073 Penulis
Dalam proses klasifikasi, perbedaan signifikan dalam frekuensi munculnya kelas-kelas dapat mengakibatkan ketidakseimbangan data. Ketidakseimbangan ini dapat mempengaruhi kinerja model machine learning, terutama dalam situasi di mana beberapa kelas memiliki representasi yang sangat jarang. Imbalanced data sering kali menyebabkan model cenderung memprediksi kelas mayoritas dengan kecenderungan tertentu, menghasilkan prediksi yang kurang akurat. Penanganan ketidakseimbangan data menjadi kunci dalam membangun model klasifikasi yang efektif. Resampling, sebuah teknik di tingkat data, telah terbukti efektif dalam menyeimbangkan distribusi kelas. Dalam penelitian ini, dilakukan penelitian untuk menggunakan teknik resampling sebagai penyeimbang distribusi kelas menggunakan metode SMOTE, B-SMOTE, dan SMOTE-ENN. Hasil eksperimen menunjukkan bahwa teknik resampling dapat meningkatkan kinerja model pada KNN, Naïve bayes, dan Decision Tree. Pada metode SMOTE-ENN, menghasilkan peningkatan terbaik pada kinerja model KNN menggunakan imbalanced dataset yang meningkatkan nilai akurasi sebesar 7,98%, precision 34,00%, recall 42,42%, f1-score 40,91%, G-mean 61,64%, dan kurva-ROC 0,4209. Kesimpulan yang dapat diambil adalah bahwa penerapan teknik resampling mempengaruhi peningkatkan kinerja pada model klasifikasi, terutama metode SMOTE-ENN, yang memiliki dampak yang signifikan pada peningkatan kinerja model menggunakan imbalanced dataset.