PENGARUH TEKNIK DATA BALANCED TERHADAP KINERJA MODEL KLASIFIKASI
Dalam proses klasifikasi, perbedaan signifikan dalam frekuensi munculnya kelas-kelas dapat mengakibatkan ketidakseimbangan data. Ketidakseimbangan ini dapat mempengaruhi kinerja model machine learning, terutama dalam situasi di mana beberapa kelas memiliki representasi yang sangat jarang. Imbalanced data sering kali menyebabkan model cenderung memprediksi kelas mayoritas dengan kecenderungan tertentu, menghasilkan prediksi yang kurang akurat. Penanganan ketidakseimbangan data menjadi kunci dalam membangun model klasifikasi yang efektif. Resampling, sebuah teknik di tingkat data, telah terbukti efektif dalam menyeimbangkan distribusi kelas. Dalam penelitian ini, dilakukan penelitian untuk menggunakan teknik resampling sebagai penyeimbang distribusi kelas menggunakan metode SMOTE, B-SMOTE, dan SMOTE-ENN. Hasil eksperimen menunjukkan bahwa teknik resampling dapat meningkatkan kinerja model pada KNN, Naïve bayes, dan Decision Tree. Pada metode SMOTE-ENN, menghasilkan peningkatan terbaik pada kinerja model KNN menggunakan imbalanced dataset yang meningkatkan nilai akurasi sebesar 7,98%, precision 34,00%, recall 42,42%, f1-score 40,91%, G-mean 61,64%, dan kurva-ROC 0,4209. Kesimpulan yang dapat diambil adalah bahwa penerapan teknik resampling mempengaruhi peningkatkan kinerja pada model klasifikasi, terutama metode SMOTE-ENN, yang memiliki dampak yang signifikan pada peningkatan kinerja model menggunakan imbalanced dataset.
Detail Information
Citation
APA Style
. (2024).PENGARUH TEKNIK DATA BALANCED TERHADAP KINERJA MODEL KLASIFIKASI ().Teknik Informatika:FTI
Chicago Style
.PENGARUH TEKNIK DATA BALANCED TERHADAP KINERJA MODEL KLASIFIKASI ().Teknik Informatika:FTI,2024.Text
MLA Style
.PENGARUH TEKNIK DATA BALANCED TERHADAP KINERJA MODEL KLASIFIKASI ().Teknik Informatika:FTI,2024.Text
Turabian Style
.PENGARUH TEKNIK DATA BALANCED TERHADAP KINERJA MODEL KLASIFIKASI ().Teknik Informatika:FTI,2024.Text