//
Warning: Cannot modify header information - headers already sent by (output started at /home/etdlibitenasac/public_html/index.php:1) in /home/etdlibitenasac/public_html/sysconfig.inc.php on line 185
Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; StringReader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/streams.php on line 48
Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; FileReader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/streams.php on line 84
Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; CachedFileReader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/streams.php on line 145
Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; gettext_reader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/gettext.php on line 36
Warning: session_start(): Cannot start session when headers already sent in /home/etdlibitenasac/public_html/index.php on line 38
Warning: Cannot modify header information - headers already sent by (output started at /home/etdlibitenasac/public_html/index.php:1) in /home/etdlibitenasac/public_html/lib/contents/show_detail.inc.php on line 42
0422106801 - Dewi Rosmala , S.Si, M.IT.
Dosen Pembimbing 1
FAISAL FAJAR RAMADHAN / 152020130
Penulis
Proses klasifikasi dengan imbalanced dataset dapat memengaruhi keakuratan hasil klasifikasi data. Pada penelitian ini berfokus pada penanganan imbalanced dataset untuk meningkatkan kinerja klasifikasi. Metode yang digunakan untuk menangani ketidakseimbangan dataset adalah Complement Naïve Bayes (CNB). Complement Naïve Bayes meyeimbangkan data latih yang diambil dari setiap kelas, sehingga dapat mengurangi bias yang disebabkan oleh ketidakseimbangan dataset. Metode pembobotan kata yang digunakan adalah TF-IDF, yang dirancang untuk memberikan bobot lebih tinggi pada kata-kata yang lebih informatif. Pada penelitian ini menggunakan 571 data, yang dilabeli secara otomatis dengan metode Leksikon Indonesia Sentimen (InSet). Data dibagi menjadi data train dan data test menggunakan Stratified K-Fold Cross Validation, metode ini membantu persebaran kelas pada data tetap terjaga, sehingga setiap fold memiliki representasi kelas yang seimbang. Hasil pengujian menunjukkan bahwa Complement Naive Bayes (CNB) memiliki kinerja cukup baik dibandingkan Multinomial Naive Bayes (MNB) dalam melakukan klasifikasi dengan dataset yang tidak seimbang. CNB mencapai presisi 68 %, recall 74 %, dan F1-Score 66 %, sementara MNB mencapai presisi 55 %, recall 74 %, dan F1-Score 63 %. Implementasi Stratified K-Fold Cross-Validation (SKCV) dengan K10 pada algoritma CNB dan MNB berpengaruh dalam meningkatkan hasil F1-Score, dengan hasil F1-Score 73.21 % untuk CNB dan 71.16 % untuk MNB. Kata kunci : Imbalanced data, Complement Naive Bayes, InSet Leksikon, TF-IDF, Stratified K-Fold Cross-Validation.