// <![CDATA[FINE-TUNING INDOBERT UNTUK ANALISIS SENTIMEN PADA PROGRAM MAKAN SIANG GRATIS DI MEDIA SOSIAL X]]> 0411105902 - Uung Ungkawa, Ir., M.T., Dr. Dosen Pembimbing 1 Raka Aprianto / 152019113 Penulis
Penelitian ini menerapkan fine-tuning IndoBERT untuk analisis sentimen opini publik terhadap Program Makan Siang Gratis pada media sosial X. Sebanyak 2.000 cuitan berbahasa Indonesia diperoleh melalui proses crawling dengan kata kunci “makan siang gratis lang:id” dan diklasifikasikan ke tiga kelas (positif, negatif, netral). Distribusi label menunjukkan ketidak seimbangan dengan 42% negatif, 36% positif, dan 21% netral. Pra-pemrosesan meliputi pembersihan teks, normalisasi, tokenisasi, stopword removal, serta stemming menggunakan Sastrawi, sementara pelebelan awal sentimen menggunakan metode InSet Lexicon. Model yang digunakan adalah IndoBERT (indobert-base-p2) yang di fine-tune dan dievaluasi menggunakan akurasi, precision, recall, F1-score, serta confusion matrix. Hasil eksperimen membandingkan lima optimizer (Adam, AdamW, RAdam, LAMB, dan SGD Dengan Momentum). AdamW terbukti paling stabil dengan akurasi uji 68,87% dan nilai precision, recall, serta F1-score rata-rata mendekati 69%. Confusion matrix menunjukkan model paling sering salah mengklasifikasikan teks negatif sebagai positif (34 kasus) dan positif sebagai negatif (22 kasus), sementara kelas netral relatif paling stabil dengan 51 prediksi benar. Hal ini mengindikasikan kebingungan terbesar model terjadi pada positif dan negatif, yang kemungkinan disebabkan oleh kemiripan konteks atau fitur dalam data. Secara keseluruhan, IndoBERT efektif digunakan dalam penelitian ini, meskipun akurasi yang belum tinggi disebabkan oleh keterbatasan jumlah data dan distribusi label yang tidak merata. Walaupun demikian, hasil evaluasi metrik yang konsisten mengindikasikan kemampuan generalisasi yang cukup baik dan diharapkan tetap bermanfaat untuk memberikan wawasan kepada pemangku kebijakan terkait dalam memahami opini publik untuk merumuskan strategi yang lebih efektif dalam merespons isu tersebut. This study applies fine-tuning of IndoBERT to analyze public sentiment toward the Free Lunch Program on the social media platform X. A total of 2,000 Indonesian-language tweets were collected through crawling using the keyword “makan siang gratis lang:id” and classified into three categories (positive, negative, neutral). The label distribution was imbalanced, consisting of 42% negative, 36% positive, and 21% neutral. Preprocessing included text cleaning, normalization, tokenization, stopword removal, and stemming using Sastrawi, while the initial sentiment labeling employed the InSet Lexicon. The model used was IndoBERT (indobert-base-p2), which was fine tuned and evaluated using accuracy, precision, recall, F1-score, and confusion matrix. The experiments compared five optimizers (Adam, AdamW, RAdam, LAMB, and SGD with Momentum). AdamW demonstrated the most stable performance with a test accuracy of 68.87% and average precision, recall, and F1-score values close to 69%. The confusion matrix indicated that the model most frequently misclassified negative texts as positive (34 cases) and positive texts as negative (22 cases), while the neutral class was relatively stable with 51 correct predictions. This finding suggests that the greatest confusion occurred between positive and negative classes, likely due to contextual or feature similarities in the data. Overall, IndoBERT proved effective in this study, although the moderate accuracy was constrained by the limited and imbalanced dataset. Nevertheless, the consistent evaluation metrics indicate sufficient generalization capability and are expected to provide valuable insights for policymakers in understanding public opinion and formulating more effective strategies in responding to this issue.