// <![CDATA[EVALUASI KINERJA KERNEL PADA SVM UNTUK ANALISIS SENTIMEN PROGRAM MAKAN SIANG GRATIS PADA PLATFORM X]]> 0415068801 - Yusup Miftahuddin, S.Kom., MT Dosen Pembimbing 1 Wirawan Hadiwibowo / 152020074 Penulis 120240902 - Anisa Putri Setyaningrum, S.Kom., M.T. Dosen Pembimbing 2
Program Makan Siang Gratis telah menjadi topik hangat di Indonesia, memicu sentimen yang beragam di platform media sosial X. Penelitian ini bertujuan untuk mengevaluasi dan membandingkan secara komprehensif kinerja kernel Linear, Polinomial, dan Radial Basis Function (RBF) pada Support Vector Machine (SVM) untuk klasifikasi sentimen terkait isu tersebut. Penelitian dimulai dengan akuisisi 2.463 data tweet melalui teknik scraping. Data mentah tersebut kemudian melewati serangkaian tahap pra-pemrosesan yang meliputi pembersihan teks, penghapusan duplikasi, dan pelabelan sentimen otomatis (positif atau negatif) berbasis leksikon menggunakan InSet Lexicon. Ekstraksi fitur dilakukan dengan metode pembobotan TF-IDF untuk merepresentasikan data teks secara numerik. Untuk menemukan model klasifikasi yang paling optimal, dilakukan penyetelan hiperparameter menggunakan GridSearch yang divalidasi dengan Stratified K-Fold Cross Validation. Hasil evaluasi pada data pengujian menunjukkan bahwa kernel RBF memiliki performa paling unggul. Model SVM dengan kernel RBF berhasil mencapai nilai akurasi dan F1-score sebesar 86%. Kernel Linear juga menunjukkan kinerja yang solid dengan skor seragam sebesar 84% pada metrik evaluasi tersebut, diikuti oleh kernel Polinomial dengan skor 81%. Keunggulan kernel RBF mengindikasikan kemampuannya yang lebih baik dalam menangani kompleksitas pola data non-linear pada analisis sentimen penelitian ini. The Free Lunch Program has become a trending topic in Indonesia, sparking diverse sentiments on the social media platform X. This research aims to comprehensively evaluate and compare the performance of the Linear, Polynomial, and Radial Basis Function (RBF) kernels on a Support Vector Machine (SVM) for sentiment classification regarding this issue. The study began with the acquisition of 2,463 tweets through scraping techniques. The raw data then underwent a series of preprocessing stages, including text cleaning, duplicate removal, and automatic sentiment labeling (positive or negative) using the lexicon-based InSet Lexicon. Feature extraction was performed using the TF-IDF weighting method to numerically represent the text data. To find the most optimal classification model, hyperparameter tuning was conducted using GridSearch, validated with Stratified K-Fold Cross Validation. The evaluation results on the test data show that the RBF kernel delivered the most superior performance. The SVM model with the RBF kernel achieved an accuracy and F1-score of 86%. The Linear kernel also demonstrated solid performance with a uniform score of 84% on the same evaluation metrics, followed by the Polynomial kernel with a score of 81%. The superiority of the RBF kernel indicates its enhanced capability in handling the complexity of non-linear data patterns in this sentiment analysis study.