// <![CDATA[ANALISIS PERBANDINGAN VECTORIZATION PADA ANALISIS SENTIMEN TWITTER (X) MENGGUNAKAN METODE LEXICON-BASED DAN SVM (Studi Kasus Layanan Ekspedisi SiCepat)]]> 120160502 - Kurnia Ramadhan Putra, S.Kom., M.T. Dosen Pembimbing 1 KIRANA INDRIA REVANSA / 162020013 Penulis
Teknologi informasi saat ini berkembang pesat, mengubah cara kita berinteraksi melalui platform media sosial yang memungkinkan komunikasi global. Media sosial, khususnya X (sebelumnya dikenal sebagai Twitter), memberikan cara mudah bagi pengguna untuk menyuarakan pandangan dan opini mereka secara online. Dengan jumlah pengguna global mencapai 421 juta pada tahun 2022, X menjadi sumber data yang sangat berharga untuk analisis sentimen. Akan tetapi, data teks sering kali tidak terstruktur dan penuh noise, sehingga menyulitkan pemrosesan. Untuk mengatasi masalah ini, digunakan teknik text mining dan analisis sentimen untuk memudahkan mengidentifikasi pola dan emosi dalam data teks. Data cuitan X mengenai layanan SiCepat yang berhasil dikumpulkan menggunakan alat Tweet-Harvest berjumlah 3315 data. Data ini kemudian dilabeli menggunakan VADER-Lexicon setelah diterjemahkan ke Bahasa Inggris, menghasilkan distribusi sentimen: 35,3% positif, 39,1% netral, dan 25,6% negatif untuk data hasil lemmatization; serta 27,6% positif, 48,6% netral, dan 23,7% negatif untuk data hasil stemming. Teknik undersampling diterapkan untuk menyeimbangkan data sentimen tersebut. Berdasarkan hasil pelatihan model SVM dengan perbandingan metode normalization dan vectorization menunjukkan bahwa kombinasi terbaik adalah model SVM yang menggunakan metode lemmatization dengan vectorization Bag of Words pada split data 90:10 menggunakan parameter SVM yaitu {'C': 100, 'gamma': 0.01, 'kernel': 'rbf'}dengan akurasi sebesar 86,3%. Kata kunci: Text Mining, Analisis Sentimen, Vectorization, Support Vector Machine, SiCepat