// <![CDATA[TOPIC MODELLING BI-LINGUAL KOLOM KOMENTAR MENGGUNAKAN POLYLINGUAL TOPIC MODELLING]]> 120071201 - Uung Ungkawa, Ir., M. T., Dr. Dosen Pembimbing 1 120040903 - Dewi Rosmala, S.Si., M.IT. Penguji 2 120060504 / Jasman Pardede, S.Si., M.T., Dr Penguji 1 Muhammad Farhan Maulana / 152019078 Penulis
kolom komentar pada sebuah media sosial sangat berperan penting dalam konten yang di unggah. Komentar-komentar ini merupakan data tidak terstruktur sehingga diperlukan teknik analisis untuk mengekstraksi informasi yang berguna. Topic modeling digunakan sebgai teknik yang berguna untuk menganalisis struktur sematik dalam kumpulan dokumen teks, metode yang banyak digunakan adalah Latent Dirichlet Allocation (LDA), namun teknik ini memiliki kelemahan yang perlu diperhatikan, yaitu tidak dapat mengolah dokumen dalam berbagai bahasa, dengan pendekatan Polylingual Topic Modeling (PLTM) diusulkan untuk mengatasi masalah identifikasi tema utama dalam data multibahasa. Penelitian ini mengeksplorasi efektivitas PLTM dalam mengelompokkan komentar ke dalam topik-topik yang bermakna dengan mempertimbangkan aspek deteksi bahasa, pemetaan makna kata, serta penentuan jumlah topik yang optimal. Hasil penelitian menunjukkan bahwa proses deteksi bahasa dalam tahap preprocessing sangat mempengaruhi hasil PLTM, di mana penggunaan FastText cukup efektif tetapi masih ditemukan beberapa kesalahan dalam identifikasi bahasa. Penentuan jumlah topik juga berperan penting dalam kualitas pemodelan, di mana metode coherence score digunakan untuk menentukan jumlah topik optimal, dan hasil analisis menunjukkan bahwa dataset yang digunakan menghasilkan empat topik utama. Setiap topik direpresentasikan berdasarkan kata-kata dengan frekuensi tertinggi dalam kelompok tersebut. Dengan demikian, penelitian ini menunjukkan bahwa PLTM dapat digunakan secara efektif untuk menganalisis komentar YouTube dalam berbagai bahasa, meskipun masih terdapat tantangan teknis yang perlu dioptimalkan. Kata kunci: Topic Modeling, Polylingual Topic Modeling, YouTube, Coherence Score.