//
Warning: Cannot modify header information - headers already sent by (output started at /home/etdlibitenasac/public_html/index.php:1) in /home/etdlibitenasac/public_html/sysconfig.inc.php on line 185

Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; StringReader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/streams.php on line 48

Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; FileReader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/streams.php on line 84

Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; CachedFileReader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/streams.php on line 145

Deprecated: Methods with the same name as their class will not be constructors in a future version of PHP; gettext_reader has a deprecated constructor in /home/etdlibitenasac/public_html/lib/lang/php-gettext/gettext.php on line 36

Warning: session_start(): Cannot start session when headers already sent in /home/etdlibitenasac/public_html/index.php on line 38

Warning: Cannot modify header information - headers already sent by (output started at /home/etdlibitenasac/public_html/index.php:1) in /home/etdlibitenasac/public_html/lib/contents/show_detail.inc.php on line 42
<![CDATA[ANALISIS PROBABILISTIC LATENT SEMANTIC ANALYSIS PADA PENCARIAN MAKNA KALIMAT UNTUK ULASAN PRODUK]]> 0422106801 - Dewi Rosmala , S.Si, M.IT. Dosen Pembimbing 1 0420106301 - Dr. Ir. Winarno Sugeng, M.Kom. Penguji 1 0411038512 - Galih Ashari Rakhmat, S.Si., M.T. Penguji 2 ADITYA DAFFA RAHMADANI / 152019095 Penulis
Ulasan produk memiliki pengaruh yang signifikan terhadap penjualan produk, variabel kualitas produk yang dirasakan memiliki pengaruh paling besar terhadap keputusan pembelian dibandingkan variabel lain. Topic modeling digunakan sebagai teknik yang berguna untuk menganalisis struktur semantik dalam kumpulan dokumen teks. Namun, teknik ini memiliki beberapa kelemahan yang perlu diperhatikan. Salah satu tantangan utama dalam topic modeling adalah resiko overfitting, pendekatan pLSA (Probabilistic Latent Semantic Analysis) diusulkan sebagai solusi untuk mengatasi beberapa kelemahan dalam model pemodelan topik, Namun salah satu kelemahan utama pLSA sendiri adalah kecenderungannya untuk mengalami overfitting. Hal ini terjadi karena jumlah parameter dalam model pLSA tumbuh secara linear dengan jumlah dokumen dalam kumpulan data, salah satu cara untuk mengatasi overfitting adalah dengan menggunakan regularisasi L2. Regularisasi L2 adalah teknik yang menambahkan penalti pada fungsi objektif model berdasarkan besarnya nilai parameter. Tujuan yang dibuat pada penelitian ini adalah untuk menganalisa hasil Probabilistic Latent Semantic Analysis dan menanggulangi overfitting pada Probabilistic Latent Semantic Analysis menggunakan algoritma Regularisasi L2. Berdasarkan proses yang dilakukan didapatkan hasil berupa interpretasi topik dan grafik perbedaan antara sebelum dan sesudah penerapan L2 pada EM, Pada grafik penggunaan model pLSA tanpa Regularisasi L2 terdapat nilai yang overfitting, angka menunjukan nilai yang tidak stabil bahkan cenderung besar, pada fold pertama tanpa L2 log-likelihood mendapatkan nilai sebesar – 47520 yang cenderung besar dibandingkan dengan penerapan L2 pada pLSA yang mendapatkan nilai sebesar - 15266. Pada grafik evaluasi kinerja perplexity, didapatkan hasil yang tidak stabil pada penerapan tanpa L2, nilai yang dihasilkan pada tiap folds menunjukan kenaikan yang signifikan yaitu dari 3.833663e+10 sampai dengan 7.764712e+12, sementara dengan penerapan L2 didapatkan nilai yang stabil pada angka 785.789170 sampai dengan 937.406353. Kata kunci : Topik modeling, overfitting, pLSA, Regularisasi L2, semantik, crawling