// <![CDATA[IMPLEMENTASI PRINCIPAL COMPONENT ANALYSIS PADA PENGELOMPOKAN DOKUMEN]]> Tatan Hartanto Nusa / 152009075 Penulis Jasman Perdede, S.Si., MT.
Dokumen sering dikaitkan dalam permasalahan pencarian informasi yang relevan maka dengan adanya pengelompokan dokumen diharapkan mempermudah dalam pencarian dokumen seperti pencarian dokumen berita tentang pekerjaan dan hobi. Principal Component Analysis (PCA) merupakan algoritma pengenalan pola dengan mereduksi dimensi variabel data masukan menjadi komponen utama yang berdimensi lebih kecil dengan kehilangan informasi minimum, dimana komponen utama yang terbentuk tidak berkorelasi satu dengan yang lainnya. Fitur yang digunakan dalam klasifikasi adalah nilai terms dokumen terhadap cluster. Hasil nilai proses PCA dilakukan pengelompokan menggunakan metode K-Meansdengan menghitung jarak terdekat dari titik pusat dan jumlah titik pusat ditentukan dari cluster yang dimasukkan. Algoritma PCA berhasil melakukan pengelompokan jika pengambilan nilai new data set mencapai 50% dari variasi data atau lebih. Dalam pemindahan dokumen pada folder cluster mengunakan konsep copy delete dokumen sehingga pemindahan dokumen pada kelompoknya berdasarkan implementasi PCA berhasil dilakukan secara otomatis.