Main Article Content
Abstract
Saat ini konten informasi dalam bentuk berita dihasilkan dengan jumlah besar dari berbagai sumber setiap harinya. Banyaknya konten yang dihasilkan ini menuntut organisasi konten yang baik agar pencarian informasi yang diinginkan dapat dilakukan dengan mudah. Organisasi dan manajemen informasi yang efisien terhadap konten informasi elektronik ini menginspirasi penelitian mengenai document clustering. Pada penelitian ini dirancang sebuah metode document clustering dengan melakukan kombinasi pemodelan topik latent dirichlet allocation (LDA) dengan ward hierarchical clustering. LDA digunakan sebagai representasi vektor dokumen yang berupa distribusi topik. Representasi ini bertujuan untuk mengurangi dimensi vektor yang pada umumnya terlalu panjang jika menggunakan tf-idf. Ward Hierarchical Clustering yang memiliki kompleksitas tinggi dapat terbantu prosesnya dengan representasi dari LDA. Selain itu dihasilkan silhouette coefficient yang baik yaitu 0.7. Dalam peneltian ini juga ditemukan bahwa penentuan jumlah topik dalam kaitannya dengan document clustering dapat dilakukan dengan mempertimbangkan silhouette coefficient pada hasil clustering. Performa silhouette coefficient pada representasi pemodelan topik lebih baik dibandingkan dengan representasi dengan tf-idf.
Article Details
- Seluruh materi yang terdapat dalam situs ini dilindungi oleh undang-undang. Dipersilahkan mengutip sebagian atau seluruh isi situs web ini sesuai dengan ketentuan yang berlaku.
- Apabila anda menemukan satu atau beberapa artikel yang terdapat dalam Jurnal Pseudocode yang melanggar atau berpotensi melanggar hak cipta yang anda miliki, silahkan laporkan kepada kami, melalui email pada Priciple Contact.
- Aspek legal formal terhadap akses setiap informasi dan artikel yang tercantum dalam situs jurnal ini mengacu pada ketentuan lisensi Creative Commons Atribusi-ShareAlike (CC-BY-SA).
- Semua Informasi yang terdapat di Jurnal Pseudocode bersifat akademik. Jurnal Pseudocode tidak bertanggung jawab terhadap kerugian yang terjadi karana penyalah gunaan informasi dari situs ini.