Main Article Content
Abstract
Banyaknya berita yang terdapat pada media internet telah menyebabkan munculnya berbagai permasalahan, dalam hal teknologi penyimpanan, sistem temu balik, dan pengelompokkan berita itu sendiri. Pada umumnya, pembaca berita cenderung ingin dapat memperoleh inti sari dari berbagai macam berita yang disediakan oleh suatu porta berital. Meskipun web portal berita memiliki fasilitas RSS untuk mempermudah pembaca memperbaharui isinya, namun pada kenyataannya pembaca masih tetap memiliki kecenderungan untuk memperoleh berita yang sama dari setiap portal. Oleh karena itu perlu adanya web portal sindikasi berita yang mampu mengklasifikasi kemiripan berita sehingga tidak ada penggandaan berita dalam satu waktu. Untuk pengklasifikasian berita digunakan metode Single Pass Clustering sebagai algoritma untuk klasifikasi event. Klasifikasi dilakukan pada dokumen berita yang berdekatan untuk dicari kemiripannya. Klasifikasi ini ditekankan untuk dokumen berita berbahasa Indonesia. Kemiripan (similarity) antar berita dapat diukur dari judul dan deskripsi berita. Jika ditemukan dokumen yang memiliki kemiripan maka ia akan menjadi rekomendasi dari berita utamanya. Web portal sindikasi berita ini dapat menjadi referensi berita berbahasa Indonesia yang merupakan kumpulan berita dari beberapa portal berita.