Main Article Content

Abstract

Pencarian dokumen di Internet memiliki karakteristik khusus yang harus dipertimbangkan yaitu bandwidth atau kecepatan akses yang terbatas serta waktu pencarian relatif lebih lambat daripada pencarian di desktop. Karena itu perlu dilakukan indexing pada proses Information Retrieval agar dapat mempercepat dan mempermudah pencarian. Makin banyak term yang terindeks akan makin membutuhkan waktu ekstra untuk mencari sebuah term. Sehingga diperlukan metode khusus untuk memangkas jumlah term dalam indeks. Salah satunya dengan melakukan ekstraksi dokumen menggunakan algoritma Hybrid Hidden Markov Model. Metode yang dipakai dalam sistem ekstraksi ini adalah dengan melakukan pendekatan statistik yang dikombinasikan dengan pendekatan tata bahasa dan HMM Hedge sebagai model HMM.Metode yang digunakan tersebut diharapkan dapat menyelesaikan masalah yang terjadi pada sistem Information Retrieval yang hanya menggunakan ekstraksi dokumen dengan algoritma Hidden Markov Model.

Article Details