PEMANFAATAN WEBSITE PARSER TEMPLATE PADA WEB CRAWLER UNTUK MEMBANGUN METADATA PADA SISTEM PENCARIAN BERBASIS SEMANTIK

Nurhayati Masthurah; Taufiq Wirahman; Devi Munandar

Download

PDF

Abstract

Seiring dengan meningkatnya jumlah halaman Web, pencarian untuk menemukan informasi yang dibutuhkan menjadi semakin sulit. Untuk mengatasi hal tersebut, banyak program telah dibangun untuk mendapatkan halaman Web secara otomatis. Web crawler adalah suatu program perangkat lunak yang menjelajahi ruang informasi WWW dengan mengikuti tautan hypertext dan mengambil dokumen Web dengan standar protokol yang ada. Sistem pencarian berbasis semantik menggunakan metadata berupa Resource Description Framework (RDF) sebagai sumber informasinya. Web crawler digunakan untuk membuat penggandaan halaman Web yang dikunjungi sebelum akhirnya mesin pencari akan mengindeks halaman yang didownload untuk memberikan hasil pencarian yang lebih cepat. Dengan memanfaatkan format Website Parser Template (WPT) memungkinkan web crawler menghasilkan RDF Semantic Web untuk halaman Web. WPT terdiri dari beberapa bagian, yaitu ontologi, template dan URL. Ontologi berisi semua konsep dan hubungannya yang digunakan dalam website. Template dan URL nantinya akan dihubungkan ke ontologi website yang dibangun. Kumpulan RDF inilah yang akan digunakan sebagai repositori metadata dalam membangun Semantic web. Sebagai contoh aplikasi adalah sistem pencarian publikasi ilmiah berbasis semantik dimana sistem pencarian ini menggunakan data publikasi ilmiah berupa file bibtex yang didapat dari hasil crawling yang kemudian dikonversi ke format RDF untuk selanjutnya disimpan direpositori.

Kata Kunci : semantic web, web crawler, website parser template, rdf, pencarian semantik.

PEMANFAATAN WEBSITE PARSER TEMPLATE PADA WEB CRAWLER UNTUK MEMBANGUN METADATA PADA SISTEM PENCARIAN BERBASIS SEMANTIK

Article Sidebar

Main Article Content

Abstract

Article Details