Main Article Content
Abstract
Abstract—Question Answering System (QAS) merupakan sistem
tanya jawab yang dapat memberikan jawaban secara langsung
kepada pengguna dalam bentuk bahasa alami. Untuk mencari
sebuah jawaban, QAS menggunakan pengetahuan baik internal
maupun eksternal. Salah satu pengetahuan eksternal adalah
Internet yang memiliki sumber informasi yang berlimpah.
Penelitian ini mencoba untuk melakukan analisis penggunaan
pengetahuan eksternal untuk digunakan oleh QAS. Ada tiga
sumber corpus yang digunakan yaitu: Wikipedia, Google dan
Bing. Hasil dari penelitian ini adalah banyaknya data yang
berhasil diperoleh dan jumlah jawaban yang dapat diekstraksi.
Bing memperoleh hasil retrieval dan ekstraksi jawaban lebih
banyak dari Google yaitu sebesar 372 dokumen dan 72
kemungkinan jawaban, sedangkan Google sebesar 345 dokumen
dengan 68 kemungkinan jawaban. Sedangkan Wikipedia
memberikan sedikit dokumen karena corpus yang digunakan
berjumlah 13 file html berbeda dengan Google dan Bing yang
berjumlah 130 file html. Walaupun dokumen dan ekstraksi
jawaban Bing lebih besar dari Google tetapi Bing gagal
mengekstraksi jawaban untuk dua corpus, sedangkan Google
hanya gagal untuk satu corpus.
Keywords—question answering system; corpus; wikipedia; Google;
Bing; retrieval; ekstraksi jawaban