Main Article Content
Abstract
Abstract—Question Classification (QC) merupakan salah satu
komponen penting dalam Question Answering System (QAS)
karena akan berpengaruh langsung terhadap kinerja
keseluruhan QAS. Sejauh ini metode yang disarankan oleh
komunitas QAS untuk QC adalah menggunakan Support
Vector Machines (SVM). Untuk melakukan klasifikasi teks
dibutuhkan fitur berdimensi tinggi, banyaknya fitur dapat
mengurangi performa SVM. Stemming adalah teknik yang
digunakan untuk mereduksi term suatu dokumen.
Penggunaan stemming akan berpengaruh terhadap sintaksis
dan semantik suatu pertanyaan. Penelitian ini bertujuan untuk
mengetahui pengaruh stemming terhadap akurasi SVM. Telah
dilakukan dua percobaan klasifikasi pertanyaan, yaitu dengan
menggunakan SVM dan SVM+stemming. Hasil rata-rata
akurasi dari percobaan diperoleh sebesar 86.75% untuk SVM
dan 87.48% SVM+stemming sehingga telah terjadi kenaikan
akurasi sebesar 0.73%. Walaupun peningkatan akurasi tidak
signifikan tetapi stemming dapat mereduksi fitur tanpa
menurunkan akurasi SVM.
Keywords—question classification, question answering system,
support vector machines, stemming