Pemodelan Berbasis Konsep untuk Kategorisasi Artikel Berita Berbahasa Indonesia

Candra Triawati, M. Arif Bijaksana, Nur Indrawati, Widyanto Adi Saputro

Abstract

Semakin pesatnya penggunaan Internet memacu pertumbuhan ketersediaan data, yang pada gilirannya
memerlukan dukungan dari teknologi informasi untuk mengubah data tersebut menjadi suatu informasi, dan
selanjutnya menjadi suatu pengetahuan yang bermanfaat. Text mining sebagai upaya pengelolaan dokumen
yang berupa teks, timbul dari kebutuhan akan pemahaman dan pemanipulasian dokumen teks untuk
mendapatkan informasi tertentu dari sekumpulan dokumen teks dengan memanfaatkan teknologi komputer.
Sebagian besar teknik pengelompokkan dokumen dalam text mining bekerja berdasarkan analisis dari frekuensi
kemunculan kata atau frasa pada dokumen tanpa menghiraukan sisi semantis, sehingga ada kemungkinan dua
kata atau frasa mempunyai frekuensi yang sama padahal salah satu kata atau frasa tersebut memberikan
kontribusi yang lebih besar dalam proses penentuan topik sebuah dokumen. Hal ini tentu saja menyebabkan
hasil yang diperoleh kurang akurat. Untuk memperoleh hasil yang lebih akurat, diperlukan pendekatan baru
yang melibatkan peran semantis suatu kata dalam kalimat. Salah satu pendekatan baru tersebut adalah
pemodelan berbasis konsep. Tulisan ini membahas teori pemodelan berbasis konsep dan aplikasi pemodelan
berbasis konsep dalam pemrosesan dokumen teks, khususnya pada kategorisasi artikel berita berbahasa
Indonesia.

Kata Kunci: text mining, kategorisasi, pemodelan berbasis konsep

Full Text:

PDF