Main Article Content
Abstract
Inverted index yang diterapkan pada kebanyakan sistem pemerolehan informasi dan mesin pencari web terbukti sangat efisien untuk menjawab query. Implementasi sistem pemerolehan menggunakan sistem manajemen basisdata akan memperoleh kelebihan yang ditawarkan. Dalam paper ini peneliti mencoba melakukan penerapan inverted index ke dalam ORDBMS untuk mendukung model pemerolehan boolean untuk operasi dasar AND, OR dan NOT. Operasi SQL dengan operasi relational algebra dicoba diterapkan pada ORDBMS untuk mendukung query seperti yang diharapkan saat menggunakan inverted index. Ujicoba dengan
menggunakan corpus 5336 dokumen berita teknologi dalam eksperimen di laboratorium menghasilkan hampir 51262 term untuk penerapan inverted index ke dalam RDBMS. Implementasi operasi boolean dasar AND, OR atau NOT menunjukkan bahwa peningkatan jumlah operator boolean yang digunakan dari nol sampai enam membutuhkan waktu yang meningkat secara linier dengan tingkat korelasi di atas 0,99. Dengan spesifikasi sistem yang digunakan, untuk query dengan kata yang dimiliki sekitar 1 sampai 2 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,073detik sampai sekitar 0,203 detik untuk enam operator. Sedangkan untuk query dengan kata yang dimiliki sekitar 5000 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,094 detik sampai sekitar 0,474 detik untuk enam operator.
menggunakan corpus 5336 dokumen berita teknologi dalam eksperimen di laboratorium menghasilkan hampir 51262 term untuk penerapan inverted index ke dalam RDBMS. Implementasi operasi boolean dasar AND, OR atau NOT menunjukkan bahwa peningkatan jumlah operator boolean yang digunakan dari nol sampai enam membutuhkan waktu yang meningkat secara linier dengan tingkat korelasi di atas 0,99. Dengan spesifikasi sistem yang digunakan, untuk query dengan kata yang dimiliki sekitar 1 sampai 2 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,073detik sampai sekitar 0,203 detik untuk enam operator. Sedangkan untuk query dengan kata yang dimiliki sekitar 5000 dokumen, waktu yang dibutuhkan untuk penggunaan satu operator sekitar 0,094 detik sampai sekitar 0,474 detik untuk enam operator.