Main Article Content
Abstract
Perkembangan teknologi informasi mengarahkan perintah komputer tidak hanya dari keyboard, mouse ataupun touchscreen, tetapi dapat menggunakan suara atau pikiran. Persoalan utama dari instruksi suara adalah identifikasi kata yang diucapkan sehingga perlu proses ekstraksi yang tepat. Beberapa penelitian terdahulu mengidentifikasi suara dengan menggunakan Mel-Frequency Cepstrum Coefficients (MFCC) untuk mengoperasikan komputer, instruksi lampu otomatis dan penguncian pintu. Sementara penelitian lain menggunakan Linier Predictive Cepstral Coefficients sebagai pembanding MFCC dengan hasil akurasi MFCC lebih baik ketika mengenali suara dalam kondisi bising. MFCC memiliki kemiripan dengan sistem pendengaran manusia serta merupakan perhitungan yang kuat dan hemat biaya. Penelitian ini telah membuat sistem identifikasi kata. Identifikasi dibagi atas tiga kelas yaitu “Klasikâ€, “Dangdut†dan “Popâ€, yang digunakan untuk aksi mengoperasikan tiga jenis lagu yang sesuai. Sinyal suara diekstraksi menggunakan MFCC yang kemudian diidentifikasi menggunakan Learning Vector Quantization (LVQ). Data latih dan data uji didapatkan dari enam naracoba dan 10 kali perulangan dari yang mengucapkan kata “Klasikâ€, “Dangdut†dan “Pop†secara terpisah. Kemudian sinyal suara yang direkam dilewatkan praproses menggunakan Histogram Equalization, DC Removal dan Pre-emphasize untuk mereduksi noise dari sinyal suara, yang kemudian diekstraksi menggunakan MFCC. Spektrum frekuensi yang dihasilkan dari MFCC diidentifikasikan menggunakan LVQ setelah melewati proses pelatihan terlebih dahulu. Hasil penelitian diperoleh akurasi sebesar 92% untuk identifikasi data yang telah dilatih. Sedangkan pengujian data baru diperoleh akurasi sebesar 46%.