Main Article Content
Abstract
Mudah dan murahnya proses pengumpulan data biologi molekuler saat ini menyebabkan ukuran basis data genetika meningkat dengan pesat. Hal ini meningkatkan kebutuhan akan alat bantu komputasi untuk menganalisa data tersebut. Salah satu task dasar dalam menganalisa data biologi molekuler adalah pengelompokkan dari kumpulan sequence protein. Metode komputasi yang banyak dikaji dalam bioinformatika saat ini adalah hidden markov model (HMM). HMM menggunakan algoritma pembelajaran Baum-Welch untuk mengestimasi parameter – parameter untuk menemukan model terbaik yang mendeskripsikan kumpulan sequence (training set). Telah dilakukan penelitian penerapan metode HMM dalam melakukan pengelompokkan (clustering) dari kumpulan sequence protein globin. Protein globin merupakan protein yang terkandung di dalam darah. Sequence protein globin yang digunakan dalam penelitian ini berasal dari basisdata UNIPROT. Sistem yang dibangun dalam penelitian ini memanfaatkan library biojava. Hasil eksperimen menunjukkan bahwa metode HMM dapat digunakan untuk melakukan pengelompokkan (clustering) sequence protein.
Kata Kunci : Hidden Markov Model, Clustering, Sequence Protein Globin,UNIPROT.