IMPLEMENTASI DAN ANALISA GRANULAR SUPPORT VECTOR MACHINE DENGAN DATA CLEANING (GSVM-DC) UNTUK E-MAIL SPAM FILTERING

Moh. Mahsus, ZK. Abdurahman Baizal, Shaufiah .

Abstract

E-mail spam adalah pembanjiran internet dengan banyak salinan pesan yang sama, dan memaksa pengguna internet untuk menerimanya walupun itu tidak dinginkan. Pengguna e-mail membutuhkan waktu yang lebih lama untuk membaca dan memutuskan apakah e-mail yang diterima tersebut adalah spam atau bukan. Berdasarkan motivasi tersebut e-mail spam filtering banyak dikembangkan. Banyak teknik yang digunakan untuk pembangunan sebuah e-mail spam filtering, dan salah satunya dengan menggunakan metode Support Vector Machines karena terbukti memiliki kemampuan generalisasi yang baik. Untuk meningkatkan akurasi dan efisiensi pemrosesan, SVM dimodifikasi dengan paradigma granular computing dengan memecah data menjadi bagian-bagian kecil informasi serta metode data cleaning yang digunakan untuk mengurangi jumlah data yang akan dilatih. Dengan modifikasi yang disebut Granular Support Vector Machines with Data Cleaning ini diperoleh hasil akurasi sebesar 97,2%, lebih baik daripada menggunakan SVM biasa dengan hasil akurasi sebesar 96,6%.

Full Text:

PDF