Main Article Content
Abstract
Tujuan dari penelitian ini adalah mengidentifikasi konten yang mengandung makna perundungan secara daring (Cyberbullying) pada media sosial. Dalam kasus ini, penulis memilih media sosial Twitter sebagai obyek penelitian. Setidaknya, ada 1971 baris data yang telah dikumpulkan. Data - data tersebut berisi dua jenis cuitan baik cuitan yang memiliki kecenderungan Cyberbullying dan yang tidak. Untuk mencapai tujuan penelitian, peneliti menggunakan lima langkah penelitian, yaitu pengumpulan data, preprocessing, ekstraksi fitur, klasifikasi, dan evaluasi. Empat algoritma Machine Learning diimplementasikan dalam penelitian ini, yaitu K-Nearest Neighbor (KNN), Multinomial Naïve Bayes, Logistic Regression, dan Support Vector Machine with linear kernel (SVM). Dapat disimpulkan bahwa keempat algoritma tersebut memiliki performa yang relatif sama. Akurasi dari masing masing algoritma dituliskan sebagai berikut Multinomial Naïve Bayes 0.9616, Logistic Regression 0.9949, Support Vector Machine with linear kernel 0.9975, and K-Nearest Neighbor (KNN) 0.9188.
Keywords
Twitter
Cyberbullying
Machine Learning
Classification