Penggunaan Metode Bagging dengan Menerapkan Data Balancing pada Churn Prediction Untuk Perusahaan Telekomunikasi

ZK. Abdurahman Baizal, Moch. Arif Bijaksana, Ina Rofi’atun Nasihati

Abstract

Churn Prediction merupakan salah satu aplikasi data mining yang bertujuan untuk memprediksi para
pelanggan yang berpotensial untuk churn. Churn Prediction merupakan salah satu kasus kelas imbalance dan
churn merupakan kelas minor. Terdapat beberapa cara untuk mengatasi permasalahan imbalance class yang
melekat pada kasus churn ini. Salah satu contohnya dengan cara melakukan balancing terhadap data training
atau dengan cara menggunakan metode yang khusus dapat menyelesaikan permasalahan imbalance class ini.
Analisis yang dilakukan pada penelitian ini adalah mengetahui apakah metode Bagging dan Lazy Bagging
dapat dijadikan solusi dalam mengklasifikasikan data churn. Dalam mendukung penelitian ini, dibuat
perangkat lunak yang mengimplementasikan metode Bagging, dan Lazy Bagging. Pengujian dilakukan dengan
menggunakan data salah satu perusahaan telekomunikasidi Indonesia. Sebagai metode pembanding adalah
Boosting Clementine 10.1 dan C5.0 Clementine 10.1. Analisis dilakukan dengan melakukan penghitungan
akurasi model churn prediction yang dinyatakan dalam bentuk lift curve, top decile dan gini coefficient serta fmeasure
untuk penghitungan akurasi data yang imbalance. Dari analisa yang dilakukan, metode Bagging dapat
memprediksikan data churn jika dilakukan balancing terlebih dahulu terhadap data training yang digunakan.
Tetapi dari parameter lift curve, gini coefficient, ternyata Lazy Bagging menghasilkan nilai yang lebih baik
untuk data yang sangat imbalance (tanpa balancing)

Kata kunci : bagging, lazy bagging, boosting , data imbalance, churn prediction, akurasi.

Full Text:

PDF