Main Article Content

Abstract

Penanganan imbalance data dilakukan untuk menangani distribusi data yang tidak imbangnya antar class mayoritas dan class minoritas, hal ini dapat mengakibatkan Machine Learning keliru dalam melakukan klasifikasi. Aritkel ini menyajikan reviu jurnal literatur yang pernah dilakukan dalam kurun tahun 2013-2021 dalam penanganan imbalance data. Penanganan imbalance data digunakan agar distribusi antar data class mayoritas dan class minoritas menjadi seimbang. Metode, akurasi atau performa dan dataset yang digunakan oleh literatur dalam klasifikasi akan dibandingkan. Berdasarkan reviu, performa yang dihasilkan cukup beragam dan terdapat beberapa teknik yang dapat dilakukan untuk menangani Imbalance data. Teknik-teknik tersebut bekerja dengan mendorong class minoritas mengubah distribusi class minoritas dan mayoritas. Teknik yang digunakan yaitu Random oversampling dan Random undersampling pada kemungkinan penyakit stroke. Penanganan Imbalance data dilakukan antar class 1 (Stroke) dan class 0 (tidak stroke) dengan distribusi antar data sama. Hasil yang didapatkan pada penggunaan teknik random oversampling mendapat performa yang lebih tinggi yaitu 95% daripada teknik random undersampling yang mendapat performa 76%.

Article Details

How to Cite
Mutmainah, S. (2021). PENANGANAN IMBALANCE DATA PADA KLASIFIKASI KEMUNGKINAN PENYAKIT STROKE. Jurnal Sains, Nalar, Dan Aplikasi Teknologi Informasi, 1(1), 10–16. https://doi.org/10.20885/snati.v1i1.2