Main Article Content
Abstract
Penanganan imbalance data dilakukan untuk menangani distribusi data yang tidak imbangnya antar class mayoritas dan class minoritas, hal ini dapat mengakibatkan Machine Learning keliru dalam melakukan klasifikasi. Aritkel ini menyajikan reviu jurnal literatur yang pernah dilakukan dalam kurun tahun 2013-2021 dalam penanganan imbalance data. Penanganan imbalance data digunakan agar distribusi antar data class mayoritas dan class minoritas menjadi seimbang. Metode, akurasi atau performa dan dataset yang digunakan oleh literatur dalam klasifikasi akan dibandingkan. Berdasarkan reviu, performa yang dihasilkan cukup beragam dan terdapat beberapa teknik yang dapat dilakukan untuk menangani Imbalance data. Teknik-teknik tersebut bekerja dengan mendorong class minoritas mengubah distribusi class minoritas dan mayoritas. Teknik yang digunakan yaitu Random oversampling dan Random undersampling pada kemungkinan penyakit stroke. Penanganan Imbalance data dilakukan antar class 1 (Stroke) dan class 0 (tidak stroke) dengan distribusi antar data sama. Hasil yang didapatkan pada penggunaan teknik random oversampling mendapat performa yang lebih tinggi yaitu 95% daripada teknik random undersampling yang mendapat performa 76%.
Article Details
License
Copyright (c) 2021 Jurnal Sains, Aplikasi, dan Teknologi Informasi (SNATi)
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
How to Cite
Mutmainah, S. (2021). PENANGANAN IMBALANCE DATA PADA KLASIFIKASI KEMUNGKINAN PENYAKIT STROKE. Jurnal Sains, Nalar, Dan Aplikasi Teknologi Informasi, 1(1), 10–16. https://doi.org/10.20885/snati.v1i1.2