Main Article Content

Abstract

AbstractWeb scraping merupakan suatu teknik untuk melakukan ekstraksi sejumlah data yang terdapat pada website tertentu. Data menjadi kebutuhan yang sangat penting khususnya bagi para peneliti dalam mencari suatu fenomena ataupun dalam mencari informasi. Web scraping banyak digunakan dalam penelitian seperti pengembangan web, analisis sentimen, dan analisis perbandingan harga. Berdasarkan penelitian yang telah menggunakan metode web scraping, terdapat kebutuhan data yang berbeda-beda dari penelitian-penelitian tersebut. Perbedaan ini menjadikan metode web scraping semakin berkembang dan beragam. Adapun metode tersebut seperi Xpath Selector, CSS Selector, JSON Parsing, HTML Parsing, dan metode lainnya. Namun dari berbagai metode web scraping yang ada, masing-masing memiliki karakteristik pengambilan data yang berbeda-beda dan tidak dapat dilakukan pada seluruh website karena adanya proteksi ataupun jenis dari website yang ingin dituju. Maka dari itu, paper ini melakukan kajian literatur untuk melihat perbedaan dan memberi kesimpulan dari berbagai metode web scraping yang telah digunakan pada penelitian sebelumnya. Kajian ini juga melihat dari sisi performa metode web scraping yang telah dilakukan. Hasil dari penelitian ini ditemukan bahwa penelitian mengenai implementasi web scraping banyak dilakukan dan penggunaan metode web scraping dengan mengekstraksi dokumen HTML juga banyak digunakan pada penelitian sebelumnya.

Article Details