Cara mengambil data / Scrapping Data pada data daerah wilayah sidoarjo pada Web OLX dengan menggunakan Aplikasi R-Studio
Assalamu'alaikum Wr. Wb
Halo Sobat EduTek !!!
Pada
kesempatan ini saya akan membagikan sedikit tutorial, cara mengambil
data /Scrapping data, dengan menggunakan aplikasi R Studio dan data
yang akan kita proses ialah data daerah di sidoarjo pada website OLX.
Langsung saja!!!
1. yang pertama, yaitu install terlebih dahulu packages "rvest dan xml2"
install.packages("rvest")
install.packages("xml2")
Jika sudah terinstal, Sekarang pengecekan kedua packages tersebut dengan menggunakan syntax :
library("rvest")
Kemudian kita lakukan pencarian packages yang aktif yang sudah kita install tadi dengan menggunakan syntax :
search()
Berikutnya proses pendataan data packages nomor 2 pada "rvest" untuk mengetahui dengan menggunakan syntax :
ls(2)
2. Langkah berikutnya, masukan url yang akan diambil datanya. Disini kami akan mengambil url dari web OLX. Data yang akan kami ambil adalah data daerah postingan barang yang di jual pada web OLX. Cara untuk memanggil data dari web OLX dengan menggunakan syntax :
url <- "https://www.olx.co.id/sidoarjo-kab_g4000202/motor-bekas_c200"
Selanjutnya, membaca halaman web yang sebelumnya sudah kita panggil tadi dengan menggunakan syntax :
webpage <- read_html(url)
webpage
3. Langkah berikutnya, membaca atau juga mengambil data dari web OLX yang kita butuhkan. Data yang diambil dari web tersebut adalah data daerah postingan barang. Caranya dengan menggunakan syntax :
daerah_html <- html_nodes(webpage,'.tjgMj')
data ini '.tjgMj' diambil pada data yang ada pada halaman web OLX tepatnya postingan barang dengan arah data yang kita inginkan lalu klik kanan, muncul menu pilihan dan klik inspek elemen lalu pilih data yang kita inginkan berikut adalah foto saat pengambilan data pada web OLX :
Berikutnya mengubah data uraian menjadi teks dengan menggunakan syntax :
daerah <- html_text(daerah_html)
daerah
Jika data sudah dipanggil dan juga sudah diubah menjadi teks maka hasil dari data tersebut dapat dilihat dengan menggunakan syntax :
head(daerah)
sekarang kita run terlebih dahulu apakah data yang kita ambil bisa atau tidak. Cara untuk Running/ proses data pada R Studio ialah "Ctrl+Enter" pada setiap baris syntax.Berikut adalah hasil pengambilan data/ scrapping data :
Teknik diatas merupakan teknik scrapping data / pengambilan data,
Nah Itu tadi adalah Cara mengambil data / Scrapping Data pada data daerah wilayah sidoarjo pada Web OLX
Sekian dari saya, bila ada kesalahan penulisan mohon dimaafkan, bila masih bingung mengenai cara di atas bisa hubungi saya.
Akhir kata,
Wassalamu 'alaikum Wr. Wb
--------------------------------------------------------------------------------------------------------------
Nama Anggota :
- Arsha Setya Pradita (171080200186)
Ada juga tutorial berupa video dengan pembahasan yang sama, langsung saja klik link dibawah ini:
Komentar
Posting Komentar