Cara mengolah Text Preprocessing pada data daerah terntentu di website OLX dengan menggunakan aplikasi R Studio
Assalamu'alaikum Wr. Wb
Halo Sobat EduTek !!!
Pada kesempatan ini saya akan membagikan sedikit tutoria, cara mengolah data text preprocessing dengan menggunakan aplikasi R Studio dan data yang akan kita proses ialah data daerah di sidoarjo pada website OLX.
Langsung saja!!!
1. yang pertama, yaitu install terlebih dahulu packages "rvest dan xml2"
install.packages("rvest")
install.packages("xml2")
Jika sudah terinstal, Sekarang pengecekan kedua packages tersebut dengan menggunakan syntax :
library("rvest")
Kemudian kita lakukan pencarian packages yang aktif yang sudah kita install tadi dengan menggunakan syntax :
search()
Berikutnya proses pendataan data packages nomor 2 pada "rvest" untuk mengetahui dengan menggunakan syntax :
ls(2)
2. Langkah berikutnya, masukan url yang akan diambil datanya. Disini kami akan mengambil url dari web OLX. Data yang akan kami ambil adalah data daerah postingan barang yang di jual pada web OLX. Cara untuk memanggil data dari web OLX dengan menggunakan syntax :
url <- "https://www.olx.co.id/sidoarjo-kab_g4000202/motor-bekas_c200"
Selanjutnya, membaca halaman web yang sebelumnya sudah kita panggil tadi dengan menggunakan syntax :
webpage <- read_html(url)
webpage
3. Langkah berikutnya, membaca atau juga mengambil data dari web OLX yang kita butuhkan. Data yang diambil dari web tersebut adalah data daerah postingan barang. Caranya dengan menggunakan syntax :
daerah_html <- html_nodes(webpage,'.tjgMj')
data ini '.tjgMj' diambil pada data yang ada pada halaman web OLX tepatnya postingan barang dengan arah data yang kita inginkan lalu klik kanan, muncul menu pilihan dan klik inspek elemen lalu pilih data yang kita inginkan berikut adalah foto saat pengambilan data pada web OLX :
Berikutnya mengubah data uraian menjadi teks dengan menggunakan syntax :
daerah <- html_text(daerah_html)
daerah
Jika data sudah dipanggil dan juga sudah diubah menjadi teks maka hasil dari data tersebut dapat dilihat dengan menggunakan syntax :
head(daerah)
sekarang kita run terlebih dahulu apakah data yang kita ambil bisa atau tidak. Cara untuk Running/ proses data pada R Studio ialah "Ctrl+Enter" pada setiap baris syntax.Berikut adalah hasil pengambilan data/ scrapping data :
Nah Teknik diatas merupakan teknik scrapping data / pengambilan data, karena nanti kita akan mengambil data secara spesifik dan cleaning data pada daerah postingan penjualan pada web OLX.
Sekarang kita akan mere-processing data yang kita ambil tadi.
4. Langkah berikutnya, yaitu mengambil data lalu membersihkan atau proses cleaning data dimana pada hasil scrapping data ada tulisan Sidoarjo Kab. jadi kita akan menghilangkan data tersebut dan membuat data tersebut bersih.
Berikut syntax cleaning data untuk ",Sidoarjo Kab." :
clear_sidoarjo<-gsub(",Sidoarjo Kab.","",daerah)
clear_sidoarjo
lalu proses seperti biasa " Ctrl+Enter ", hasilnya ialah :
Sebelum
SesudahNah teknik Text Prepocessing selesai, data yang kita ambil merupakan data daerah di sidoarjo pada postingan penjualan di web OLX.
Setelah data tersebut sudah bersih, maka data tersebut dapat disimpan dalam format .csv yang artinya data yang kita ambil, kita pindahkan ke microsoft excel, caranya dengan menggunakan syntax :
- write.csv(clear_sidoarjo,"D://sript//olx.csv")
Hasil proses diatas menghasilkan file Ms.Excel yang berisi data yang sudah di ambil. berikut adalah hasil datanya di microsoft excel dengan data diambil pada web OLX :
Nah Itu tadi adalah Cara mengolah Text Preprocessing pada data daerah terntentu di website OLX,
Sekian dari saya, bila ada kesalahan penulisan mohon dimaafkan, bila masih bingung mengenai cara di atas bisa hubungi saya.
Akhir kata,
Wassalamu 'alaikum Wr. Wb
--------------------------------------------------------------------------------------------------------------
Nama Anggota :
- Arsha Setya Pradita (171080200186)
Ada juga tutorial berupa video dengan pembahasan yang sama, langsung saja klik link dibawah ini:
Komentar
Posting Komentar