Cara mengolah Text Preprocessing pada data daerah terntentu di website OLX dengan menggunakan aplikasi R Studio

 

Assalamu'alaikum Wr. Wb

Halo Sobat EduTek !!!
Pada kesempatan ini  saya akan membagikan sedikit tutoria, cara mengolah data text preprocessing dengan menggunakan aplikasi R Studio dan data yang akan kita proses ialah data daerah di sidoarjo pada website OLX.

 Langsung saja!!!

1. yang pertama, yaitu install terlebih dahulu packages "rvest dan xml2" 

    install.packages("rvest")

    install.packages("xml2")

   Jika sudah terinstal, Sekarang pengecekan kedua packages tersebut dengan menggunakan syntax :

    library("rvest")

   Kemudian kita lakukan pencarian packages yang aktif yang sudah kita install tadi       dengan menggunakan syntax :

    search()

   Berikutnya proses pendataan data packages nomor 2 pada "rvest" untuk mengetahui dengan menggunakan syntax :

    ls(2)

2. Langkah berikutnya, masukan url yang akan diambil datanya. Disini kami akan mengambil url dari web OLX. Data yang akan kami ambil adalah data daerah postingan barang yang di jual pada web OLX.  Cara  untuk memanggil data dari web OLX dengan menggunakan syntax : 

    url <- "https://www.olx.co.id/sidoarjo-kab_g4000202/motor-bekas_c200"

   Selanjutnya, membaca halaman web yang sebelumnya sudah kita panggil tadi dengan menggunakan syntax :

    webpage <- read_html(url)

    webpage

3. Langkah berikutnya, membaca atau juga mengambil data dari web OLX yang kita butuhkan. Data yang diambil dari web tersebut adalah data daerah postingan barang. Caranya dengan  menggunakan syntax : 

    daerah_html <- html_nodes(webpage,'.tjgMj')

data ini '.tjgMj' diambil pada data yang ada pada halaman web OLX tepatnya postingan barang dengan arah data yang kita inginkan lalu klik kanan, muncul menu pilihan dan klik inspek elemen lalu pilih data yang kita inginkan berikut adalah foto saat pengambilan data pada web OLX :

 


Berikutnya mengubah data uraian menjadi teks dengan menggunakan syntax :

     daerah <- html_text(daerah_html)

    daerah

Jika data sudah dipanggil dan juga sudah diubah menjadi teks maka hasil dari data                tersebut dapat dilihat dengan menggunakan syntax : 

     head(daerah)

sekarang kita run terlebih dahulu apakah data yang kita ambil bisa atau tidak. Cara untuk Running/ proses data pada R Studio ialah "Ctrl+Enter" pada setiap baris syntax.Berikut adalah hasil pengambilan data/ scrapping data :

Nah Teknik diatas merupakan teknik scrapping data / pengambilan data, karena nanti kita akan mengambil data secara spesifik dan cleaning data pada daerah postingan penjualan pada web OLX.

Sekarang kita akan mere-processing data yang kita ambil tadi.

4. Langkah berikutnya, yaitu mengambil data lalu membersihkan atau proses cleaning data dimana pada hasil scrapping data ada tulisan Sidoarjo Kab. jadi kita akan menghilangkan data tersebut dan membuat data tersebut bersih.

Berikut syntax cleaning data untuk ",Sidoarjo  Kab." :

    clear_sidoarjo<-gsub(",Sidoarjo  Kab.","",daerah)

    clear_sidoarjo

 lalu proses seperti biasa " Ctrl+Enter ", hasilnya ialah :

Sebelum

Sesudah

Nah teknik Text Prepocessing selesai, data yang kita ambil merupakan data daerah di sidoarjo pada postingan penjualan di web OLX.

Setelah data tersebut sudah bersih, maka data tersebut dapat disimpan dalam format .csv yang artinya data yang kita ambil, kita pindahkan ke microsoft excel, caranya dengan menggunakan syntax :

    - write.csv(clear_sidoarjo,"D://sript//olx.csv")

Hasil proses diatas menghasilkan file Ms.Excel yang berisi data yang sudah di ambil. berikut adalah hasil datanya di microsoft excel dengan data diambil pada web OLX :

 

 

Nah Itu tadi adalah Cara mengolah Text Preprocessing pada data daerah terntentu di website OLX, 

Sekian dari saya, bila ada kesalahan penulisan mohon dimaafkan, bila masih bingung mengenai cara di atas bisa hubungi saya.

Akhir kata,
Wassalamu 'alaikum Wr. Wb

--------------------------------------------------------------------------------------------------------------

Nama Anggota : 

- Arsha Setya Pradita     (171080200186)



Ada juga tutorial berupa video dengan pembahasan yang sama, langsung saja klik link dibawah ini:

LINK
------------------------------------------------
KLIK DISINI -----> Youtube

KLIK DISINI ----->  Blogspot

Komentar

Postingan populer dari blog ini

Tutorial cara menghitung soal K-Means pada aplikasi Rapid Miner

Cara mengambil data / Scrapping Data pada data daerah wilayah sidoarjo pada Web OLX dengan menggunakan Aplikasi R-Studio

Tutorial cara menghitung dataset client pada rumus Algoritma Apriori dengan menggunakan Aplikasi Rapid Miner