Postingan

uas_TextMining_2_UMSIDA

Gambar
  Assalamu'alaikum Wr. Wb Halo Sobat EduTek !!! Pada kesempatan ini  saya akan membagikan sedikit tutorial sekaligus memenuhi pengerjaan UAS pada mata kuliah Web & Text Mining, cara meringkas text / Text Summarization dengan menggunakan bahasa pemrograman Python dan data yang akan kita ambil yaitu berita dari situs CNNINDONESIA.   Langkah - langkahnya yaitu : 1. Install gensim menggunakan perintah PIP dengan mengetikan: pip install gensim     2. Masukkan data library dari gensim dengan memberikan source code seperti berikut : from gensim.summarization.summarizer import summarize  3.  Lalu tambahkan source code untuk memproses Dataset dari data berita pada situs CNNINDONESIA berikut source codenya : text = ' ' ' Jakarta, CNN Indonesia -- Kementerian ESDM menyatakan realisasi investasi di sektor mineral dan batu bara (minerba) tidak mencapai target pada 2020. Realisasinya cuma US$4,05 miliar atau 52,32 persen dari target US$7,74 miliar. "P...

Cara Text Preprocessing pada dataset komentar twitter dengan menggunakan Python ( UTS WEB & TEXT MINING 7/A2 UMSIDA)

Gambar
  Assalamu'alaikum Wr. Wb Halo Sobat EduTek !!! Pada kesempatan ini  saya akan membagikan sedikit tutorial sekaligus memenuhi pengerjaan UTS pada mata kuliah Web & Text Mining, cara mengolah data text preprocessing dengan menggunakan Python dan data yang akan kita proses ialah dataset pada komentar twitter. Langsung saja!!! 1.) yang pertama tulis code "import re", fungsi ini untuk menghapus angka pada komentar yang ada pada komentar twitter. 2.) lalu kita masukkan dataset komentar twitter ke code "kalimat" .   dataset yang diambil pada komentar twitter :   3.) lalu tambahkan code "hasil = re.sub (r"\d", "", kalimat)                                                   print (hasil)" . untuk mengeksekusi hasil dataset yang akan kita hilangkan angkanya . 4.) dan hasilnya seperti ini: source code : import  re ka...

Cara mengambil data / Scrapping Data pada data daerah wilayah sidoarjo pada Web OLX dengan menggunakan Aplikasi R-Studio

Gambar
  Assalamu'alaikum Wr. Wb Halo Sobat EduTek !!! Pada kesempatan ini  saya akan membagikan sedikit tutorial, cara mengambil data /Scrapping data, dengan menggunakan aplikasi R Studio dan data yang akan kita proses ialah data daerah di sidoarjo pada website OLX.  Langsung saja!!! 1. yang pertama, yaitu install terlebih dahulu packages "rvest dan xml2"       install.packages("rvest")     install.packages("xml2")    Jika sudah terinstal, Sekarang pengecekan kedua packages tersebut dengan menggunakan syntax :     library("rvest")    Kemudian kita lakukan pencarian packages yang aktif yang sudah kita install tadi       dengan menggunakan syntax :     search()    B erikutnya proses pendataan data packages nomor 2 pada "rvest" untuk mengetahui dengan menggunakan syntax :     ls(2) 2. Langkah berikutnya, masukan url yang akan diambil datanya...

Cara mengolah Text Preprocessing pada data daerah terntentu di website OLX dengan menggunakan aplikasi R Studio

Gambar
  Assalamu'alaikum Wr. Wb Halo Sobat EduTek !!! Pada kesempatan ini  saya akan membagikan sedikit tutoria, cara mengolah data text preprocessing dengan menggunakan aplikasi R Studio dan data yang akan kita proses ialah data daerah di sidoarjo pada website OLX.  Langsung saja!!! 1. yang pertama, yaitu install terlebih dahulu packages "rvest dan xml2"       install.packages("rvest")     install.packages("xml2")    Jika sudah terinstal, Sekarang pengecekan kedua packages tersebut dengan menggunakan syntax :     library("rvest")    Kemudian kita lakukan pencarian packages yang aktif yang sudah kita install tadi       dengan menggunakan syntax :     search()    B erikutnya proses pendataan data packages nomor 2 pada "rvest" untuk mengetahui dengan menggunakan syntax :     ls(2) 2. Langkah berikutnya, masukan url yang akan diambil datanya. D...

Tutorial cara menghitung dataset client pada rumus Algoritma Apriori dengan menggunakan Aplikasi Rapid Miner

Gambar
Halo Sobat EduTek !!! Pada kesempatan ini  saya akan membagikan sedikit tutorial menggunakan rapid miner untuk menghitung dataset client dengan menggunakan rumus Algoritma Apriori dan juga untuk memenuhi nilai UAS saya pada mata kuliah Data Mining. ( Sebelum kita menuju ke tutorial, saya akan menjelaskan sedikit, materi mengenai Algoritma Apriori dan  Rapid Miner) Apriori adalah suatu metode untuk mencari pola hubungan antar satu atau lebih item dalam suatu dataset. Rapid Miner adalah perangkat lunak ilmu data yang menyediakan lingkungan terintegrasi untuk persiapan data, pembelajaran mesin, pembelajaran dalam, penambangan teks, dan analisis prediktif. Oke kita langsung ke tutorialnya ! Berikut adalah Dataset Client yang ada pada soal UAS : 1. Dataset Gambar 1 merupakan tabel data set dari 25 client dengan design yang diminta berbeda - beda. Dari 25 client  tersebut akan kita tentukan nilai support, confidance, berapa item setnya, dan menemukan aturan "...

Tutorial cara menghitung soal K-Means pada aplikasi Rapid Miner

Gambar
Halo Sobat EduTek !!! Pada kesempatan ini  saya akan membagikan sedikit tutorial menggunakan rapid miner untuk menghitung K-Means pada Dataset dan juga untuk memenuhi nilai UTS saya pada mata kuliah Data Mining. ( Sebelum kita menuju ke tutorial, saya akan menjelaskan sedikit, materi mengenai K-means, Rapid Miner dan Dataset )     K-means adalah salah satu algoritma clustering. Tujuan algoritma ini yaitu untuk membagi data menjadi beberapa kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas.     Rapid Miner adalah perangkat lunak ilmu data yang menyediakan lingkungan terintegrasi untuk persiapan data, pembelajaran mesin, pembelajaran dalam, penambangan teks, dan analisis prediktif.     Dataset ialah adalah objek yang merepresentasikan data dan relasinya di memory. Strukturnya mirip dengan data di database. Dataset berisi koleksi dari datatable dan datarelation. Oke kita langsung ke tutorialnya ! Berikut ada...