Tutorial cara menghitung soal K-Means pada aplikasi Rapid Miner

Halo Sobat EduTek !!!
Pada kesempatan ini  saya akan membagikan sedikit tutorial menggunakan rapid miner untuk menghitung K-Means pada Dataset dan juga untuk memenuhi nilai UTS saya pada mata kuliah Data Mining.

( Sebelum kita menuju ke tutorial, saya akan menjelaskan sedikit, materi mengenai K-means, Rapid Miner dan Dataset )

    K-means adalah salah satu algoritma clustering. Tujuan algoritma ini yaitu untuk membagi data menjadi beberapa kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas.

    Rapid Miner adalah perangkat lunak ilmu data yang menyediakan lingkungan terintegrasi untuk persiapan data, pembelajaran mesin, pembelajaran dalam, penambangan teks, dan analisis prediktif.

    Dataset ialah adalah objek yang merepresentasikan data dan relasinya di memory. Strukturnya mirip dengan data di database. Dataset berisi koleksi dari datatable dan datarelation.

Oke kita langsung ke tutorialnya !

Berikut adalah soal materi K-Means :
1.    Data 2
Tabel 1 merupakan tabel data set dari 15 mahasiswa yang memprogramkan mata kuliah Data mining. Dari 15 mahasiswa tersebut akan dikelompokkan menjadi 3 bagian yaitu kelompok pintar, sedang dan kurang.
                                                                  Tabel 1. Dataset
 1.   Setelah menentukan dataset, maka perlu menentukkan jumlah cluster yang akan dibentuk.   Adapun  cluster yang akan dibentuk antara lain :

2.    Tetapkan C pusat cluster awal secara random Dari dataset diatas terpilih 3 cluster
        Pusat diantaranya :



Pada kali kita sudah desediakan Data set dan jumlah kluster yang di inginkan pada soal.
1. Langsung  saja  Dataset pada soal ini kita salin/copy dan kita pindahkan ke Microsoft excel lalu simpan menjadi file excel.


2. Kita buka aplikasi Rapid Miner dan masukkan file dataset yang sudah di simpan di file excel.
< Klik Import Data > pada bagian halaman Repository.


3. Kemudian muncul halaman baru untuk import data > klik My computer > Cari Data file excel > pilih data excel > klik next.



4. Pilih cell yang akan digunakan > lalu klik next


5. Lalu  muncul tampilan format columns. Disini kita rubah “role nama mahasiswa” menjadi Id supaya bisa menentukan nilai masing-masing mahasiswa pada ( UTS,TUGAS,UAS ) lalu Klik Next.


 
 
6. Kemudian Simpan file import-an ke local repository dan beri nama file import-an tadi lalu klik finish.


7. Setelah file Dataset di import. Lalu file yang disimpan di local repository ini akan muncul dan file import-an tadi di drag/tarik/geser ke bagian halaman proses.


8. Pada halaman operator, search k-means lalu pilih “K-Means”. Lalu klik 2x atau drag ke halaman proses.

 

9. Kita akan mengatur parameter K-means disebelah kanan atas layar anda. Atur K/cluster yang akan anda inginkan. Di soal, cluster yang di inginkan berjumlah 3 cluster ( yang isinya kategori pintar, sedang, kurang ). Kita ganti K-nya menjadi 3.

10. Lanjut ke halaman proses, setelah data-data yang dibutuhkan sudah siap/selesai langkah selanjutnya ialah merelasikan data file dataset dengan data k means dan relasikan lagi ke tombol result ( bentuknya setengah lingkaran ) tarik garis ke result untuk mengetahui hasil datanya nanti. Lalu klik run, untuk menjalankan proses yang telah dibuat.


11. Proses akan menghasilkan 2 hasil yaitu Cluster Model dan ExampleSet. Didalam cluster model akan ditunjukan 3 cluster yaitu Cluster 0, Cluster 1 dan Cluster 2. Masing-masing cluster memiliki jumlah item yang berbeda dan jumlah atributnya sama dengan jumlah atribut dari dataset yaitu 15 atribut / 15 mahasiswa beserta nilai-nilanya.


Di dalam cluster model utamanya di menu centroid model ditunjukkan hasil rata – rata tiap cluster pada nilai UTS, TUGAS dan UAS.


13. Dan Untuk halaman Example set, kita ditunjukkan hasil pengelompokkan mahasiswa berdasarkan cluster yang sudah di kelompok dari hasil proses k-means tadi. Dan di Example set ini juga kita ditunjukkan hasil visualisasi gambar pengelompokkan cluster.


 

Kesimpulan :
    Kita sudah mengetahui hasil k-means dari aplikasi rapid miner ini. Nah, pada hasil pengelompokkan cluster itu juga sudah di ketahui tetapi pada pengelompokkan kategorinya belum ditentukan maka dari itu kita harus menentukannya supaya jelas.

Dibawah ini adalah hasil pengelompokkan cluster :


Dan ini adalah cluster pusat yang sudah ditentukan berdasarkan kategorinya menurut soal :



 

Pada data di atas kita dapat menyimpulkan bahwa :
•    Cluster 0 pada hasil rapid miner merupakan pengelompokkan kategori pintar, terbukti dengan nilai yang memenuhi syarat pada cluster pusat yaitu cluster 1 = 96, 93, 85. Nama Mahasiswa yang masuk kelompok pintar ialah ( Roy, Sintia, RudI, Gede, Ayu ).
•    Cluster 1 pada hasil rapid miner merupakan pengelompokkan kategori pintar, terbukti dengan nilai yang memenuhi syarat pada cluster pusat yaitu cluster 3 = 60, 55, 48. Nama Mahasiswa yang masuk kelompok pintar ialah ( Dilan, Ratna, Christian, Justin, Siska, Reitama ).
•    Cluster 2 pada hasil rapid miner merupakan pengelompokkan kategori pintar, terbukti dengan nilai yang memenuhi syarat pada cluster pusat yaitu cluster 2 = 70, 75, 80. Nama Mahasiswa yang masuk kelompok pintar ialah ( Iqbal, Merry, Hafiz, Jesika ).


Itu tadi adalah Tutorial menggunakan Rapid miner untuk menghitung soal materi K-means pada dataset. Bila ada kesalahan tulisan atau ketidak jelasan pada tutorial diatas mohon dimaafkan. Semoga Bermanfaat.

Terima Kasih.

------------------------------------------------
Nama : Arsha Setya Pradita
Nim : 171080200186
Mata Kuliah : Data Mining
Perihal : UTS
------------------------------------------------
Ada juga penjelasan melalui video, klik link dibawah ini :

Komentar

Postingan populer dari blog ini

Cara mengambil data / Scrapping Data pada data daerah wilayah sidoarjo pada Web OLX dengan menggunakan Aplikasi R-Studio

Tutorial cara menghitung dataset client pada rumus Algoritma Apriori dengan menggunakan Aplikasi Rapid Miner