Pengertian Dan Contoh Pada Penerapan Metode K-Means

Algoritma k-means sangat populer dan digunakan dalam berbagai aplikasi seperti segmentasi pasar, clustering dokumen, segmentasi gambar dan kompresi gambar, dll. Biasanya tujuan saat kita menjalani analisis cluster adalah: Mendapatkan intuisi yang berarti dari struktur data kita berurusan dengan.

Pengantar K-means Clustering. Pengelompokan K-means adalah jenis pembelajaran tanpa pengawasan, yang digunakan ketika Anda memiliki data yang tidak berlabel (yaitu, data tanpa kategori atau grup yang ditentukan). Tujuan dari algoritma ini adalah untuk menemukan kelompok dalam data, dengan jumlah kelompok yang diwakili oleh variabel K.

Mengelompokkan data ke dalam grup k dengan k yang telah ditentukan sebelumnya. Pilih titik k secara acak sebagai pusat cluster. Tetapkan objek ke pusat klaster terdekatnya sesuai dengan fungsi jarak Euclidean. Hitung centroid atau mean dari semua objek di setiap cluster.

Baca Juga : Manfaat Belajar Komputer

Pengelompokan hierarki adalah sekumpulan kluster bersarang yang disusun sebagai pohon. K Berarti clustering ditemukan bekerja dengan baik jika struktur cluster hyper spherical (seperti lingkaran dalam 2D, sphere dalam 3D). Pengelompokan hierarkis juga tidak berfungsi dengan baik, k berarti jika bentuk kluster hiper spheris.

Apa kelebihan dan kekurangan K means clustering?

  1. Jika variabel sangat besar, maka K-Means sebagian besar waktu secara komputasi lebih cepat daripada clustering hierarkis, jika kita menyimpan k kecil.
  2. K-Means menghasilkan cluster yang lebih ketat daripada clustering hierarkis, terutama jika cluster tersebut berbentuk bulat. Kekurangan K-Means: 1) Sulit untuk memprediksi K-Value.

K-means adalah algoritma klasifikasi tanpa pengawasan, juga disebut clusterization, yang mengelompokkan objek ke dalam kelompok k berdasarkan karakteristiknya. Pengelompokan dilakukan untuk meminimalkan penjumlahan jarak antara masing-masing objek dengan grup atau centroid cluster.

K-means adalah salah satu algoritma pembelajaran tanpa pengawasan paling sederhana yang memecahkan masalah pengelompokan yang terkenal. Prosedur mengikuti cara sederhana dan mudah untuk mengklasifikasikan kumpulan data tertentu melalui sejumlah cluster (asumsikan k cluster) apriori tetap. Ide utamanya adalah untuk menentukan pusat k, satu untuk setiap cluster.

Pengelompokan K-Means adalah algoritma pembelajaran tanpa pengawasan. Tidak ada data berlabel untuk pengelompokan ini, tidak seperti di pembelajaran yang diawasi. K-Means melakukan pembagian objek ke dalam cluster yang memiliki kesamaan dan berbeda dengan objek milik cluster lain.

Algoritme pengelompokan K-means menghitung sentroid dan melakukan iterasi hingga kami menemukan sentroid yang optimal. Ini mengasumsikan bahwa jumlah cluster sudah diketahui. Ini juga disebut algoritma pengelompokan datar. Jumlah cluster yang diidentifikasi dari data oleh algoritma diwakili oleh &singlequote;K&singlequote; dalam K-means.

Dalam algoritma ini, titik-titik data ditempatkan ke sebuah cluster sedemikian rupa sehingga jumlah kuadrat jarak antara titik data dan pusat massa akan menjadi minimum. Harus dipahami bahwa lebih sedikit variasi dalam cluster akan mengarah ke titik data yang lebih mirip dalam cluster yang sama.

Baca Juga : Sejarah Mobil Listrik di Indonesia

K-means mengikuti pendekatan Ekspektasi-Maksimalisasi untuk menyelesaikan masalah. Langkah Ekspektasi digunakan untuk menetapkan titik data ke cluster terdekat dan langkah Maksimalisasi digunakan untuk menghitung pusat massa dari setiap cluster.

Ada beberapa tahapan algoritma adalah sebagai berikut :

Pertama, tentukan berapa banyak jumlah k (cluster)

Kedua,  secara acak tentukan record yang menjadi lokasi pusat cluster.

Ketiga, temukan pusat cluster terdekat untuk setiap record. Adapun persamaan yang sering digunakan dalam pemecahan masalah dalam menentukan jarak terdekat adalah persamaan Euclidean berikut :

Dimana x=x1,x2,x3……xm dan y=y1,y2,y3…ym, sementara m menyatakan banyaknya nilai atribut dari 2 buah record.

Keempat, tentukan cluster terdekat untk setiap data dengan membandingkan nilai jarak terdekat, lalu perbaharui nilai pusat clusternya.

Kelima, ulangi langkah 3 sampai 5 hingga tidak ada record yang berpindah cluster atau convergen.

 

Penulis : Edrian

Sukai/Like Fan Page Facebook Garuda Cyber Indonesia

Subscribe Channel Youtube Garuda Cyber Indonesia

Follow Instagram Garuda Cyber Indonesia

Chat Wa

Artikel Terpopuler

Definisi Struktur Kontrol Perulangan Dalam Pemrograman Dan Contohnya

Pada dasarnya perulangan pada pemrograman yang sama dengan perulangan bahasa pemrograman lainnya. Struktur kontrol perulangan yang dipakai memilki suatu fungsi dari program yang akan dijalankan secara berulang. Contohnya anda ingin membuat tampilan nama anda sebanyak 100 kali, tentu akan sangat lama jika anda menuliskan kode program secara dengan manual. Dengan struktur kontrol perulangan bisa menampilkan dengan nama sebanyak 100 kali...