Tuesday, February 11, 2014

Clustering

Informasi ini diperoleh dari banyak situs berikut ini:
http://www.mathworks.com/help/fuzzy/fuzzy-clustering.html#FP43419
http://yudiagusta.wordpress.com/clustering/

Data clustering atau pengelompokan data merupakan bagian dari data mining, yang tujuannya adalah mengelompokan data yang sama kedalam suatu kelompok dan data yang berbeda kedalam kelompok lainnya. Ada banyak metode dalam data clustering yang pada dasarnya dapat dikelompokan menjadi 3 macam, yaitu:
1. Pengelompokan secara partisi (partition-based clustering)
2. Pengelompokan secara hirarki (hierarchical clustering)
3. Pengelompokan secara Automatic Mapping

Partition-based Clustering
merupakan pengelompokan data yang memilah-milah dan menganalisa data ke dalam cluster-cluster yang ada.  Beberapa metode clustering dengan cara partisi ini adalah:
K-Means


Baca Selengkapnya...

Wednesday, February 5, 2014

Metode Fuzzy C-Means

Tulisan ini saya buat sebagai media belajar bagi saya pribadi dan siapa saja yang mau belajar tentang Fuzzy C-Means. Diambil dari berbagai sumber.
http://informatika.web.id/metode-fuzzy-c-means-clustering.htm
http://sariberbagiilmu.blogspot.com/2011/05/fuzzy-c-means.html

Fuzzy C-means Clustering (FCM), atau dikenal juga sebagai Fuzzy ISODATA, merupakan salah satu metode clustering yang merupakan bagian dari metode Hard K-Means. FCM menggunakan model pengelompokan fuzzy sehingga data dapat menjadi anggota dari semua kelas atau cluster terbentuk dengan derajat atau tingkat keanggotaan yang berbeda antara 0 hingga 1.
Tingkat keberadaan data dalam suatu kelas atau cluster ditentukan oleh derajat keanggotaannya. Metode Fuzzy C-Means Clustering pertama kali dikenalkan oleh Jim Bezdek pada tahun 1981 (Jain dkk, 1999). Fuzzy C-Means adalah salah satu teknik pengelompokkan data yang mana keberadaan tiap titik data dalam suatu kelompok (cluster)ditentukan oleh derajat keanggotan. Metode Fuzzy C-Means termasuk metode supervised clustering dimana jumlah pusat cluster ditentukan di dalam proses clustering.
Berdasarkan situs informatika.wed.id, algoritma dari fuzzy c-means adalah sebagai berikut (Yan, 1994) :

Input Data
Input data yang akan dikelompokkan, yaituX, berupa matrix berukuran n x m (n=jumlah sampel data, m=atribut setiap data). Xij data sampel ke-i (i=1,2,…n), atribut ke-j (j=1,2,..m).

Tentukan Jumlah Cluster
Tentukan jumlah cluster (c), pangkat untuk matriks partisi (w), maksimum iterasi (MaxIter), error terkecil yang diharapkan (ξ), fungsi objektif awal (Po=0), dan iterasi awal (t=1).

Bangkitkan Nilai Random
Bangkitkan bilangan random ηik, i=1,2,…n; k=1,2,…c sebagai elemen matrik partisi awal U.

Hitung Pusat Cluster ke-k
Hitung pusat cluster ke-k: , dengan k=1,2,…,c; dan j=1,2,…,m, menggunakan persamaan berikut (Yan, 1994) :




dengan :
Vkj      = pusat cluster ke-k untuk atribut ke-j
ηik      = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij     = data ke-i, atribut ke-j

Hitung Fungsi Objektif
Hitung fungsi objektif pada iterasi ke-t menggunakan persamaan berikut (Yan, 1994)  :




Dengan I = 1,2,…,n; dan k=1,2,…c.
Dimana :
Vkj      = pusat cluster ke-k untuk atribut ke-j
ηik      = derajat keanggotaan untuk data sampel ke-i pada cluster ke-k
xij     = data ke-i, atribut ke-j

Cek kondisi berhenti
 jika:

atau:


Berdasarkan situs sariberbagiilmu.blogspot.com: Konsep dasar FCM, pertama kali adalah menentukan pusat cluster yang akan menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang, maka dapat dilihat bahwa pusat cluster akan menujui lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi obyektif (Gelley, 2000) yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan titik data tersebut. Algoritma yang digunakan pada metode Fuzzy C-means adalah sebagai berikut:





Baca Selengkapnya...