Analisis Cluster Pengorganisasian

Transcription

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster(kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan ciri/sifatdaripada pola-pola dalam kluster yang lainnya.

Tujuan dari Analisis Cluster adalah mengelompokkan obyekberdasarkan kesamaan karakteristik di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu cluster yang baik yaitu mepunyai : Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalamsatu cluster. Heterogenitas external (between cluster); yaitu perbedaan antara clusteryang satu dengan cluster yang lain.

Hirarkis memulai pengelompokan dengan dua atau lebih obyek yangmempunyai kesamaan paling dekat. terdapat tingkatan (hirarki) yang jelas antar obyek, dari yangpaling mirip hingga yang paling tidak mirip. Tools dendogramNonHirarkis dimulai dengan menentukan terlebih dahulu jumlah clusteryang diinginkan (dua,tiga, atau yang lain). Setelah jumlah cluster ditentukan, maka proses clusterdilakukan dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut “K-Means Cluster”.

Wellseparatedclusters sehimpunan titik yang memiliki kemiripan dengan titik lain dalam clusterdaripada di cluster lain.Centerbasedclusters Sebuah cluster yang memiliki anggota-anggota yang mirip dengan pusat clusterdaripada pusat cluster lain. Pusat cluster: Centroid: Rata-rata dari semua titik dalam cluster Medoid: memilih titik sebagi titik tengah.Densitybasedclusters area padat titik, yang dipisahkan dengan area kepadatan rendah, dari areakepadatan tinggi lainnya. Digunakan ketika cluster tidak teratur atau saling terkait, dan ketika noise danoutliers hadir.

Kedekatan pola biasanya diukur dengan fungsi jarak antar dua pasangpola. cosine similarity, manhattan distance, dan euclidean distance.

Sampel yang diambil benar-benar dapat mewakilipopulasi yang ada (representativeness of the sample) Multikolinieritas.

CONTOH Dari penelitian yang dilakukan terhadap 12 kota, ingin diketahuipengelompokan kota-kota tersebut berdasarkan instrumen 5 variabelyaitu :1. jumlah pendapatan kota (trilyun Rp)2. jumlah pinjaman pemerintah kota (milyar Rp)3. jumlah dana hibah yang dimiliki kota (milyar Rp)4. jumlah konsumsi pemerintah kota (milyar Rp)5. Jumlah penduduk kota (juta jiwa).

Mengingat data yang terkumpul mempunyai variabilitas satuan, makaperlu dilakukan langkah standardisasi atau transformasi terhadapvariabel yang relevan ke bentuk zscore, sebagai berikut :1) Setelah keseluruhan data yang dikumpulkan tersebut diatas dientrydalam program SPSS, selanjutnya klik menu “analyze” dan pilih submenu “Descriptives Statistics” lalu “Descriptives

Masukkan ke dalam kotak VARIABLES seluruh variabelinstrumen penilai, yaitu variabel jumlah pendapatan, jumlahpinjaman, jumlah dana hibah, jumlah konsumsi,dan jumlahpenduduk. (dalam hal ini variabel kota tidak dimasukkankarena data bertipe string). Kemudian aktifkan bagian “Save standardized values asVariables”. Abaikan bagian yang lain lalu tekan OK untuk menampilkan output aplikasi program SPSS.

Sebagai dasarperhitungan Zscore

Tampilan“dataview”

Dari tampilan data yang tertera (hasil standardisasi/transformasi),buka menu “Analyze”, lalu pilih sub menu “Classify” dan pilih “KMeans Cluster ”

Masukkan seluruh variabel Z-Score ke dalam kotakVARIABLES. Kemudian variabel Kota dimasukkan dalamkotak “Label Cases by.”. Number of Clusters dalam hal ini diisi menurut jumlahcluster yang akan dibentuk dalam penelitian yang dimaksud. Misal diiisi 3, berarti diharapkan akan dibentuknya 3 cluster. Kemudian klik mouse pada kotak “Save ”

Aktifkan kedua kotak dalam menu Save, yaitu “Cluster membership”dan “Distance from cluster center”. Selanjutnya tekan tombol “Continue” untuk kembali ke menu utama.

Pada bagian Statistics, aktifkan“Initial cluster centers” dan “ANOVAtable”. Abaikan bagian yang lain, lalutekan “Continue” untuk kembali kemenu utama.

Tampilan pertama prosesclustering data sebelumdilakukan iterasi

Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalamproses clustering dari 12 obyek yang diteliti, dapat dilihat pad tabelberikut:Tahapanclustering cukupdengan 2 iterasiJarak minimum

Output Final Cluster Centerstersebut masih terkait denganproses standardisasi datasebelumnya, yang mengacupada z-score denganketentuan sebagai berikut : Nilai negatif (-) berarti databerada di bawah rata-ratatotal. Nilai positif ( )berarti databerada di atas rata-ratatotal.

Rumus umum yang digunakan yaitu :Sebagai contoh, apabila ingin diketahui rata-rata jumlah pendapatan kota di cluster-1yaitu : (rata-rata pendapatan seluruh kota) (0,98858 x standar deviasi rata-ratapendapatan) 72,58 (0,98858 x 12,965) 85,3969Jadi rata-rata jumlah pendapatan kota yang berada di cluster-1 adalah Rp 85,3969 trilyun.Demikian seterusnya dapat diketahui rata-rata nilai masing-masing variabel dalam tiapcluster.

Cluster-1 Dalam cluster-1 iniberisikan kota-kota yangmempunyai jumlah pendapatankota, jumlah pinjaman, jumlahdana hibah, jumlah konsumsi,dan jumlah penduduk yanglebih dari rata-rata populasikota yang diteliti. Hal ini terbukti dari nilai positif( ) yang terdapat pada tabelFinal Cluster Centers dalamkeseluruhan variabel. Dengan demikian, dapat didugabahwa cluster-1 ini merupakanpengelompokan dari kota-kotabesar

Karakteristik kota yang masukdalam pengelompokancluster-2 yaitu memiliki ratarata jumlah pinjaman danjumlah konsumsi yangmelebihi rata-rata populasikota yang diteliti. Dengan demikian, dapatdiduga sekumpulan kotakota menengah berada padacluster-2.

Sedangkan karakteristikkota-kota yangmengelompok pada cluster3 adalah keseluruhaninstrumen penilai beradapada posisi dibawah ratarata populasi kota yangditeliti. Sehingga dapat didugabahwa cluster-3 merupakanpengelompokan kota-kotakecil.

Tahapan berikutnya adalah melihat perbedaan variabel pada cluster yang terbentuk.Dalam hal ini dapat dilihat dari nilai F dan nilai probabilitas (sig) masing-masing variabel

Cluster 1 beranggotakan 5 kotaCluster 2 beranggotakan 3 kotaCluster 3 beranggotakan 4 kota

Nomor CLusterJarak antara objekdengan pusat Cluster

Cluster-1Cluster-2Cluster-3 berisikan kota G, I, J, K, dan L denganmasing-masing jarak terhadap pusatcluster-1 adalah 1,13345; 1,45998;0,90703; 0,84724; dan 1,07342. berisikan kota B, F, dan H, dengan masingmasing jarak terhadap pusat cluster-2adalah 1,28390; 1,31905; dan 1,39462. berisikan kota A, C, D, dan E, denganmasing-masing jarak terhadap pusatcluster-3 adalah 2,07346; 1,10283;1,11895; dan 1,51738.

Konsep dari metode hirarkis ini dimulai dengan menggabungkan 2obyek yang paling mirip, kemudian gabungan 2 obyek tersebut akanbergabung lagi dengan satu atau lebih obyek yang paling miriplainnya. Proses clustering ini pada akhirnya akan ‘menggumpal’ menjadi satucluster besar yang mencakup semua obyek. Metode ini disebut juga sebagai “metode aglomerativ” yangdigambarkan dengan dendogram.

Langkah SPSS1. Masih dengan data sebelumnya, yang merupakan hasil standardisasi, bukamenu “Analyze” lalu pilih sub menu “Classify” kemudian “Hierarchical Cluster ”hingga muncul tampilan seperti berikut ini :2. Masukkan seluruh variabel yang telahdistandardkan (Z-score) ke dalam bagian“Variable(s)”. Untuk bagian “Label Cases by” isidengan variabel kota; sedangkan untuk bagian“Cluster” pilih Cases; pada bagian “Display”pilih keduanya yaitu Statistics dan Plots.

Pada bagian “Cluster Method” pilihBetween groups linkage. Kemudianbuka kotak combo SquareEuclidean distance pada“Measure”; dan pada “TransformValues” buka kotak combo padapilihan Z-score. Abaikan bagian yanglain lalu tekan tombol “Continue”untuk kembali ke menu utama.

menunjukkan bahwa semua datasejumlah 12 obyek telah diprosestanpa ada data yang hilang. menujukkan matrikjarak antar variabel Semakin kecil jarakeuclidean, makasemakin mirip keduavariabel tersebutsehingga akanmembentuk kelompok(cluster).

hasil proses clusteringdengan metodeBetween GroupLinkage. Setelah jarak antarvariabel diukur denganjarak euclidean, makadilakukanpengelompokan, yangdilakukan secarabertingkat.

Stage 1 : terbentuk 1 cluster yang beranggotakan Kota K dan Kota Ldengan jarak 1,139Karena proses aglomerasi dimulai dari 2 obyek yangterdekat, maka jarak tersebut adalah yang terdekatdari sekian kombinasi jarak 12 obyek yang ada.

Baris ke-4 (stage 4) terlihat obyek ke-7 (Kota G) membentuk clusterdengan Kota K. Dengan demikian, sekarang cluster terdiri dari 3obyek yaitu Kota G, K, dan L.Sedangkan jarak sebesar 2,097merupakan jarak rata-rata obyekterakhir yang bergabing dengan 2obyek sebelumnya, sepertitampak dalam Proximity matrixdan dapat dihitung sebagaiberikut :- Jarak Kota G dan K 2,432- Jarak Kota G dan L 1,761- Jarak rata-rata (2,432 1,761) / 2 2,0965

Stage 2 : terjadi pembentukan cluster Kota D dan Kota E berjarak1,515), yang kemudian berlanjut ke stage 6.Demikian seterusnya dari stage 3 dilanjutkan ke stage 5, sampai kestage terakhir.

Proses aglomerasi ini bersifat kompleks, khususnyaperhitungan koefisien yang melibatkan sekian banyakobyek dan terus bertambah.Proses aglomerasi pada akhirnya akan menyatukansemua obyek menjadi satu cluster.Hanya saja dalam prosesnya dihasilkan beberapacluster dengan masing-masing anggotanya,tergantung jumlah cluster yang dibentuk.

Apabila diinginkan dibentuk 4cluster, maka : Anggota cluster 1 adalahKota A Anggota cluster 2adalah Kota B dan Kota H Anggota cluster 3 adalah C,D, dan E Anggota cluster 4 adalahKota F, G, I, J, K, dan L.

Apabila ditentukan dibentuk 3cluster, maka : Anggota cluster 1 adalahKota A Anggota cluster 2 adalahKota B, C, D, E, dan H. Anggota cluster 3 adalahKota F, G, I, J, K, dan L.

Apabila ditentukan dibentuk 2cluster, maka : Anggota cluster 1 adalahKota A, B, C, D, E, dan H Anggota cluster 2 adalahKota F, G, I, J, K, dan L.

Dendogram berguna untukmenunjukkan anggota cluster yangada jika akan ditentukan berapacluster yang seharusnya dibentuk. Sebagai contoh yang terlihat dalamdendogram, apabila akan dibentuk2 cluster, maka cluster 1beranggotakan Kota K sampaidengan Kota F (sesuai urutan dalamdendogram); dan cluster2beranggotakan Kota D sampaidengan Kota A. Demikian seterusnya dapat denganmudah dilihat anggota tiap clustersesuai jumlah cluster yangdiinginkan.

Analisis cluster pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan