Data Mining Menggunakan Algoritma K-means Clustering Untuk .

1y ago

29 Views

1 Downloads

460.73 KB

9 Pages

Report/dmca

Download PDF

Transcription

DATA MINING MENGGUNAKAN ALGORITMA K-MEANSCLUSTERING UNTUK MENENTUKAN STRATEGI PROMOSIUNIVERSITAS DIAN NUSWANTOROOleh: Rima Dias RamadhaniJurusan Sistem Informasi, Fakultas Ilmu Komputer, Universitas Dian NuswantoroEmail: rimadias93@gmail.comABSTRAKProses penerimaan mahasiswa baru Universitas Dian Nuswantoro menghasilkan data mahasiswa yangsangat berlimpah berupa data profil mahasiswa dan data kegiatan belajar mengajar. Hal tersebutterjadi secara berulang dan menimbulkan penumpukan terhadap data mahasiswa, sehinggamempengaruhi pencarian informasi terhadap data tersebut. Penelitian ini bertujuan untuk melakukanpengelompokan terhadap data mahasiswa Universitas Dian Nuswantoro dengan memanfaatkan prosesdata mining dengan menggunakan teknik Clustering. Metode yang digunakan adalah CRISP-DMdengan melalui proses business understanding, data understanding, data preparation, modeling,evaluation dan deployment. Algoritma yang digunakan untuk pembentukan cluster adalah algoritmaK-Means. K-Means merupakan salah satu metode data non-hierarchical clustering yang dapatmengelompokkan data mahasiswa ke dalam beberapa cluster berdasarkan kemiripan dari datatersebut, sehingga data mahasiswa yang memiliki karakteristik yang sama dikelompokkan dalam satucluster dan yang memiliki karakteristik yang berbeda dikelompokkan dalam cluster yang lain.Implementasi menggunakan RapidMiner 5.3 digunakan untuk membantu menemukan nilai yangakurat. Atribut yang digunakan adalah kota asal, program studi dan IPK mahasiswa. Clustermahasiswa yang terbentuk adalah tiga cluster, dengan cluster pertama 804 mahasiswa, cluster kedua2792 mahasiswa dan cluster ketiga sejumlah 223 mahasiswa. Hasil dari penelitian ini digunakansebagai salah satu dasar pengambilan keputusan untuk menentukan strategi promosi berdasarkancluster yang terbentuk oleh pihak admisi UDINUS.Kata kunci: kota asal, program studi, IPK, k-means clustering, strategi promosiABSTRACTNew admissions process Dian Nuswantoro University students generate data that are highly abundantin the form of student profile data and the data of study. This happens over and over and cause a buildup of the student data, there by affecting the information retrieval of the data. This study aims toperform the data clustering Dian Nuswantoro University students by utilizing data mining processusing clustering techniques. The method used is the CRISP-DM with a through understanding ofbusiness processes, understanding the data, the data preparation, modeling, evaluation anddeployment. The algorithm used for the formation of clusters is K-Means algorithm. K-Means is onemethod of non-hierarchical clustering of data that can group student data into several clusters basedon the similarity of the data, so the data of students who have similar characteristics are grouped intoone cluster and that have different characteristics grouped in another cluster. Implementation usingRapidMiner 5.3 is used to help find an accurate value. The attribute used is the county, course andGPA student. Cluster students are three clusters formed, with the first cluster of 804 students, thesecond cluster of students in 2792 and the third cluster number of 223 students. The results of thisstudy are used as a basis for decision making to determine promotional strategies based cluster formedby the admission UDINUS.Keywords: county, course and GPA student, k-means clustering, promotional strategies1

1.1.1PENDAHULUANLatar BelakangKemajuan teknologi informasi sudahsemakin berkembang pesat disegala bidangkehidupan. Banyak sekali data yang dihasilkanoleh teknologi informasi yang canggih, mulaidari bidang industri, ekonomi, ilmu danteknologi serta berbagai bidang kehidupanlainnya. Penerapan teknologi informasi dalamdunia pendidikan juga dapat menghasilkandata yang berlimpah mengenai siswa danproses pembelajaran yang dihasilkan.Pada institusi pendidikan perguruantinggi, data dapat diperoleh berdasarkan datahistoris, sehingga data akan bertambah secaraterus menerus, misalnya data mahasiswa.Proses penerimaan mahasiswa baru dalamsebuah perguruan tinggi menghasilkan datayang berlimpah berupa profil dari mahasiswabaru tersebut. Tahap selanjutnya mahasiswaakan melakukan kegiatan belajar mengajar,sehingga dapat diketahui data prestasi merekasetiap akhir semester. Hal ini akan terjadisecara berulang pada sebuah perguruan tinggi.Penumpukan data mahasiswa secara menerusakan memperlambat pencarian informasiterhadap data tersebut.Berdasarkanberlimpahnyadatamahasiswa, informasi yang tersembunyi dapatdiketahui dengan cara melakukan pengolahanterhadap data tersebut sehingga berguna bagipihak universitas [1]. Pengolahan datamahasiswa perlu dilakukan untuk mengetahuiinformasi penting berupa pengetahuan baru(knowledge discovery), misalnya informasimengenai pengelompokan data mahasiswaberpotensi berdasarkan kota asal mahasiswa[1]. Pengetahuan baru tersebut dapatmembantupihakuniversitasdalammenentukan strategi promosi terhadap calonmahasiswa baru dengan tepat sasaran.Berdasarkan data yang diperoleh daribagian UPT Data dan Informasi (PSI)UDINUS, pada tahun 2010 jumlah mahasiswabaru UDINUS berjumlah 2343 mahasiswa,pada tahun 2011 berjumlah 2448 mahasiswa,pada tahun 2012 berjumlah 2707 sedangkanjumlah mahasiswa baru tahun 2013 berjumlah2277 mahasiswa. Pada tahun 2010 hingga2011 jumlah mahasiswa baru pada masingmasing program studi mengalami peningkatansejumlah 105 mahasiswa. Pada tahun 2011hingga 2012 jumlah mahasiswa baru padamasing-masing program studi juga mengalamipeningkatan sejumlah 259 mahasiswa. Padatahun 2013 terjadi penurunan jumlahmahasiswa baru pada masing-masing programstudi yaitu sejumlah 430 mahasiswa.Salahsatupenyebabterjadinyapenurunan jumlah mahasiswa baru pada tahun2013 adalah kurang dilakukan pengolahan datamahasiswa secara tepat berdasarkan datahistoris oleh pihak admisi UDINUS. Haltersebut dapat mempengaruhi pengambilankeputusan dalam menentukan wilayah promosiyang tepat sasaran. Pengolahan datamahasiswa seharusnya dilakukan agar dapatmenentukan wilayah promosi yang tepatsasaran sehingga tidak terjadi penurunanjumlah mahasiswa pada tahun berikutnya.Penelitianiniakanmelakukanpengelompokan berdasarkan pada datamahasiswa UDINUS. Atribut yang akandigunakan dalam penentuan pengelompokanwilayah untuk melakukan promosi UDINUSadalah program studi mahasiswa, kota asalmahasiswa dan Indeks Prestasi Mahasiswa(IPK) mahasiswa.1.2Tujuan PenelitianTujuan dari penelitian yang sarkan data mahasiswa tahun2012, 2011 dan 2012 berdasarkanpotensi akademik mahasiswa.b.Menentukan strategi promosi yang tepatuntuk setiap cluster yang terbentuk.22.1LANDASAN TEORIPromosiMenurut Kotler, promotion, the fourthmarketing mix tools, stand for variousactivities, the company undertakes tocommunicate its products merits andtopersuade target customers to buy them.Definisi tersebut mempunyai pengertianbahwa promosi meliputi semua alat yangterdapat dalam bauran promosi yang perananutamanya adalah mengadakan komunikasiyang bersifat membujuk [7].2.1.1 Strategi PromosiMenurut Kotler & Armstrong variabelvariabel yang ada di dalam promotional mixada lima, yaitu [8]:a.Periklanan (advertising)b.Penjualan Personal (personal selling)c.Promosi penjualan (sales promotion)2

d.e.Hubungan masyarakat (public relation)Pemasaran langsung (direct marketing)2.2Penerimaan Mahasiswa BaruPenerimaan Mahasiswabaru diUDINUS dilakukan melalui 4 tahap, yaitu [9]:a.Jalur khusus (vokasi)b.Jalur PMDKc.Program pindahand.Program transfere.Program reguler2.3Data MiningData mining adalah proses yangmenggunakan teknik statistik, matematika,kecerdasan buatan, dan machine learninguntuk mengekstrasi dan mengidentifikasiinformasi yang bermanfaat dan pengetahuanyang terkait dari berbagai database besar [10].Pengelompokan Data MiningMenurut Larose, data mining dibagimenjadi beberapa kelompok berdasarkan tugasyang dapat di lakukan, yaitu [11]:a.DeskripsiTerkadang peneliti dan analisis secarasederhana ingin mencoba mencari cara untukmenggambarkan pola dan kecendrungan yangterdapat dalam , kecuali variabel target estimasilebih ke arah numerik dari pada ke arahkategori.c.PrediksiPrediksi hampir sama dengan klasifikasidan estimasi, kecuali bahwa dalam prediksinilai dari hasil akan ada di masa mendatang.d.KlasifikasiDalam klasifikasi, terdapat targetvariabel kategori.e.PengklusteranClustering merupakan suatu metodeuntuk mencari dan mengelompokkan datayang memiliki kemiripan karakteriktik(similarity) antara satu data dengan data yanglain. Clustering merupakan salah satu metodedata mining yang bersifat tanpa arahan(unsupervised).f.AsosiasiTugas asosiasi dalam data miningadalah menemukan atribut yang muncul dalamsuatu waktu. Dalam dunia bisnis lebih umumdisebut analisis keranjang belanja.2.5Metode Data MiningMenurut Larose, data mining memelikienam fase CRISP-DM ( Cross IndustryStandard Process for Data Mining) [11].a.Fase Pemahaman Bisnis ( BusinessUnderstanding Phase )b.Fase Pemahaman Data ( DataUnderstanding Phase )c.Fase Pengolahan Data ( DataPreparation Phase )d.Fase Pemodelan ( Modeling Phase )e.Fase Evaluasi ( Evaluation Phase )f.Fase Penyebaran (Deployment Phase)2.4Gambar 2.1 Proses CRISP-DM [11]2.6Algoritma K-MeansMenurut Hasn & Kamber algoritma KMeans bekerja dengan membagi data ke dalamk buah cluster yang telah ditentukan [12].Beberapa cara penghitungan jarak yangbiasa digunakan yaitu: Euclidean distanceFormula jarak antar dua titik dalam satu,dua dan tiga dimensi secara berurutanditunjukkan pada formula 1, 2, 3 berikut ini :(2-1)(2-2)(2-3) Manhattan DistanceManhattan distance disebut juga taxicabdistance.(2-4) Chebichev DistanceDi dalam Chebichev distance atauMaximumMetricjarakantartitikdidefinisikan dengan cara mengambil nilaiselisih terbesar dari tiap koordinat dimensinya.(2-5)2.7RapidMinerRapidMiner adalah sebuah lingkunganmachine learning data mining, text mining danpredictive analytics [13].3

3HASIL DAN )Pemahamanbisnis(businessunderstanding), tahap pertama dalam prosesCRISP-DM yang juga dapat disebut sebagaitahap pemahaman bisnis (penelitian).3.1.1 Menentukan Tujuan BisnisTujuan bisnis berdasarkan pengolahandata mahasiswa tahun 2009, 2010, 2011, 2012dan 2013 antara lain untuk meningkatkanjumlah mahasiswa pada tahun 2014.Pengolahan data dilakukan karena telah terjadipenurunan sejumlah 430 mahasiswa padatahun 2013. Tujuan pengolahan data dapatdijadikansebagaisalahsatudasarpengambilan keputusan untuk menentukanwilayah promosi yang tepat sasaran.3.1.2 Melakukan Penilaian SituasiPadatahapaninidibutuhkanpemahaman terhadap tujuan bisnis danmenerjemahkan ke dalam tujuan data mining.3.1.3 Menentukan strategi awal dataminingStrategi awal dalam menerapkan aan data mahasiswa terlebihdahulu ke bagian UPT Data dan Informasi(PSI) UDINUS.3.2 PemahamanData(DataUnderstanding)Dataset mahasiswa yang didapatkandari UPT Data dan Informasi (PSI) UDINUSberupa dokumen excel sejumlah 11997 record.3.2.1 Pengumpulan data awalAdapun sumber data utama yangdigunakan dalam penelitian ini adalah datasetmahasiswa UDINUS yang berjenjang DIII danS1 pada tahun 2009, 2010, 2011, 2012 dan2013 dengan format .xlsx karena data yangdiberikan berupa dokumen excel.3.2.2 Mendeskripsikan dataDataset mahasiswa terdiri dari atributNIM, nama, program studi, alamat asal, namaprovinsi, kota asal, tempat lahir, jenis kelamin,sekolah asal, alamat sekolah, IP Semester 1 &2 serta IPK mahasiswa. Jumlah data yang adapada atribut berjumlah 11997 record.3.2.3 Evaluasi kualitas dataHasil evaluasi terhadap kualitas datayaitu menemukan banyak nilai kosong / nullyang disebut dengan missing value padaatribut dalam dataset mahasiswa.3.2.4 Pemilihan AtributAtribut yang digunakan adalah programstudi mahasiwa, kota asal mahasiswa dan IPKmahasiswa dengan standar 2,75.3.3Persiapan Data (Data Preparation)Persiapan data mencakup semuakegiatan untuk membangun dataset mahasiswayang akan diterapkan ke dalam alatpemodelan, dari data mentah awal berupadataset mahasiswa dan selanjutnya akanmelakukan proses data mining.3.3.1 Seleksi dataAtribut yang digunakan adalah programstudi mahasiswa, kota asal mahasiswa dan IPKmahasiswa 2,75.3.3.2 Pengolahandatamentah(Preprosessing Data)Pada tahap ini merupakan tahap untukmemastikan data mahasiswa yang dipilih telahlayak untuk dilakukan proses pengolahan.3.3.3 Transformasi dataData yang berjenis nominal seperti kotaasal dan program studi harus dilakukan prosesinisialisasi data terlebih dahulu ke dalambentuk angka/numerikal. Untuk melakukaninisialisasi kota asal dapat dilakukan dengan:a.Pada kota asal mahasiswa terlebihdahulu dilakukan pembagian wilayah-wilayahmenjadi beberapa bagian wilayah.Tabel 3.1. Inisialisasi Data Wilayah Kota AsalKota AsalJAWA TENGAH 1JAWA TENGAH 2JAWA TENGAH 5JAWA TENGAH 4JAWA TENGAH 3JAWA TIMURJAWA BARATSUMATERA SELATANKALIMANTAN TENGAHD.I YOGYAKARTASUMATERA UTARAD.K.I JAKARTARIAUNUSA TENGGARA BARATKALIMANTAN BARATKALIMANTAN SELATANSULAWESI SELATANKALIMANTAN TIMURMALUKUSUMATERA BARATNUSA TENGGARA TIMURBALIPAPUASULAWESI UTARASULAWESI 1222324254

b.Kemudian wilayah-wilayah tersebutdlakukan pengurutan angka dari yang terbesarberdasarkan frekuensi mahasiswa yang berasaldari wilayah tersebut.3.4.1 Pemilihan teknik pemodelanToolyangdigunakanRapidMiner versi 5.3:adalahTabel 3.2. Inisialisasi Data Program StudiProgram StudiTeknik Informatika / S1Akuntansi / S1Sistem Informasi / S1DKV / S1Manajemen / S1Kesehatan Masyarakat / S1Rekam Medis & Info Kes / D3Teknik Informatika / D3Sastra Inggris / S1Broadcast / D3Teknik Industri / S1Sastra Jepang / S1Manajemen Informatika / S1Teknik Elektro / Inisial1234567891011121314c.Wilayah yang memiliki frekuensiterbesar diberi inisial dengan angka 1 danwilayah yang memiliki frekuensi terbesarkedua diberi inisial dengan angka 2, begituseterusnya hingga wilayah dengan frekuensipaling sedikit.Selain kota asal, program studi jugatermasuk ke dalam jenis data nominal kedalam bentuk angka/numerikal.Tabel 3.3. Contoh dataset mahasiswa yang telah dilakukaninisialisasiNo.Program StudiKota 1323.223,1124.9113,1825.613,3Pemodelan (Modeling)Pemodelan adalah fase yang secaralangsung melibatkan teknik data mining yaitudengan melakukan pemilihan teknik datamining dan menentukan algoritma yang akandigunakan.Gambar 3.1. Flowcart RapidMinerFlowcart algoritma K-means:a.Penetapan jumlah cluster (K) padapenelitian ini yaitu berjumlah 3 cluster.Tabel 3.4. Titik Pusat Awal Tiap ClusterTitik PusatAwalCluster 1Cluster 2Cluster 3JurusanKota AsalIPK1322163,333,532,81b.Hitung jarak setiap data ke pusat clusterantara objek ke centroid dengan perhitunganjarak Euclidean.Persamaan yang digunakan adalah :(4-1)Persamaan 2-3 diatas digunakan karena atributyang digunakan berjumlah 3.Sebagai contoh, akan dihitung jarak dari datamahasiswa pertama ke pusat cluster pertamadengan persamaan:Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswapertama dengan cluster pertama adalah 1,011.3.4Jarak dari data mahasiswa pertama kepusat cluster kedua dengan persamaan:5

Matriks jarak dengan centroid awal sepertitersebut di atas adalah sebagai berikut:Tabel 3.6. Contoh tabel jarak dengan centroid awalDari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswapertama dengan cluster pertama adalah 2,001.Jarak dari data mahasiswa pertama kepusat cluster ketiga dengan perhitungan:Dari hasil perhitungan di atas didapatkan hasil bahwa jarak data mahasiswapertama dengan cluster pertama adalah 5,044.Berdasarkan hasil ketiga perhitungan diatas dapat disimpulkam bahwa jarak datamahasiswa pertama yang paling dekat adalahcluster 1, sehingga mahasiswa pertamadimasukkan ke dalam cluster 1. Hasilperhitungan selengkapnya untuk 5 datamahasiswa pertama dapat dilihat pada Tabel3.5.Cluster 11001000000000000000000100Cluster 20110001010111101010000001Cluster 30000110101000010101111010d.Setelah semua data ditempatkan kedalam cluster yang terdekat, kemudian hitungkembali pusat cluster yang baru berdasarkanrata-rata anggota yang ada pada clustertersebut.Contoh perhitungan pada cluster 1adalah sebagai berikut:c.Kelompokkan data ke dalam clusterdengan jarak minimalTabel 3.5. Contoh hasil perhitungan setiap data kesetiap clusterJarak 23232333213Jadi, hasil centroid baru cluster 1 adalah(9.609 , 1.988 , 3.165).Contoh perhitungan pada cluster 2adalah sebagai berikut:Jadi, hasil centroid baru cluster 2 adalah(2.621 , 1.939 , 3.148).Contoh perhitungan pada cluster 3adalah sebagai berikut:Jadi, hasil centroid baru cluster 3 adalah(5.009 , 11.960 , 3.200).6

e.Setelah didapatkan titik pusat yang barudari setiap cluster, lakukan kembali darilangkah ketiga hingga titik pusat dari setiapcluster tidak berubah lagi dan tidak ada lagidata yang berpindah dari satu cluster kecluster yang lain.3.4.2 Implementasi dengan RapidMinerBerikut adalah pengolahan data denganmenggunakan k-means pada RapidMiner :Gambar 3.2. Pemodelan K-Means padaRapidMinerDengan menggunakan pemodelan kmeans clustering seperti Gambar 3.2 diatas,dengan inisialisasi jumlah cluster sebanyak 3buah, maka didapatkan hasil dengan clusteryang terbentuk adalah 3, sesuai denganpendefinisian nilai k dengan jumlah cluster 0ada 804 item, cluster 1 ada 2792 item,cluster 3 ada 223 item sejumlah 3819 item.Tabel 3.7. Hasil cluster K-Means dalamimplementasi RapidMinerCluster ModelCluster 0804 itemsCluster 12792 itemsCluster 2223 itemsTotal number of items3819 itemsHasil perhitungan manual antara jarakcluster dengan centroid dan perhitunganmenggunakan RapidMiner menghasilkanperhitungan yang sama serta tidak mengalamiperubahan.Tabel 3.8. Hasil perhitungan manual antara jarakcluster dengan centroidAttributecluster 0cluster 1cluster 3Progdi9,6092,6215,009Kota asal1,9881,93911,960Ipk3,1653,1483,200Gambar 3.3. Result OverviewProses melakukan export data ke excelmempermudahpadasaatmelakukanpengolahan data dan evaluasi terhadap hasildari cluster yang terbentuk saat melakukanimplementasi pada RapidMiner.Gambar 3.4. Eksport data dari RapidMiner keExcel3.5Evaluasi (Evaluation)Evaluasi adalah fase lanjutan terhadaptujuan data mining. Evaluasi dilakukan secaramendalam dengan tujuan agar hasil pada tahappemodelan sesuai dengan sasaran yang ingindicapai dalam tahap business understanding.3.5.1 Evaluasi Hasil (Evaluation Results)Tahap ini menilai sejauh mana hasilpemodelan data mining memenuhi tujuan datamining yang telah ditentukan pada tahapbusiness understanding.3.5.2 Pengecekan Ulang Proses (ReviewProcess)Pada tahapan ini penulis memastikanbahwa semua tahapan / faktor penting yangtelah dilakukan dalam pengolahan data tidakada yang terlewatkan.3.5.3 Menentukan Langkah Selanjutnya(Determine Next Steps)Pada tahap ini adalah tahapan dalammenentukan langkah selanjutnya yangdilakukan. Terdapat 2 pilihan yaitu kembalipada tahap awal (business understanding) ataumelanjutkan ke tahap akhir (deployment).3.6 Persebaran (Deployment)3.6.1 Analisis clusterTabel 3.9. Berisi tentang hasilpengelompokan berdasarkan kedekatan jarakantara titik pusat dengan data mahasiswa padasetiap atribut.Tabel 3.9. Hasil Analisis Cluster SatuHasil Cluster SatuCluster Satu terdiri dari 804 mahasiswa yang berasaldari:Berasal dari Wilayah :Program Studi :a. RekamMedis&Info. a. Jawa Tengah 1 438b.Jawa Tengah 2 167Kesehatan 210c.Jawa Tengah 5 94b. Teknik Informatika /d.Jawa Tengah 4 38D3 125e.Jawa Tengah 3 29c. Sastra Inggris 98f.Jawa Timur 20d. Broadcasting 98g.Jawa Barat 13e. Teknik Industri 77h.Sumatera Selatan 4i.Kalimantan Tengahf. Sastra Jepang 65 1g. ManajemenInformatika 67h. Teknik Elektro 64Dengan rata-rata IPK 3,167

Tabel 3.10. Hasil Analisis Cluster DuaHasil Cluster DuaCluster Dua terdiri dari 2792 mahasiswa yang berasaldari:Program Studi :Berasal dari Wilayah :a. Teknik Informatika a. Jawa Tengah 1 10701383b. Akuntansi 478b. Jawa Tengah 2 742c. Sistem informasi 412 c. Jawa Tengah 5 399d. DKV 329d. Jawa Tengah 4 97e. Manajemen 277e. Jawa Tengah 3 92f. Kesehatan Masyarakat f. Jawa Timur 54 226g. Jawa Barat 25Dengan rata-rata IPK 3,15Tabel 3.11. Hasil Analisis Cluster TigaHasil Cluster TigaCluster 3 terdiri dari 223 mahasiswa yang berasal dari:Program Studi :Berasal dari Wilayah :a. Teknik Informatika 41a. Sumatera Selatan b. Akuntansi 2339c. Sistem informasi 23b. Kalimantan Tengah d. DKV 1830e. Manajemen 18c. D. I Yogyakarta 21f. Kesehatan Masyarakat d. Sumatera Utara 2543e. D.K.I Jakarta 19g. Rekam Medis dan Info f. Riau 11Kesehatan 21g. Kalimantan Barat h. Teknik Informatika D3 112h. Kalimantan Selatan i. Sastra Inggris 88j. Broadcasting 6i. Sulawesi Selatan 6k. Teknik Industri 6j. Kalimantan Timur l. Sastra Jepang 76m. Manajemen Informatika k. Sumatera Barat 4 5l. Sulawesi Tengah 1n. Teknik Elektro 2m. Bali 3n. Jawa Barat 14o. NTT 4p. Papua 3q. Maluku 5r. NTB 11s. Sulut 2Dengan rata-rata IPK 3,23.7Strategi PromosiDari data hasil clustering yang telahdilakukan di atas, maka dapat ditentukanbeberapa strategi promosi yang dapatdilakukan oleh pihak admisi UDINUS.a.Promosidenganmengirimtimmarketing yang sesuai dengan program studiyang paling banyak diminati.b.Promosi pada persebaran wilayahberdasarkan tingkat akademik mahasiswa.Selanjutnya akan dilakukan analisisstrategi promosi berdasarkan promotion mixpada masing-masing cluster yang terbentuk.Diharapkan dengan strategi yang diberikanpada masing-masing cluster dapat sesuaidengan tujuan bisnis yang telah dijelaskan.Tabel 3.12. Strategi Promosi berdasarkanPromotion MixNo.1.2.3.4.5.Strategi PromosiPeriklananPenjualan PersonalPromosi PenjualanHubungan MasyarakatPemasaran LangsungClusterSatu ClusterDua ClusterTiga 4KESIMPULAN DAN SARAN4.1 Kesimpulana.Setelah dilakukan pengelompokan datamahasiswa melalui persebaran wilayahberdasarkan potensi akademik menggunakanK-Means clustering terbentuk tiga clusteryaitu, cluster satu dengan jumlah 804mahasiswa dengan rata-rata IPK 3.16, clusterdua dengan jumlah 2792 mahasiswa denganrata-rata IPK 3.15 dan cluster tiga denganjumlah 223 mahasiswa dengan rata-rata IPK3.2.b.Strategi promosi bagi calon mahasiswabaru yang tepat sasaran untuk setiap wilayahberdasarkan cluster yang terbentuk adalahdengan mengirim tim admisi UDINUS yangsesuai dengan program studi yang palingbanyak diminati dan melakukan promosiberdasarkan potensi akademik mahasiswadengan melakukan penyelarasan menggunakanpromotion mix dan dengan melihat rata-rataIPK pada setiap cluster.4.2 Sarana.Pengelompokanterhadapdatamahasiswa UDINUS sebaiknya dilakukansecara rutin setiap tahun untuk menghindaripenurunan mahasiswa baru pada tahunberikutnya.b.Penelitian ini dapat dijadikan sebagaisalah satu referensi bagi pihak admisiUDINUS untuk mengambil keputusan dalammelakukan strategi promosi bagi calonmahasiswa baru.8

5DAFTAR PUSTAKA[1]Johan Oscar Ong, "IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUKMENENTUKAN STRATEGI MARKETING PRESIDENT UNIVERSITY," Jurnal Ilmiah TeknikIndustri, vol. 12, no. 1, pp. 10-13, Juni 2013.Universitas Dian Nuswantoro, Buku Panduan Akademik Mahasiswa Tahun Ajaran 2012-2013.Semarang, Jawa Tengah: Universitas Dian Nuswantoro, 2012.Irwan Budiman, Toni Prahasto, and Yuli Christyono, "DATA CLUSTERING MENGGUNAKANMETODOLOGI CRISP-DM UNTUK PENGENALAN POLA PROPORSI PELAKSANAANTRIDHARMA," in Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012), Yogyakarta,2012.Yudi Agusta, "K-Means – Penerapan, Permasalahan dan Metode Terkait," Jurnal Sistem danInformatika, vol. 3, pp. 47-60, Pebruari 2007.Sri Kusumadewi Tedy Rismawan, "APLIKASI K-MEANS UNTUK PENGELOMPOKANMAHASISWA BERDASARKAN NILAI BODY MASS INDEX (BMI) & UKURAN KERANGKA,"in Seminar Nasional Aplikasi Teknologi Informasi, Yogyakarta, 2008, pp. ISSN: 1907-5022.Suprihatin, "Klastering K-Means Untuk Penentuan Nilai Ujian," JUSI, vol. 1, no. 1, pp. ISSN: 20878737, Februari 2011.Philip Kotler, Manajemen Pemasaran: Analisis, Perencanaan, Implementasi dan Kontrol, Prenhallindo,Ed. Jakarta, 1997.Philip dan Gary Armstrong Kotler, Prinsip-Prinsip Pemasaran, Alih Bahasa Imam Nurmawan, Ed.Jakarta: Salemba Empat, 2001.Universitas Dian Nuswantoro. (2014, Jan) UDINUS. [Online]. ah\\www.dinus.ac.id" www.dinus.ac.idTurban, E. dkk, Decicion Support Systems and Intelligent Systems.: Andi Offset, 2005.Larose, Daniel T, Data Mining Methods and Models. Hoboken New Jersey: Jhon Wiley & Sons, Inc,2006.Larose, Daniel T, Discovering Knowledge in Data: An Introduction to Data Mining.: John Willey &Sons. Inc, . and Kamber,M. “Data mining: Concepts and Techniques”, 2nd9

This study aims to perform the data clustering Dian Nuswantoro University students by utilizing data mining process using clustering techniques. The method used is the CRISP-DM with a through understanding of business processes, understanding the data, the data preparation, modeling, evaluation and deployment.