DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWA . - Raden Intan

Transcription

DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWAPENDIDIKAN MATEMATIKA UIN RADEN INTAN LAMPUNGMENGGUNAKAN NAIVE BAYESSkripsiDiajukan Untuk Melengkapi Tugas-tugas dan Memenuhi Syarat-syaratGuna Mendapatkan Gelar Sarjana S1 dalam Ilmu Tarbiyah dan KeguruanOlehDEVI HERYANANPM 1411050272Jurusan : Pendidikan MatematikaFAKULTAS TARBIYAH DAN KEGURUANUNIVERSITAS ISLAM NEGERI RADEN INTANLAMPUNG1440 H / 2019 M

DATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWAPENDIDIKAN MATEMATIKA UIN RADEN INTAN LAMPUNGMENGGUNAKAN NAIVE BAYESSkripsiDiajukan Untuk Melengkapi Tugas-Tugas dan Memenuhi Syarat-SyaratGuna Mendapatkan Gelar Sarjana S1 dalam Ilmu Tarbiyah dan KeguruanOlehDEVI HERYANANPM 1411050272Jurusan : Pendidikan MatematikaPembimbing I : Dr. Nanang Supriadi, M. ScPembimbing II : Siska Andriani, S.Si., M.PdFAKULTAS TARBIYAH DAN KEGURUANUNIVERSITAS ISLAM NEGERI RADEN INTANLAMPUNG1440 H / 2019

ABSTRAKDATA MINING UNTUK MEMPREDIKSI KELULUSAN MAHASISWAPENDIDIKAN MATEMATIKA UIN RADEN INTAN LAMPUNGMENGGUNAKAN NAIVE BAYESOlehDevi HeryanaTahun ajaran baru jumlah kuota mahasiswa pendidikan matematika UINRaden Intan Lampung semakin bertambah, namun tidak semua mahasiswa dapatlulus tepat waktu. Sehingga mengakibatkan jumlah mahasiswa semakinbertambah dan dapat pula mengakibatkan berlimpahnya data mahasiswa. Jumlahmahasiswa baru dan mahasiswa yang telah lulus setiap tahunnya tidak sebanding,untuk itu dibutuhkan sistem yang dapat memprediksi kelulusan mahasiswa. Datamining merupakan cara yang mampu mengolah data yang sangat besar tersebutdapat menjadi sebuah informasi. Data mining dengan metode Naive Bayes mampumemprediksi masa depan menggunakan probabilistik yang menerapkan aturanbayes dengan asumsi memprediksi masa depan dengan menggunakan pengalamansebelumnya. Tujuan penelitian ini adalah mengetahui penerapan teknik datamining dengan metode Naive Bayes menyajikan informasi dalam memprediksikelulusan mahasiswa.Penelitian ini bersifat study literature dengan mengkaji jurnal-jurnal danbuku-buku teks yang berkaitan dengan bidang yang diteliti. Adapun perhitunganyang digunakan untuk memprediksi kelulusan mahasiswa dengan data miningmetode Naive Bayes berbantuan RapidMiner 5.3.Hasil penelitian pengujian menggunakan RapidMiner 5.3 dengan datatraining sebanyak 51 data diperoleh keakurasian sebesar 74,67%. Data testingsebanyak 184 mahasiswa sebagai data uji didapatkan hasil bahwa mahasiswa yangakan lulus tepat waktu sebanyak 42 mahasiswa atau sekitar 22,8% dari jumlahdata testing dan mahasiswa yang tidak tepat waktu sebanyak 142 mahasiswa atausekitar 77,2%.Kata Kunci. Data Mining, Naive Bayes, RapidMiner 5.3ii

MOTTO ﻖ ﱠ ُ ﷲَ ﯾَ ْﺠ َﻌ ْﻞ ﻟَﮫُ َﻣ ْﺨ َﺮ ًﺟﺎ َوﯾَ ْﺮ ُز ْﻗﮫُ ِﻣﻦْ َﺣ ْﯿ ﺐ ُ ﺴ ِ َ ﺚ َﻻ ﯾَ ْﺤﺘ ِ َو َﻣﻦْ ﯾَﺘﱠ Artinya : “Barang siapa yang bertakwa kepada Allah, niscaya Dia akanmengadakan baginya jalan keluar, dan memberinya rezeki dari arahyang tiada disangka-sangkanya. (Ath-Thalaq: 3)”v

PERSEMBAHANAlhamdulillahirobbil’alamiin. Atas izin Allah SWT, akhirnya penelitidapat menyelesaikan skripsi ini dengan baik yang peneliti persembahkan kepada,kedua orang tua tercinta ayah Khairudin (Alm) dan ibu Yustiana yang memilikikasih sayang temat tulus kepada penulis, selalu memberikan suport dalam bentukapapun dan selalu mendoakan agar penulis dapat menyelesaikan tugas akhirdengan baik. Kakakku Ika Yuliati dan adikku Aprilia Hayusti yang selalumemberikan keceriaan, menghibur dikala sedih dan turut bahagia dikala senang,selalu mensuport penulis untuk menyelesaikan skripsi ini. Ucapan rasa syukurtiada terkira telah memiliki kalian, dan menjadi bagian dari keluarga ini.Terimakasih.vi

DAFTAR RIWAYAT HIDUPPenulis bernama Devi Heryana yang dilahirkan di Bandar Lampung, pada24 Oktober 1996. Penulis merupakan anak ke dua dari tiga bersaudara daripasangan bapak Khairudin (Alm) dan ibu Yustiana dengan kakak bernama IkaYuliati dan adik bernama Aprilia Hayusti yang selalu memberikan doa dandukungan kepada penulis dalam menyelesaikan tugas akhir (skripsi).Peneliti melalui jenjang pendidikan Taman Kanak-kanak Puri Sejahtera dan lulustahun 2002, kemudiapendidikan dasar di Sekolah Dasar (SD) Negeri 3 Rajabasadan lulus pada tahun 2008, kemudian peneliti melanjutkan pendidikan menengahpertama di SMP Negeri 8 Bandar Lampung dan lulus tahun 2011, kemudianmelanjutkan pendidikan mengah atas di SMK Negeri 5 Bandar Lampung lulustahun 2014 dan melanjutkan pendidikan di perguruan tinggi Universitas IslamNegeri Raden Intan Lampung dengan program studi pendidikan matematikahingga saat ini. Penulis mengikuti KKN (kuliah kerja nyata) di desa Bumi Asrikecamatan Palas kabupaten Lampung Selatan dan mengikuti PPL (praktekpengalaman lapangan) di MMA IV Sukabumi Bandar Lampung.vii

KATA PENGANTARDengan mengucap syukur Alhamdulillah, segala puji bagi ﷲ atas karuniayang tiada terkira, rahmat, rezeqi yang ﷲ limpahkan kepada penulis sehinggapenulis dapat menyelesaikan skripsi ini. Skripsi dengan judul Data Mining untukMemprediksi Kelulusan Mahasiswa Pendidikan Matematika UIN RadenIntan Lampung Menggunakan Naive Bayes ini disusun untuk memenuhi salahsatu syarat guna memperoleh gelar sarjana pada Fakulas Tarbiyah dan Keguruanjurusan Pendidikan Matematika pada program strata 1 (S1) Fakultas Tarbiyah danKeguruan UIN Raden Intan Lampung. Penulis menyadari penyusunan skripsi inimasih terdapat banyak kekurangan dan kekeliruan, ini semata-mata karenakekurangan dan keterbatasan kemampuan serta pengalaman yang penulis miliki.Penyelesaian skripsi ini tidak terlepas dari bantuan berbagai pihak. Olehsebab itu penulis ingin menyampaikan ucapan terimakasih dan penghargaansetinggi-tingginya kepada yang terhormat:1.Prof. Dr. H. Chairul Anwar, M.Pd selaku dekan fakultas Tarbiyah danKeguruan UIN Raden Intan Lampung2.Dr. Nanang Supriadi, M.Sc selaku ketua jurusan Pendidikan Matematika3.Dr. Nanang Supriadi, M.Sc selaku pembimbing I dan Siska Andriani, S.Si.,M.Pd selaku pembimbing II yang telah memberikan waktu dan ilmunyakepada penulis untuk mengarahkan dan membantu penulis dalammenyelesaikan skripsi.viii

4.Bapak dan Ibu dosen Fakultas Tarbiyah dan Keguruan yang telahmemberikan ilmu pengetahuan kepada penulis selama menempuhpendidikan dikampus ini.5.Teman seperjuangan Annisa Rahma, Binti Listiani, Dwi Fadila Rahmatika,Anisa Fathul Aziz, serta seluruh kerabat yang senantiasa setia dalammembantu penulis menyelesaikan skripsi ini.6.Sahabat 4ever. Terimakasih telah menjadi alarm pengingat, motivator danmenjadi pendengar yang baik. Tetaplah menjadi sahabatku sampai kesyurga-Nya.7.Rekan PPL dan KKN tersayang yang telah memberikan motivasi dandukungan kepada penulis untuk menyelesaikan tugas akhir.8.Keluarga FKAR yang telah memberikan keceriaan dan mendukung kepadapenulis untuk menyelesaikan skripsi ini.9.Rekan kelas matematika E yang telah memberikan dukungan hingga saat initanpa terkecuali, serta alamamaterku UIN Raden Intan lampung tercinta.Semoga ﷲ melimpahkan rahmat dan karunia-Nya kepada kita semua, danberkenan membalas semua kebaikan yang diberikan kepada penulis. Penulisberharap skripsi ini dapat bermanfaat bagi kita semua. Aamiin.Bandar Lampung, Maret 2019Penulis,Devi Heryana1411050272ix

x

DAFTAR ISIHALAMAN JUDUL . iABSTRAK . iiHALAMAN PERSETUJUAN . iiiHALAMAN PENGESAHAN . ivMOTTO . vPERSEMBAHAN . viRIWAYAT HIDUP . viiKATA PENGANTAR . viiiDAFTAR ISI . xDAFTAR TABEL . xiiDAFTAR GAMBAR . xivDAFTAR LAMPIRAN . xvBAB I PENDAHULUANA. Latar Belakang Masalah . 1B. Identifikasi Masalah . 6C. Rumusan Masalah . 7D. Pembatasan Masalah . 7E. Tujuan Penelitian . 8F. Manfaat Penelitian . 9BAB II TINJAUAN PUSTAKAA. Kajian Teori . 101. Pengertian Data Mining . 102. Pengelompokan Data Mining . 123. Tahap-tahap Data Mining . 144. Klasifikasi . 165. Probabilitas. 166. Naive Bayes . 17B. Penelitian yang Relevan . 23x

BAB III METODE PENELITIANA. Metode Penelitian . 25B. Waktu dan Tempat Penelitian . 26C. Populasi, Sampel dan Teknik Sampling. 261.Populasi. 262.Sampel . 263.Teknik Sampling . 27D. Tahapan Penelitian . 271. Pengumpulan Data . 272. Penentuan Atribut . 283. Proses Data Mining . 304. Metode Naive Bayes . 345. Implementasi RapidMiner 5.3 dan Pengukian Metode . 35BAB IV PEMBAHASAN DAN HASILA. Hasil . 371. Persiapan Data . 372. Analisis Metode Naive Bayes . 403. Implementasi RapidMiner 5.3 Data Training . 454. Implementasi RapidMiner 5.3 Data Testing . 54B. Pembahasan . 59BAB V KESIMPULANA. Kesimpulan . 62B. Saran . 63DAFTAR PUSTAKAxi

1BAB IPENDAHULUANA. Latar Belakang MasalahPendidikan adalah usaha untuk menyiapkan seorang manusia melaluiberbagai kegiatan bimbingan, pengajaran, dan latihan yang berpengaruh terhadapsikap dan tingkah laku untuk meningkatkan kualitas kehidupan manusia.1,2Pendidikan merupakan hal yang terpenting dalam kehidupan setiap manusia,karena didalamnya terdapat kegiatan yang kompleks, memiliki dimensi yang luas,dan memiliki banyak variabel yang mempengaruhinya.3Melalui pendidikan itulah manusia dapat memperluas wawasannya danmemperoleh ilmu pengetahuan. Pendidikan dapat meningkatkan spritualkeagamaan, kecerdasan, kepedulian, akhlak mulia serta keterampilan yang sangatdiperlukan dirinya dan masyarakat.4 Pendidikan juga merupakan hal yang sangatpenting dalam kehidupan sehingga dapat dilihat profil pribadi muslim yang idealadalah pribadi yang memiliki wawasan luas. Dan dengan ilmu pula manusiaditinggikan derajatnya oleh Allah SWT.1Holidun et.al., “Kemampuan Pemecahan Masalah Matematis Kelompok MatematikaIlmu Alam Dan Ilmu-Ilmu Sosial,” Desimal: Jurnal Matematika 1, No. 1 (29 Januari, 2018):29–37.2Mulia Diana, Netriwati, dan Fraulein Intan Suri, “Modul Pembelajaran MatematikaBernuansa Islami Dengan Pendekatan Inkuiri,” Desimal: Jurnal Matematika 1, No. 1 (26 Januari,2018):7–13.3Mujib dan Mardiyah, “Kemampuan Berpikir Kritis Matematis BerdasarkanKecerdasan Multiple Intelligences,” Al-Jabar : Jurnal Pendidikan Matematika 8, No. 2 (25Desember, 2017):187–96.4Pandri Ferdias dan Eka Anis Savitri, “Analisis Materi Volume Benda Putar PadaAplikasi Cara Kerja Piston Di Mesin Kendaraan Roda Dua,” Al-Jabar : Jurnal PendidikanMatematika 6, No.2 (18 Desemeber 2 (18 Desember, 2015):177–82.

2Dalam firman Allah Surat Al-Mujadalah ayat 11 dijelaskan bahwa :Hai orang-orang yang beriman apabila dikatakan kepadamu:“Berlapanglah-lapanglah dalam majlis”, maka lapangkanlah niscayaAllah akan memberikan kelapangan untukmu. Dan apabila dikatan:“Berdirilah kamu” . Maka berdirilah, niscaya Allah akan meninggikanorang-orang yang beriman diantaramu dan orang-orang yang diberi ilmupengetahuan beberapa derajat. Dan Allah mengetahui apa yang kamukerjakan. (Q.S. Al-Mujadalah :11)5Sisdiknas(SistemPendidikanNasional) atauundang-undang dasarmenjelaskan bahwa setiap penduduk berhak mendapatkan pendidikan yangbermutu.6 Sejak awal tahun 1970-an, sistem pendidikan di Indonesia mengalamiperubahan terus-menerus, sejalan dengan program pembangunan di bidangpendidikan yang mulai dilaksanakan secara terprogram sejak 40 tahun yang lalu.Sejak saat itu pemerintah mulai merintis program perluasan kesempatan belajarbagi semua warga negara, pada semua jenis jenjang pendidikan.7Keberhasilan sistem pendidikan khususnya perguruan tinggi dapat dilihat darimeningkatnya kualitas pendidikan dari tahun ketahun. Salah satu yang menjadiindikator kualitas pendidikan adalah tingkat kelulusan mahasiswa dan banyaknyalulusan yang bekerja disuatu lapang pekerjaan.5Al-Qur’an Tafsir Perkata (Tangerang Selatan: P.T. Kalim):544Nanang Supriadi dan Rani Damayanti, “Analisis Kemampuan Komunikasi MatematisSiswa Lamban Belajar dalam Menyelesaikan Soal Bangun Datar,” Al-Jabar : Jurnal PendidikanMatematika 7, No. 1 (16 Juni 2016):1–9.7Ace Suryadi, Pendidikan Indonesia Menuju 2025 (Bandung: PT. Remaja Rosdakarya,2014):54.6

3Saat ini perguruan tinggi dituntut untuk memiliki keunggulan bersaing dankualitas yang baik. Dengan memanfaatkan pengelolaan sumber daya yangdilakukan secara baik. Selain sumber daya sarana, prasarana dan manusia. Sumberdaya teknologiinformasi merupakan salah satu sumber daya yang dapatmeningkatkan keunggulan bersaing dan kualitas yang baik.Teknologi informasi yang canggih dapat menghasilkan data yang diinginkanmasyarakat baik bidang industri, bidang ekonomi, bidang pendidikan dan berbagaibidang lainnya. Dalam bidang pendidikan teknologi informasi sangat dibutuhkanuntuk menghasilkan data yang berlimpah mengenai data mahasiswa dan dapatmenunjang setiap kegiatan pembelajaran yang dihasilkan.Universitas Islam Negeri Raden Intan Lampung merupakan salah satuperguruan tinggi yang bergerak dalam bidang pengembangan ilmu keislamanintegratif-multidisipliner berwawasan lingkungan yang ada di Indonesia. UINRaden Intan Lampung terdiri dari beberapa jurusan salah satunya adalah jurusanpendidikan matematika. Berdasarkan data yang diperoleh dari PTIPD (PusatTeknologi Informasi dan Pangkal Data) UIN Raden Intan Lampung bahwapendidikan matematika, pada tahun 2010 memiliki jumlah mahasiswa sebanyak117, sedangkan yang dapat lulus tepat waktu yaitu sebanyak 60 sehinggadiperoleh persentasi kelulusan sebesar 51,27% pada periode tersebut. Pada tahun2011 memiliki jumlah mahasiswa sebanyak 162, sedangkan yang dapat lulus tepatwaktu yaitu sebanyak 65, sehingga diperoleh persentasi kelulusan sebesar 40%pada periode tersebut. Pada tahun 2012 memiliki jumlah mahasiswa sebanyak155, sedangkan yang dapat lulus tepat waktu yaitu sebanyak 75, sehingga

4diperoleh persentasi kelulusan sebesar 45,4% pada periode tersebut. Dan padatahun 2013 memiliki jumlah mahasiswa sebanyak 231, sedangkan yang dapatlulus tepat waktu yaitu sebanyak 32, sehingga diperoleh persentasi kelulusansebesar 13,8% pada periode tersebut. Berdasarkan persentase di atas dapatdisimpulkan selama 4 tahun persentase rata-rata kelulusan mahasiswa pendidikanmatematika Universitas Negeri Islam Lampung sebesar 37,7%.No1234Tabel 1.1Jumlah Mahasiswa Pendidikan Matematika 2010 – 2013AngkatanJumlah MahasiswaJumlah Lulus Tepat lahSumber : PTIPD UIN Raden Intan LampungBerdasarkan Tabel 1.1 tersebut diketahui bahwa setiap memasuki tahunajaran baru jumlah kuota mahasiswa pendidikan matematika makin bertambah,namun tidak semua mahasiswa dapat lulus tepat waktu. Sehingga mengakibatkanjumlah mahasiswa semakin bertambah dan dapat pula mengakibatkanberlimpahnya data mahasiswa. Jumlah mahasiswa baru dan mahasiswa yang telahlulus setiap tahunnya tidak sebanding, untuk itu dibutuhkan sistem yang dapatmemprediksi kelulusan mahasiswa. Sistem ini digunakan untuk memprediksikemungkinan mahasiswa dapat lulus tepat waktu atau tidaknya.Untuk membantu sistem prediksi kelulusan mahasiswasuatu informasi berhargadalam pencariandengan berlimpahnya data mahasiswa. Makapenggunakan data mining dapat membantu sistem prediksi kelulusan mahasiswa.

5Data mining, sering juga disebut sebagai Knowledge Discovery in Database(KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data,histori untuk menemukan keteraturan, pola atau hubungan dalam dataset yangberukuran besar.8 Mahmud Yunus dalam penelitian yang telah dilakukannyamenyatakan bahwa data mining mampu mengolah data yang sangat besar,semakin banyak data yang dikumpulkan dari tahun ke tahun, data mining dapatmengolah data tersebut menjadi sebuah informasi.9Penelitian ini akan digunakan metode yang sesuai dengan permasalahan diatas dengan menggunakan metode Naive Bayes. Naive Bayes adalah sebuahmetode klasifikasi yang berakar pada teorema bayes. Dalam metodepengklasifikasian dengan digunakannya metode probabilitas dan statistik yangdikemukakan oleh ilmuan Inggris Thomas Bayes, yaitu memprediksi peluang dimasa depan berdasarkan pengalaman di masa sebelumnya sehingga dikenalsebagai Teorema Bayes.10Keuntungan penggunaan Naive Bayes menurut Effrida Manalu dan FriclesAriwisanto dalam penelitiannya adalah bahwa metode ini hanya membutuhkandata training yang kecil untuk menentukan estimasi parameter yang diperlukandalam proses pengklasifikasian dan juga dapat bekerja jauh lebih baik dalamkebanyakan situasi dunia nyata yang kompleks dari pada yang diharapkan.118Budi Santoso, “Data Mining Terapan dengan MATLAB,” (Yogyakarta: Graha Ilmu,2007):23.9Mahmud Yunus, “Penerapan Konsep Data Mining pada Data Base Akademik STMIKPradnya Paramita Dengan Delphi,” Jurnal Dinamika, No. 1 (Januari, 2010):35-46.10Bustami, “Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Data NasabahAsuransi,” Jurnal Informatika 8, No. 1 (1 Januari 2014):1-15.11Effrida Manalu, Fricies Ariwisanto dan Mamed Rofendy “Penerapan Algoritma NaiveBayes Untuk Memprediksi Jumlah Produksi Barang Berdasarkan Data Persediaan Dan Jumlah

6Data training yang akan digunakan peneliti adalah data alumni mahasiswaPendidikan Matematika Universitas Islam Negeri Raden Intan Lampung alumniangkatan 2013, sedangkan untuk data testing menggunakan data angkatan 2015.Artibut yang akan digunakan dalam melakukan klasifikasi kelulusan angkatan2015adalah nama, NPM (Nomor Pokok Mahasiswa), jenis kelamin, kotakelahiran, tipe sekolah, lokasi sekolah, ekonomi, dan Indeks Prestasi Komulatif(IPK).Berdasarkan permasalahkan tersebut peneliti akan memanfaatkan data miningdengan metode Naive Bayes, diharapkan dapat membantu menemukan informasidalam memprediksi kelulusan mahasiswa pendidikan matematika UniversitasIslam Negeri Raden Intan Lampung sehingga membantu bagian program studiuntuk memprediksi status kelulusan mahasiswa dan dapat digunakan sebagaisarana untuk menentukan langkah dan kebijakan bagi mahasiswa untuk yangmenargetkan lulus tepat waktu.B. Identifikasi MasalahBerdasarkan latar belakang diatas, dapat diidentifikasi beberapa permasalahansebagai berikut:1. Banyaknya mahasiswa yang tidak lulus sesuai waktu studi.2. Jumlah data mahasiswa baru yang setiap tahun terus meningkat.Pesanan Pada CV. Papadan Mama Pastries,” Jurnal Manajemen Dan Informatika PelitaNusantara 1, No. 2 (Desember 2017):16-21

7C. Rumusan MasalahPerumusan masalah pada penelitian ini adalah sebagai berikut:1.Berapa nilai tingkat akurasi untuk prediksi kelulusan menggunakanmetode Naive Bayes?2.Bagaimana hasil teknik data mining dengan metode Naive Bayes untukmenampilkan informasi dalam memprediksi kelulusan mahasiswapendidikan matematika UIN Raden Intan Lampungs?D. Pembatasan MasalahAgar tidak terjadi menyimpang dari permasalahan dan terlalu luasnyapembahasan serta mengingat keterbatasan pengetahuan dan kemampuan penulis,maka penulis membatasi masalah yang akan teliti yaitu :1.Semua proses perhitungan yang digunakan melalui teknik data miningdengan metode Naive Bayes.2.Data mahasiswa yang akan training menggunakan data alumni angkatan20133.Data mahasiswa yang akan testing menggunakan data angkatan 2015.4.Jurusan yang menjadi objek penelitian adalah pendidikan matematikaUIN Raden Intan Lampung.5.Prediksi yang dihasilkan adalah tepat atau tidak tepat waktunyamahasiswa dalam menyelesaikan masa studinya.

86.Atribut yang digunakan dalam perhitungan Naive Bayes adalah nama,Nomor Pokok Wajib (NPM), jenis kelamin, kota kelahiran, tipe sekolah,lokasi sekolah, ekonomi, dan Indeks Prestasi Komulatif (IPK).7.Implementasi dan pengujian menggunakan sofware RapidMiner 5.3E. Tujuan PenelitianTujuan dari penelitian ini adalah sebagai berikut :1.Untuk mengetahui penerapan teknik data mining dengan Naive Bayesdan menyajikan informasi dalam memprediksi kelulusan denganberdasarkan data training menggunakan data alumni mahasiswapendidikan matematika angkatan 2013.2.Untuk mengetahui prediksi kelulusan mahasiswa pendidikan matematikaangkatan 2015 Universitas Islam Negeri Raden Intan Lampung denganmenggunakan hasil metode Naive Bayes.3. Mendapatkan akurasi yang tepat untuk melakukan klasifikasi kelulusanpendidikan matematika UIN Raden Intan Lampungmenggunakanmetode Naive Bayes.F. Manfaat PenelitianDengan tercapainya tujuan penelitian di atas, maka diharapkan akanbermanfaat bagi semua pihak, manfaat dari penelitian ini adalah :1.Memberikan informasi prediksi kelulusan mahasiswa yang lulus tepatwaktu maupun yang tidak tepat waktu.

92.Memberikan informasi sebagai dasar pertimbangan pengambilankeputusan dalam melakukan evaluasi tingkat kelulusan mahasiswa.3.Menjadikan sebagai perbandingan bagi peneliti lain dalam menerapkanteknik-teknik data mining di area pendidikan.

10BAB IITINJAUAN PUSTAKAA. Kajian Teori1.Pengertian Data MiningData mining didefinisikan sebagai sebuah proses untuk menemukanhubungan, pola dan tren baru yang bermakna dengan menyaring data yang sangatbesar yang tersimpan dalam penyimpanan, menggunakan teknik pengenalan polaseperti teknik statistik dan matematika. Data mining juga disebut sebagaiserangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selamaini tidak diketahui secara manual dari suatu kumpulan data. 12Istilah data mining memiliki hakikat sebagai disiplin ilmu yang tujuanutamanya adalah menemukan, menggali, atau menambang pengetahuan dari dataatau informasi yang kita miliki. Data mining dapat disebut sebagai KnowledgeDiscovery in Database (KDD). KDD adalahkegiatan yang meliputipengumpulan, pemakaian data, histori untuk menemukan keteraturan, pola atauhubungan dalam set data yang berukuran besar.13Data mining bukanlah suatu bidang yang sama sekali baru. Salah satukesulitan untuk mendefinisikan data mining adalah kenyaataan bahwa data miningmewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapanterlebih dahulu.12Daniel T,. Larose, “Discovering Knowledge in Data: An Introduction to Data Mining”(United States of America, 2005):2.13Budi Santosa, “Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis”(Graha Ilmu, 2007):15.

11Berawal dari beberapadisiplin ilmu, data mining bertujuan untukmemperbaiki teknik tradisional sehingga bisa menangani:a.Jumlah data yang sangat besarb.Dimensi data yang tinggic.Data yang heterogen dan berbeda sifatMenurut para ahli, data mining merupakan sebuah analisa dari observasi datadalam jumlah besar untuk menemukan hubungan yang tidak diketahuisebelumnya dan metode baru untuk meringkas data agar mudah dipahami sertakegunaannya untuk pemilih data.14Salah satu teknik yang dibuat dalam data mining adalah bagaimanamenelusuri data yang ada untuk membangun sebuah model, kemudianmenggunakan model tersebut agar dapat mengenali pola data yang lain yang tidakberada dalam basis data yang tersimpan. Kebutuhan untuk prediksi juga dapatmemafaatkan teknik ini. Data mining dapat pengelompokan data juga bisadilakukan . Tujuannya adalah agar kita dapat mengetahui pola universal data-datayang ada. Anomali data transaksi juga perlu dideteksi untuk dapat mengetahuitindak lanjut berikutnya yang dapat diambil. Semua hal tersebut bertujuanmendukung kegiatan akhir perusahaan diharapkan dapat tercapai.1514David Hartanto Kamagi dan Seng Hansun, “Implementasi Data Mining denganAlgoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa,” Jurnal ULTIMATICS, No.1(Juni, 2014):16.15Siska Haryati, Aji Sudarsono dan “Implementasi Data Mining Untuk MemprediksiMasa Studi Mahasiswa Menggunakan Algoritma C4.5 (Studi Kasus: Universitas DahasenBengkulu), ” Jurnal Media Infotama 11, No.2 (September, 2015):130-138.

122.Pengelompokan Data MiningBerdasarkan pekerjaan atau tugas Data mining dibagi menjadi beberapakelompok, yaitu:a.DeskripsiTerkadang peneliti dan analisis secara sederhana ingin mencoba mencaricara untuk menggambarkan pola dan kecenderungan yang terdapat erikankemungkinan penjelasan untuk suatu pola atau kecenderungan.b. EstimasiEstimasi hampir sama dengan klasifikasi, kecuali variabel target estimasilebih kearah numerik dari pada ke arah kategori. Model dibangunmenggunakan baris data (record) lengkap yang menyediakan nilai darivariabel target sebagai nilai prediksi. Selanjutnya, pada peninjauanberikutnya estimasi nilai dari variabel target dibuat berdasarkan nialaivariabel prediksi.c.PrediksiPrediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwadalam prediksi nilai dari hasil akan ada di masa mendatang. Beberapametode dan teknik yang digunakan dalam klasifikasi dan estimasi dapatpula digunakan (untuk keadaan yang tepat) untuk prediksi.

tegori.Sebagaicontoh,penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitupendapatan tinggi, pendapatan sedang, dan pendapatan rendah.e.Pengklasteran (Clustering)Pengklasteran merupakan pengelompokan record, pengamatan, ataumemperhatikan dan membentuk kelas obyek-obyek yang memilikikemiripan. Klaster adalah kumpulan record yang memiliki kimiripan satudengan yang lainnya dan memiliki ketidakmiripan record dalam klasteryang lain.Berbeda dengan klasifikasi, pada pengklasteran tidak melakukanklasifikasi mengestimasi, atau memprediksi nilai dari variabel target,akan tetapi, algoritma pengklasteran mencoba untuk melakukanpembagian terhadap keseluruhan data menjadi kelompok-kelompok yangmemiliki kemiripan (homogen), yang mana kemiripan record dalamsuatu kelompok akan bernilai maksimal, sedangkan kemiripan denganrecord dalam kelompok lain akan bernilai minimal.f.AsosiasiTugas asosiasi dalam data mining adalah untuk menemukan atribut yangmuncul dalam satu waktu.1616Daniel T,. Larose, Op.Cit., h. 11-17

143.Tahap-tahap Data MiningSebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapatahap proses yang diilustrasikan pada Gambar 2.1. Tahap-tahap tersebut bersifatinteraktif, pemakai terlibat langsung atau dengan perantaraan knowledge base.Gambar 2.1 Tahap-tahap Data MiningTahap-tahap data mining adalah sebagai berikut:a.Pembersihan data (data cleaning)Pembersihan data merupakan proses menghilang-kan noise dan data yangtidak konsisten atau data tidak relevan. Proses pembersihan data jugamencakup antara lain membuang duplikasi data dan memperbaikikesalahan pada data, seperti kesalahan cetak (typografi).

15b.Integrasi dataData yang digunakan untuk data mining tidak hanya berasal dari satudatabase tetapi juga berasal dari beberapa database atau file teks.Integrasi data dilakukan pada atribut-atribut yang mengidentifikasikanentitasentitas yang unik seperti atribut nama, jenis produk, nomorpelanggan dan lain-lainya.c.Seleksi data (data selection)Data yang ada pada database sering kali tidak semuanya dipakai, olehkarena itu hanya data yang sesuai untuk dianalisis yang akan diambil daridatabase. Pemilihan data dari sekumpulan data operasional perludilakukan sebelum tahap penggalian informasi dalam KDD dimulai.d.Transformasi data (data transformation)Data diubah atau digabung ke dalam format yang sesuai untuk diprosesdalam data mining.e.Proses miningMerupakan suatu proses utama saat metode diterapkan

yang digunakan untuk memprediksi kelulusan mahasiswa dengan data mining metode Naive Bayes berbantuan RapidMiner 5.3. Hasil penelitian pengujian menggunakan RapidMiner 5.3 dengan data training sebanyak 51 data diperoleh keakurasian sebesar 74,67%. Data testing sebanyak 184 mahasiswa sebagai data uji didapatkan hasil bahwa mahasiswa yang