Catatan : Jurnal yang saya ambil judulnya adalah Algoritma Bayesian Classification Untuk
Memprediksi Heregristrasi Mahasiswa Baru Di Stmik Widya Pratama. Penulis jurnal ini menggunakan metode Bayesian Classfication untuk mengklasifikasian data. Tujuan penulis menggunakan metode Bayesian classification ini untuk mengetahui kemungkinan pengunduran diri seorang calon mahasiswa dapat diketahui lebih dini agar pihak perguruan tinggi dapat melakukan tindakan yang perlu untuk mempertahankan calon mahasiswa. Dalam jurnal ini penulis mengambil pengetesan data dengan kota asal Pemalang, gelombang 3 Progdi TI, status tes adalah bebas tes. Terdapat 9 mahasiswa yang melakukan pendaftaran, dengan yang melakukan heregristrasi 7 mahasiswa. Jurnal seperti ini sangat bermanfaat bagi institut-institut pendidikan ketika melakukan penerimaan mahasiswa dan atau murid baru agar pihak manajemen dapat menentukan kemungkinan pengunduran diri calon mahasiswa atau murid baru sehingga dapat mengantisipasinya lebih dini. Untuk lebih jelasnya silahkan baca atau download jurnal aslinya disini.
ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA
Abstrak
Setiap tahun akademik STMIK Widya Pratama melakukan kegiatan pendaftaran. Pada tahun 2011 jumlah pendaftar sebanyak 913 dengan jumlah heregristrasi sebanyak 658 maka 255 mahasiswa tidak melakukan heregristrasi. Bayesian classification merupakan salah satu metode dari data mining yang digunakan untuk mengklasifikasian data. Metode Bayesian classification ini digunakan untuk mengetahui kemungkinan pengunduran diri seorang calon mahasiswa dapat diketahui lebih dini agar pihak perguruan tinggi dapat melakukan tindakan yang perlu untuk mempertahankan calon mahasiswa. Dalam memprediksi heregristrasi mahasiswa baru dengan atribut asal kota, gelombang, progdi, dan status tes. Keakuratan yang telah dilakukan dengan menggunakan metode baysian classification 78 % . Pengetesan data dengan kota asal Pemalang, gelombang 3 Progdi TI, status tes adalah bebas tes. Terdapat 9 mahasiswa yang melakukan pendaftaran, dengan yang melakukan heregristrasi 7 mahasiswa.
Kata Kunci: memprediksi,heregistrasi, Bayesian classification
1. PENDAHULUAN
1.1 Latar Belakang
Sekolah Tinggi Manajemen
Informatika dan Komputer (STMIK) Widya Pratama Pekalongan berdiri tahun 2002
berdasarkan SK Mendiknas Nomor : 149/D/O/2002 yang diselenggarakan oleh Yayasan
Widya Pratama. STMIK Widya Pratama mempunyai 4 Program Studi yaitu Teknik Informatika,
Sistem Informasi, Manajemen Informatika dan Komputerisasi Akuntasi. Setiap
tahun akademik STMIK Widya Pratama melakukan kegiatan penerimaan mahasiswa
baru. Pada tahun akademik 2011/2012 terdapat 913 pendaftar dengan data seperti
berikut:
Tabel 1. Data Pendaftaran
mahasiswa tahun 2011
Dari jumlah pendaftar 913, akan tetapi yang melakukan heregristrasi mahasiswa baru 658 mahasiswa. Ada 255 mahasiswa tidak melakukan heregristrasi. Adapun rincian untuk heregristrasi mahasiswa baru adalah sebagai berikut:
Tabel 2. Data Hergristrasi mahasiswa baru tahun 2011 Program Studi
Jika kemungkinan pengunduran diri seseorang calon mahasiswa baru dapat diketahui lebih dini, maka pihak manajemen Perguruan Tinggi dapat melakukan tindakan-tindakan yang
diperlukan untuk mempertahankan calon-calon mahasiswa tersebut (Kusrini dan Luthfi, 2009). Data mining dapat melakukan analisa dari kasus lama. Menurut Gratner Group data minig adalah sesuatu proses menemukan hubungan yang berarti, pola dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti statistic
dan matematika(lorse,2005). Bayesian classification merupakan pengklasifikasian statistic yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Bayesian classification didasarkan pada teorema bayes yang memiliki kemampuan klasifikasi serupa dengan decision tree dan neural network (kusrini,2009). Penelitian ini dilakukan untuk mengetahui klasifikasi mahasiswa yang melakukan herregristrasi atau tidak melakukan heregristrasi dengan algoritma Bayesian Clasification.
1.2 Landasan Teori
1.2.1 Data Mining
Data mining adalah suatu istilah yang
digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan teknik statistik,
matematika, kecerdasan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database
besar (Turban. 2005). Pengelompokan data mining berdasarkan tugas yang dapatdilakukan,
antara lain (larose:2005) :
1.
Deskripsi
Deskripsi adalah Menggambarkan pola dan kecenderungan yang terdapat dalam data yang memungkinkan memberikan penjelasan dari suatu pola atau kecenderungan tersebut.
2.
Estimasi
Estimasi hampir sama dengan klasifikasi, akan tetapi variabel target
estimasi lebih kearah numeric dari pada kearah kategori.
3.
Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, akan tetapi dalam prediksi nilai dari hasil akan terwujud di masa yang akan datang.
4.
Klasifikasi
Klasifikasi adalah proses untuk menemukan model atau fungsi yang menggambarkan dan membedakan kelas data atau konsep dengan tujuan memprediksikan kelas untuk data yang
tidak diketahuikelasnya.
5.
Clustering
Clustering atau analisis cluster adalah proses pengelompokan satu set benda-benda fisik atau abstrak kedalam kelas objek yang sama.
6.
Asosiasi
Asosiasi dalam data mining adalah menemukan atribut yang muncul dalam satu waktu dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
1.2.2 Bayesian Clasification
Bayesian Classification adalah Pengklasifikasian statistic yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Baysian
classification didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi seperti dengan decision tree dan neural network (kusrini:2009).
Teorema Bayes
memiliki bentuk umum seperti berikut:
Keterangan:
X = data dengan class yang belumdiketahui
H = hipotesa data X merupakansatu class spesifik
P(H|X) = probabilitashipotesis H berdasarkondisi X(posteriori probability)
P(H) = probabilitashipotesis H (prior probability)
P(X|H) = probabilitas X berdasarkondisipadahipotesis H
P(X) = probabilitasdari X
2. METODE PENELITIAN
2.1 Jenis Penelitian
Langkah – langkah penelitian yang dilakukan adalah perumusan masalah, penentuan teknik yang akan digunakan, pemrosesan data,
transformasi data, analisa hasil dan penarikan kesimpulan.
Preproses data
dilakukan, karena data yang didapatkan masih dalam keadaan berantakan dan harus diolah lagi terlebih dahulu, sebelum memasuki proses data selanjutnya. Setelah data ditransformasi atau diolah, kemudian masuk ke pada tahapan analisis data. Dari data training yang telah dianalisis, kemudian dibuat prediksi klasifikasi untuk kemungkinan-kemungkinan yang akan datang bagi data testing jenis yang sama.
2.2 Populasi dan Sampel
Dari data
pendaftaran tahun akademik 2011/2012 terdapat jumlah pendaftar 913 calon mahasiswa. STMIK Widya Pratama terdapat 2 jenjang yaitu D3, dan S1.
Untuk Program Studi terdapat 4 program studi, dan 3 gelombang pendaftaran, serta ada 2 status yaitu tes dan tidak tes.
Dalam memprediksi
heregristrasi mahasiswa baru dibutuhkan variable: kota, progdi, st daftar, gelombang.
Tabel 3. Pendaftaran
berdasarkan kota asal
Tabel 4. Pendaftaran
berdasarkan program studi
Tabel 5. Pendaftaran berdasarkan status tes
Tabel 6. Pendaftaran berdasarkan gelombang
2.3 Metode Pengumpulan Data
Dalam pengambilan
data primer dari data pendaftaran yang telah terintegrasi dengan sistem pendaftaran dan pengambilan data
juga dari data heregristrasi yang berada pada sistem BAAK.
3. HASIL DAN PEMBAHASAN
Terdapat 2 class yaitu Ya (heregristrasi) dan Tidak (tidak heregristrasi). Misal data X
belum diketahui classnya,
Kota : Pemalang
Progdi : Teknik Informatika
Status daftar : Bebas test
Gelombang : 3
Penyelesaian
P(Ci) merupakan prior probability untuk setiap class berdasar data contoh:
P(Ya) = 658/913 = 0,72
P(Tidak) = 255/913 = 0,28
Hitung P(X|Ci) untuk
i = 1,2
P(asal kota
=”Pemalang”|heregristrasi= “Ya”)=
P(asal
kota=”Pemalang”|heregristrasi= “Tidak”)
P(program
studi=”TI”|heregristrasi= “Ya”)=
P(program
studi=”TI”|heregristrasi= “Tidak”)
P(Status
daftar=”bebas test”|heregristrasi= “Ya”)=
P(status
daftar=”bebas test”|heregristrasi= “Tidak”)
P(gelombang =”3”|heregristrasi=
“Ya”)=
P(gelombang=”3”|heregristrasi=
“Tidak”)
P(X|heregristrasi=”Ya”)
=0.08 x 0.59 x0.64 x
0.23
=0.00695
P(X|heregristrasi=”Tidak”)
=0.12 x 0.55 x0.52
x0.15
=0.00512
P(X|heregristrasi=”ya”)
P(heregistrasi=”ya”)
0.00695 x 0,72=0.005
P(X|heregristrasi=”tidak”)
P(heregristrasi=”tidak”)
0.00512 x 0,28 = 0.001
Dari data class yang
baru dengan maka dapat diketahui jika mahasiswa tersebut akan melakukan
heregristrasi.
4. Kesimpulan
STMIK widya pratama melakukan pendaftaran mahasiswa baru untuk tiap tahun
akademik. Pada tahun akademik 2011/2012 jumlah
pendaftaran 913, dan yang melakukan heregistrasi 658, yang tidak melakukan heregistrasi 255. Jika kemungkinan pengunduran diri
diketahui lebih dini maka pihak manajemen dapat mengantisipasi. Bayesian Clasification merupakan salah satu algoritma yang ada di data
mining untuk mengklasifikasikan. Bayesian
classification dapat digunakan untuk memprediksi heregristrasi mahasiswa baru, dengan atribut seperti: kota asal, program studi, status daftar, gelombang. Dari data yang ingin diketahui kelasnya dengan variable
kota : pemalang, program studi TI, status daftar: bebas tes,
gelombang : 3. Maka dapat diprediksi bahwa calon
mahasiswa tersebut melakukan heregristrasi. Dari data yang diperoleh di bagian BAAK terdapat data
pendaftaran dan heregristrasi sebagai berikut:
Tabel. 7. Data pendaftaran dan hergistrasi tahun akademik 2011/2012
Terdapat 9 pendaftar dengan class yang telah
diketahui. Dari tabel diatas 7 mahasiswa melakukan heregistrasi dan 2 siswa tidak melakukan heregistrasi, keakuratan Bayesian
classification adalah 78 % yang dibuktikan dengan data diatas.
5. Daftar Pustaka
Kusrini and Emha Taufiq Lutfhi, 2009.Algoritma Data Mining. Andi Offset.
Yogyakarta.
Larose, Daniel T. 2005.Discovering Knowledge in Data: An Introducing to
Data Mining.: John Willey & Sons,Inc.
Turban, E, dkk 2005.Decision Support Systems and
Intelligent Systems. Yogyakarta: Andi Offcest
RE-POST dari Jurnal Devi Sugianti tentang ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA
Nama : Anita P. Angelina
NIM : 13110275
Semester : IV