PENERAPAN TEKNIK IMPUTASI K-MEANS TERHADAP PERFORMA HASIL KLASIFIKASI ALGORITMA NAÏVE BAYES

  • Ahmad Khusaeri Universitas Singaperbangsa Karawang

Abstract

Data merupakan salah satu komponen terpenting dalam melakukan sebuah penelitian. Ketersediaan data dapat memudahkan penelitian yang akan dilakukan. Dalam penelitian di berbagai bidang membutuhkan data yang lengkap. Namun kenyataannya adalah selalu ada beberapa komponen data yang tidak lengkap atau dikenal dengan istilah Missing Value. Penyebab terjadinya Missing Value karena informasi tentang objek tidak diberikan, sulit dicari, atau memang informasi tersebut tidak ada. Salah satu proses yang digunakan dalam menentukan serta menetapkan nilai dalam mengganti Missing Value disebut dengan teknik imputasi. Pada Option Test dengan menggunakan k-fold cross validation dengan fold sebesar 10 menghasilkan nilai akurasi tertinggi adalah dengan melakukan penanganan Missing Value dengan menghapus data sebesar 0,985 dengan Missing Value sebesar 10%. Dari total data 136, 2 data salah diprediksi dan 134 data berhasil diprediksi dengan benar. Dari ketiga metode, nilai akurasi paling tinggi sebesar 0,985 dengan penanganan Missing Value dilakukan dengan menghapus data dengan tingkat Missing Value sebesar 10%. Adapun presisi dan Recall sebesar 0,984 dan 0,985. Sedangkan dengan Option Test percetage split menghasilkan pengolahan data dengan penanganan Missing Value dengan menghapus data menghasilkan nilai akurasi tertinggi sebesar 1 dengan nilai Recall dan presisi pun sebesar 1. Dari 44 data, semua data berhasil diprediksi dengan benar. Dari beberapa hasil pengolahan data dari data hasil imputasi menunjukkan bahwa nilai akurasi tertinggi berada pada data hasil penganan Missing Value dengan cara menghapus data.

Author Biography

Ahmad Khusaeri, Universitas Singaperbangsa Karawang

Program Studi Sistem Informasi

References

[1] Miraati Laia, “Analisis Kinerja Algoritma K-Nearest Neighbor Imputation (KNNI) Untuk Missing Value Pada Klasifikasi Data Mining,” J. Informatics, Electr. Electron. Eng., vol. 2, no. 3, pp. 92–98, 2023, doi: 10.47065/jieee.v2i3.891.
[2] A. S. Arifianto, K. Dewi Safitri, K. Agustianto, and I. G. Wiryawan, “Pengaruh Prediksi Missing Value pada Klasifikasi Decision Tree C4.5,” J. Teknol. Inf. dan Ilmu Komput., vol. 9, no. 4, pp. 779–786, 2022, doi: 10.25126/jtiik.2022944778.
[3] A. R. Aziz, B. Warsito, and A. Prahutama, “Pengaruh Transformasi Data Pada Metode Learning Vector Quantization Terhadap Akurasi Klasifikasi Diagnosis Penyakit Jantung,” J. Gaussian, vol. 10, no. 1, pp. 21–30, 2021, doi: 10.14710/j.gauss.v10i1.30933.
[4] I. Eldiyana, E. Nurlaelah, and N. Herrhyanto, “Estimasi Missing Data dengan Metode Multivariate Imputation by Chained Equations (MICE) untuk Membentuk Persamaan Regresi Linier Berganda,” J. EurekaMatika, vol. 9, no. 1, pp. 95–106, 2021, doi: 10.17509/jem.v8i1.25750.
[5] D. Indriani, B. Irawan, and A. Bahtiar, “Penerapan Algoritma K-Means Clustering Untuk Menentukan Persediaan Stok Barang,” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 1, pp. 182–187, 2024, doi: 10.36040/jati.v8i1.8322.
[6] S. Darma, Y. Yusman, and J. Hendrawan, “Analisis Data Tingkat Kehadiran Pegawai dengan Menggunakan Clustering K-Means Pada Dinas Pekerjaan Umum dan Penataan Ruang Kabupaten Langkat,” J. Minfo Polgan, vol. 13, no. 1, pp. 1105–1116, 2024, doi: 10.33395/jmp.v13i1.13958.
[7] N. Widiastuti, A. Hermawan, and D. Avianto, “Implementasi Metode Naïve Bayes Untuk Klasifikasi Data Blogger,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 8, no. 3, pp. 985–994, 2023, doi: 10.29100/jipi.v8i3.3713.
[8] M. R. A. Prasetya, A. M. Priyatno, and Nurhaeni, “Penanganan Imputasi Missing Values pada Data Time Series dengan Menggunakan Metode Data Mining,” J. Inf. dan Teknol., vol. 5, no. 2, pp. 52–62, 2023, doi: 10.37034/jidt.v5i2.324.
[9] Y. Febriani, Y. P. Sari, and D. Octaria, “Metode K-Means Cluster Untuk Mengelompokkan Kota/Kabupaten di Sumatera Selatan Berdasarkan Produksi Ikan Air Tawar,” Sainmatika J. Ilm. Mat. dan Ilmu Pengetah. Alam, vol. 18, no. 2, p. 175, 2021, doi: 10.31851/sainmatika.v18i2.6722.
[10] N. A. Maori and E. Evanita, “Metode Elbow dalam Optimasi Jumlah Cluster pada K-Means Clustering,” Simetris J. Tek. Mesin, Elektro dan Ilmu Komput., vol. 14, no. 2, pp. 277–288, 2023, doi: 10.24176/simet.v14i2.9630.
[11] M. Guntara and N. Lutfi, “Optimasi Cacah Klaster pada Klasterisasi dengan Algoritma KMeans Menggunakan Silhouette Coeficient dan Elbow Method,” JuTI “Jurnal Teknol. Informasi,” vol. 2, no. 1, p. 43, 2023, doi: 10.26798/juti.v2i1.944.
[12] R. R. Adhitya, Wina Witanti, and Rezki Yuniarti, “Perbandingan Metode Cart Dan Naïve Bayes Untuk Klasifikasi Customer Churn,” INFOTECH J., vol. 9, no. 2, pp. 307–318, 2023, doi: 10.31949/infotech.v9i2.5641.
[13] A. H. Hasugian, R. A. Putri, and M. A. Simatupang, “Penerapan Algoritma Klasifikasi Naïve Bayes Untuk Analisis Sentimen Tentang Pemindahan Ibu Kota Negara,” J. Sci. Soc. Res., vol. 4307, no. 2, pp. 635–644, 2024, [Online]. Available: http://jurnal.goretanpena.com/index.php/JSSR
[14] M. F. Rizalno, A. Johar, and F. F. Coastera, “Analisis Prediksi Masa Studi Mahasiswa Menggunakan Metode Decision Tree Dengan Penerapan Algoritme Cart (Classification and Regression Trees) (Studi Kasus Data Alumni Fakultas Teknik Universitas Bengkulu),” Rekursif J. Inform., vol. 10, no. 1, pp. 96–106, 2022, doi: 10.33369/rekursif.v10i1.21362.
[15] I Putu Agus Aryawan, I Nyoman Purnama, and Ketut Queena Fredlina, “Analisis Perbandingan Algoritma Cnn Dan Svm Pada Klasifikasi Ekspresi Wajah,” J. Teknol. Inf. dan Komput., vol. 9, no. 4, pp. 399–408, 2023, doi: 10.36002/jutik.v9i4.2545.
Published
2025-02-10
How to Cite
KHUSAERI, Ahmad. PENERAPAN TEKNIK IMPUTASI K-MEANS TERHADAP PERFORMA HASIL KLASIFIKASI ALGORITMA NAÏVE BAYES. Jurnal Manajamen Informatika Jayakarta, [S.l.], v. 5, n. 1, p. 41-51, feb. 2025. ISSN 2797-0930. Available at: <https://journal.stmikjayakarta.ac.id/index.php/JMIJayakarta/article/view/1765>. Date accessed: 05 july 2025. doi: https://doi.org/10.52362/jmijayakarta.v5i1.1765.

Most read articles by the same author(s)

Obs.: This plugin requires at least one statistics/report plugin to be enabled. If your statistics plugins provide more than one metric then please also select a main metric on the admin's site settings page and/or on the journal manager's settings pages.