Prediksi Terkena Diabetes menggunakan Metode K-Nearest Neighbor (KNN) pada Dataset UCI Machine Learning Diabetes

  • Mika Alvionita S Institut Teknologi Sumatera
Keywords: Diabetes, K-Nearest Neighbor, UCI Machine Learning, Confusion Matrix

Abstract

Penelitian ini menggunakan algoritma K- Nearest Neighbor (KNN) untuk memprediksi resiko seseorang terkena diabetes. Variabel yang digunakan dalam prediksi adalah pregnancies, glucose, blood pressure, skin thickness, insulin, BMI, diabetes pedigree function, dan age. Analisis menunjukkan bahwa Glucose, BMI, dan Age memiliki korelasi tinggi dengan diagnosis diabetes, menjadikannya indikator yang kuat untuk prediksi. Melalui metode KNN dengan k=1, dilakukan evaluasi model menggunakan Confusion Matrix. Hasil menunjukkan akurasi sebesar 96%, precision sebesar 91,6%, sensitivitas sebesar 88,7%, dan MSE sebesar 0,1376. Temuan ini menunjukkan bahwa KNN dengan k=1 efektif dalam memprediksi diabetes berdasarkan variabel klinis. Informasi ini dapat memberikan manfaat dalam pencegahan dan pengobatan diabetes secara lebih efektif.

Downloads

Download data is not yet available.

References

[1] A. M. Argina, "Penerapan Metode Klasifikasi K-Nearest Neighbor pada Dataset Penderita Penyakit Diabetes," Indonesian Journal of Data and Science, , Vol. 1(2), pp. 29-33, Juli 2020.
[2] N. A. M. M. Jan Ahmadi Z, " Hydroalcoholic extract of Allium eriophyllum leaves attenuates cardiac impairment in rats with simultaneous type 2 diabetes and renal hypertension," Res Pharm Sci., Vol. 10(2), pp. 123-133, Mar-Apr 2015.
[3] M. P. W. U. S. L. M. Michael Kahn, UCI Machine Learning Repository,[Online].Available: https://archive.ics.uci.edu/ml/datasets/pima+indians+diabetes. [Accessed 16 5 2023].
Published
2023-11-13