Case based reasoning untuk deteksi kemungkinan penyakit jantung menggunakan algoritma KNN
data yang dipakai merupakan data penyakit jantung dari Cleveland Clinic Foundation. sumber
Sample data :
Indeks | age | sex | cp | trestbps | chol | fbs | restecg | thalach | exang | oldpeak | slope | ca | thal | target |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 63.0 | 1.0 | 1.0 | 145.0 | 233.0 | 1.0 | 2.0 | 150.0 | 0.0 | 2.3 | 3.0 | 0.0 | 6.0 | 0 |
1 | 67.0 | 1.0 | 4.0 | 160.0 | 286.0 | 0.0 | 2.0 | 108.0 | 1.0 | 1.5 | 2.0 | 3.0 | 3.0 | 1 |
2 | 67.0 | 1.0 | 4.0 | 120.0 | 229.0 | 0.0 | 2.0 | 129.0 | 1.0 | 2.6 | 2.0 | 2.0 | 7.0 | 1 |
keterangan fitur :
- age — age in years
- sex — (1 = male; 0 = female)
- cp — chest pain type
- trestbps — resting blood pressure (in mm Hg on admission to the hospital)
- chol — serum cholestoral in mg/dl
- fbs — (fasting blood sugar > 120 mg/dl) (1 = true; 0 = false)
- restecg — resting electrocardiographic results
- thalach — maximum heart rate achieved
- exang — exercise induced angina (1 = yes; 0 = no)
- oldpeak — ST depression induced by exercise relative to rest
- slope — the slope of the peak exercise ST segment
- ca — number of major vessels (0–3) colored by flourosopy
- thal — 3 = normal; 6 = fixed defect; 7 = reversable defect
- target — have disease or not (1=yes, 0=no)
Algoritma k-Nearest Neighbor adalah algoritma supervised learning dimana hasil dari instance yang baru diklasifikasikan berdasarkan mayoritas dari kategori k-tetangga terdekat. pada kasus ini nilai K yang digunakan adalah 5
Distance yang digunakan pada algoritma KNN dalam kasus ini adalah Minkowski Distance
KD-Tree digunakan untuk indexing kasus. sehingga dapat mempercepat hasil pencarian kasus
berikut tampilan aplikasi :