Penerapan Algoritma Random Forest dengan Seleksi Fitur Recursive Feature Elimination (RFE) untuk Klasifikasi Gagal Jantung
DOI:
https://doi.org/10.47970/siskom-kb.v9i3.975Keywords:
Gagal Jantung, Machine Learning, Random Forest, Recursive Feature Elimination (RFE)Abstract
Penyakit gagal jantung merupakan salah satu penyebab utama kematian di seluruh dunia
dan menjadi tantangan besar dalam bidang kesehatan modern. Kompleksitas faktor risiko serta variasi
kondisi klinis pasien sering menyulitkan proses diagnosis dan prediksi tingkat kematian. Dalam upaya
meningkatkan akurasi prediksi, model machine learning telah banyak digunakan karena
kemampuannya dalam mengolah data klinis yang kompleks. Namun, pada penelitian sebelumnya
menunjukkan bahwa penggunaan seluruh fitur tanpa seleksi fitur dapat menyebabkan model kurang
efisien dan beresiko mengalami overfitting. Oleh karena itu, penelitian ini bertujuan untuk
mengembangkan model klasifikasi gagal jantung menggunakan algoritma Random Forest yang
dikombinasikan dengan metode seleksi fitur Recursive Feature Elimination (RFE) guna meningkatkan
akurasi dan kinerja model. Dataset yang digunakan adalah Heart Failure Clinical Records yang berisi
299 data pasien dengan 13 atribut klinis. Proses penelitian meliputi tahapan pra-pemrosesan data,
seleksi fitur menggunakan RFE, pembagian data menjadi data latih dan uji, pelatihan model Random
Forest, optimasi hiperparameter menggunakan Randomized Search CV, dan evaluasi model
menggunakan metrik akurasi, presisi, recall, F1-score, serta AUC. Hasil penelitian menunjukkan bahwa
kombinasi Random Forest dan RFE berhasil memilih sembilan fitur terbaik yaitu age,
creatinine_phosphokinase, diabetes, ejection fraction, high blood pressure, platelets, serum creatinine,
serum sedium, dan time. dengan konfigurasi model optimal menghasilkan akurasi sebesar 86,67% dan
AUC sebesar 0,9204 dengan rasio split data terbaik (80:20). Fitur yang paling berpengaruh terhadap
prediksi gagal jantung adalah ejection fraction, serum creatinine, dan time. Penelitian ini menunjukkan
bahwa kombinasi algoritma Random Forest dengan metode seleksi fitur RFE berhasil meningkatkan
efektivitas proses klasifikasi pada dataset Heart Failure Clinical Records.








