Penerapan Metode Machine Learning (Random Forest & XGBoost) untuk Memprediksi Prestasi Akademik Berdasarkan Faktor Internal dan Eksternal Siswa


Risna Sari(1*); Wisnu Kurniadi(2); Muhammad Salimy Ahsan(3);

(1) Universitas Cokroaminoto Palopo
(2) Universitas Cokroaminoto Palopo
(3) Universitas PGRI Madiun
(*) Corresponding Author

  

Abstract


Penelitian ini bertujuan untuk menerapkan metode machine learning, yaitu Random Forest dan XGBoost, dalam memprediksi prestasi akademik siswa berdasarkan kombinasi faktor internal dan eksternal yang memengaruhi prestasi mereka. Data yang digunakan yakni "Performance Trends in Education" yang mencakup 6606 baris data dengan 20 kolom, terdiri dari fitur numerik dan kategorik. Dalam penelitian ini, model prediksi dilatih dengan data yang telah diproses melalui tahapan preprocessing dan pembagian data (80% untuk data training dan 20% untuk data testing). Hasil evaluasi menunjukkan bahwa XGBoost memiliki kinerja yang lebih baik dibandingkan dengan Random Forest, dengan nilai RMSE yang lebih rendah (1.909), MAPE yang lebih kecil (1.003%), dan R2 yang lebih tinggi (0.742). Hasil ini menunjukkan bahwa XGBoost mampu memberikan prediksi yang lebih akurat dan lebih baik dalam menjelaskan variabilitas data prestasi akademik siswa. Temuan ini memberikan kontribusi penting dalam pengembangan model prediksi untuk meningkatkan kebijakan pendidikan dan strategi pembelajaran yang lebih efektif. Penelitian ini juga menyarankan penelitian lebih lanjut untuk mengeksplorasi teknik ensemble lain yang dapat meningkatkan akurasi prediksi dan mempertimbangkan faktor eksternal lainnya yang dapat memengaruhi prestasi akademik siswa

Keywords


machine learning; random forest; xgboost; prestasi akademik

  
     

Article Metrics

Abstract view: 0 times
     

Digital Object Identifier

doi  https://doi.org/10.33096/busiti.v6i4.3205
  

Cite

References


A. W. Yanti, M. Z. Irwanto, D. A. Rofikha, A. Kautsar, S. M. H. Septiane, and S. Mas’ullah, “Analisis Faktor-Faktor yang Mempengaruhi Hasil Belajar Siswa : Studi Kasus Hasil Penilaian Tengah Semester Matematika,” J. Mercumatika J. Penelit. Mat. dan Pendidik. Mat., vol. 8, no. 1, Apr. 2025, doi: 10.26486/jm.v8i1.3602.

T. Hongli, “Educational data mining for student performance prediction: feature selection and model evaluation,” J. Electr. Syst., pp. 1063–1074, 2024, doi: 10.52783/jes.3434.

A. Abatal, A. Korchi, M. Mzili, T. Mzili, H. Khalouki, and M. E. K. Billah, “A Comprehensive Evaluation of Machine Learning Techniques for Forecasting Student Academic Success,” J. Electron. Electromed. Eng. Med. Informatics, vol. 7, no. 1, pp. 1–12, Jan. 2025, doi: 10.35882/jeeemi.v7i1.489.

E. Harefa, “Predicting Science Learning Outcomes Of Elementary Students In Rural Area Using Machine Learning Algorithms,” J. Soc. Sci. Res., vol. 4, pp. 3780–3792, 2024.

B. D. Setiawan, “Predicting Student Performance Using Machine Learning for Student Management in University (Study Case Maju Jaya Sentosa University),” 2023.

N. Sulistiyaningsih and R. Rismayati, “Comparison of Random Forest, Decision Tree, and XGBoost Models in Predicting Student Academic Success,” J. Artif. Intell. Softw. Eng., vol. 5, no. 3, pp. 920–930, 2025, doi: 10.30811/jaise.v5i3.7138.

D. Haryadi, A. R. Hakim, D. M. U. Atmaja, and S. N. Yutia, “Implementation of Support Vector Regression for Polkadot Cryptocurrency Price Prediction,” Int. J. Informatics Vis., vol. 6, no. 1–2, pp. 201–207, 2022, doi: 10.30630/joiv.6.1-2.945.

Scikit-learn, “RandomForestClassifier — scikit-learn 1.7.2 documentation,” scikit-learn, 2025. https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html (accessed Nov. 20, 2025).

R. Sari, L. Trihardianingsih, R. Firdaus Mulya, M. I. Arief, and K. Kusrini, “Analisis Index Vegetation Wilayah Terdampak Kebakaran Hutan Riau Menggunakan Citra Landsat-8 dan Sentinel-2,” CogITo Smart J., vol. 8, no. 2, pp. 282–294, 2022, doi: 10.31154/cogito.v8i2.439.282-294.

Z. Jin, J. Shang, Q. Zhu, C. Ling, W. Xie, and B. Qiang, “RFRSF: Employee Turnover Prediction Based on Random Forests and Survival Analysis,” Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), vol. 12343 LNCS, pp. 503–515, 2020, doi: 10.1007/978-3-030-62008-0_35.

T. Chen and C. Guestrin, “XGBoost: A scalable tree boosting system,” Proc. ACM SIGKDD Int. Conf. Knowl. Discov. Data Min., vol. 13-17-August-2016, pp. 785–794, 2016, doi: 10.1145/2939672.2939785.

K. Grace and Martin, “Measures of Model Fit for Linear Regression Models,” theanalysisfactor, 2013. https://www.theanalysisfactor.com/assessing-the-fit-of-regression-models/ (accessed Dec. 14, 2022).

R. Sari, “Optimasi Metode Lstm Dan Svm Dalam Meningkatkan Performa Prediksi Harga Cryptocurrency,” 2022.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2025 Risna Sari, Wisnu Kurniadi, Muhammad Salimy Ahsan

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.