ДОСЛІДЖЕННЯ ЕФЕКТИВНОСТІ КЛАСИЧНИХ ТА НЕЙРОМЕРЕЖЕВИХ МЕТОДІВ РЕГРЕСІЙНОГО ПРОГНОЗУВАННЯ

Автор(и)

  • Іван Хамар Львівський національний університет імені Івана Франка
  • Ігор Оленич Львівський національний університет імені Івана Франка https://orcid.org/0000-0002-6642-0222

Ключові слова:

великі масиви даних, регресія, Random Forest, DNN, нейронна мережа, ML

Анотація

У цій статті представлено порівняльний аналіз класичних та нейронних регресійних моделей для обробки великих наборів даних. Було реалізовано три підходи: регресор випадкового лісу та дві щільні нейронні мережі — базову версію PyTorch та покращену модель TensorFlow з шарами Dropout та BatchNormalization. У той час як класична модель досягла помірної точності (R² = 0,7404), покращена глибока нейронна мережа (DNN) дала найкращі результати (RMSE = 0,1570, R² = 0,9346). Дослідження підтверджує потенціал нейронних мереж для високоточної регресії за умови застосування регуляризації, нормалізації та налаштування гіперпараметрів.

Посилання (Бібліографія)

Bjerre L.M., Peixoto C., Alkurd R., Talarico R., Abielmona R. Comparing AI/ML approaches and classical regression for predictive modeling using large population health databases: Applications to COVID-19 case prediction. Global Epidemiology. 2024. Vol. 8. 100168. https://doi.org/10.1016/j.gloepi.2024.100168

Breiman L. Random Forests. Machine Learning. 2001. Vol. 45(1). P. 5–32. https://doi.org/10.1023/A:1010933404324

Chen Y., Zhang Y. A Study of Optimization in Deep Neural Networks for Regression. Electronics. 2023. Vol. 12(14). Article 3071. https://doi.org/10.3390/electronics12143071

Mehta V., Batra N., Poonam, Goyal S., Kaur A., Dudekula K. V., Victor G. J. Machine Learning based Exploratory Data Analysis (EDA) and Diagnosis of Chronic Kidney Disease (CKD). EAI Endorsed Transactions on Pervasive Health and Technology. 2024. Vol. 10. https://doi.org/10.4108/eetpht.10.5512

Pargent F., Pfisterer F., Thomas J., Bischl B. Regularized target encoding outperforms traditional methods in supervised machine learning with high cardinality features. Statistical Papers. 2022. Vol. 63. P. 1353–1375. https://doi.org/10.1007/s00180-022-01207-6

Chicco D., Warrens M. J., Jurman G. The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. PeerJ Computer Science. 2021. Vol. 7. Article e623. https://doi.org/10.7717/peerj-cs.623

Joseph A., Singh A. Optimal ratio for data splitting. Statistical Analysis and Data Mining: The ASA Data Science Journal. 2022. Vol. 15(1). P. 1–10. https://doi.org/10.1002/sam.11583

##submission.downloads##

Опубліковано

03.06.2025