بررسی و تطبیق قدرت تخمین مدل‌های یادگیری ماشین و مدل‌های آماری در پیش‌بینی جهت تغییرات اجزای سود و انتخاب مدل بهینه

نوع مقاله : مقاله علمی پژوهشی

نویسندگان

1 کارشناس ارشد حسابداری مدیریت

2 دانشگاه ارومیه

3 گروه حسابداری، دانشگاه ارومیه، ارومیه، ایران

10.22059/frj.2024.373472.1007580

چکیده

هدف: هدف از پیش‌بینی تغییرات سود، ایجاد آگاهی در سرمایه‌گذاران، تحلیلگران مالی، مدیران، مسئولین بازار سهام، اعتباردهندگان و سایر استفاده‌کنندگان به منظور قضاوت نمودن واحد تجاری، تصمیم‌گیری در مورد خرید یا فروش سهام و یا اعطا یا عدم اعطای وام و اعتبارات است. هدف از این پژوهش ارزیابی عملکرد و مقایسه دقت پیش‌بینی مدل‌های یادگیری ماشین و مدل‌های آماری در پیش‌بینی جهت تغییرات سه مولفه سود از جمله سود (زیان) خالص، سود (زیان) ناخالص و سود (زیان) عملیاتی است.



روش‌شناسی: در این پژوهش با استفاده از اطلاعات مالی 139 شرکت تولیدی پذیرفته شده در بورس اوراق بهادار تهران در دوره زمانی 15 ساله، طی سال‌های 1387 تا 1401 و با به کارگیری 25 مدل یادگیری ماشین و 10 مدل آماری، به بررسی مقایسه کارایی مدل‌های یادگیری ماشین و مدل‌های آماری در پیش‌بینی جهت تغییرات اجزای سود از جمله سود (زیان) خالص، سود (زیان) ناخالص و سود (زیان) عملیاتی پرداخته شده است. در پژوهش حاضر از نرم‌افزارExcel برای مرتب‌سازی داده‌ها، از نرم‌افزار Eviwes برای استخراج آمار توصیفی و از نرم‌افزارهای داده‌کاوی SPSS Modeler و Rapidminer برای مدل‌سازی پیش‌بینی جهت تغییرات سود استفاده شده است. ارزیابی عملکرد مدل‌های یادگیری ماشین به وسیله دو معیار accuracy (دقت پیش‌بینی مدل) و AUC (ناحیه زیر منحنی) و ارزیابی عملکرد مدل‌های آماری تنها با معیار accuracy انجام شده است. در نهایت به منظور انتخاب مدلی که بهترین عملکرد را برای پیش‌بینی جهت تغییرات سود (زیان) خالص، سود (زیان) ناخالص و سود (زیان) عملیاتی دارد، از میان مدل‌های یادگیری ماشین به انتخاب مدل بهینه با استفاده از منحنی ROC پرداخته شده است.



یافته‌ها: پس از محاسبه متوسط دقت پیش‌بینی مدل‌های یادگیری ماشین و مدل‌های آماری مشخص شد متوسط دقت پیش‌بینی مدل‌های یادگیری ماشین برای متغیرهای وابسته (درصد تغییرات سود (زیان) خالص، درصد تغییرات سود (زیان) ناخالص و درصد تغییرات سود (زیان) عملیاتی) از 83 درصد تا 93 درصد و متوسط دقت پیش‌بینی مدل‌های آماری برای هر سه مولفه سود از 76 درصد تا 83 درصد متغیر است. پس از احراز نرمال نبودن متوسط دقت مدل‌های یادگیری ماشین و مدل‌های آماری برای اجزای سود توسط آزمون کلموگروف_اسمیرنف، از آزمون ناپارامتریک یومن‌‌ویتنی برای مقایسه دقت پیش‌بینی مدل‌های یادگیری ماشین و مدل‌های آماری در پیش‌بینی جهت تغییرات اجزای سود استفاده شد.



نتیجه‌گیری: نتایج آزمون فرضیه‌های پژوهش، نوید‌دهنده‌ی کارایی بالای مدل‌های یادگیری ماشین‌ در پیش‌بینی جهت تغییرات سود (زیان) خالص، سود (زیان) ناخالص و سود (زیان) عملیاتی نسبت به مدل‌های آماری می‌باشد. نتایج منحنی ROC نیز نشانگر آن است که مدل Decision tree با دقت پیش‌بینی معادل 100 درصد در پیش‌بینی جهت تغییرات سود (زیان) خالص و دقت پیش‌بینی معادل 38/99 درصد در پیش‌بینی جهت تغییرات سود (زیان) ناخالص و مدل Rule induction با دقت پیش‌بینی معادل 76/86 درصد در پیش‌بینی جهت تغییرات سود (زیان) عملیاتی، بهترین عملکرد را دارند و به عنوان مدل بهینه انتخاب شده‌اند.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Reviewing and matching the estimated power of Machine Learning Models and Statistical Models in Predicting Changes in Profit Components and Selecting the Optimal Model

نویسندگان [English]

  • Maryam Izadi 1
  • ali ashtab 2
  • Akbar Zavari Rezaei 3
1 Master in Managerial Accounting
2 urmia university
3 Department of Accounting, Urmia University, Urmia, Iran
چکیده [English]

Objective

The purpose of forecasting profit changes is to inform investors, financial analysts, managers, stock market authorities, creditors and other users in order to judge the entity, to decide whether to buy or sell shares or to grant or not to grant loans and credits. The purpose of this study is to evaluate performance and compare the accuracy of prediction of machine learning models and statistical models in predicting changes in three components of profit including net profit (loss), gross profit (loss) and operating profit (loss).



Methods

In this research, using financial information of 139 manufacturing companies listed in Tehran Stock Exchange during the 15-year period, during 2007-2022 and employing 25 machine learning models and 10 statistical models, the comparison of the efficiency of machine learning models and statistical models in predicting the changes in profit components such as net profit (loss), gross profit (loss) and operating profit (loss) has been discussed. In the present study, Excel software for sorting data, Eviwes software for extracting descriptive statistics, and SPSS Modeler and Rapidminer software were used for predicting earnings changes. Evaluating the performance of machine learning models has been done by two criteria of accuracy (prediction accuracy of model) and AUC (Area under curve) and performance evaluation of statistical models is done only with accuracy. . Finally, in order to select the model that has the best performance for predicting the changes in net profit (loss), gross profit (loss) and operating profit (loss), the optimal model has been selected using ROC curve among machine learning models.



Results

After calculating the average predictive accuracy of machine learning models and statistical models, it was found that the average predictive accuracy of machine learning models for dependent variables (percentage of changes in net profit (loss), percentage of gross profit (loss) changes and percentage of changes in operating profit (loss)) ranged from 83% to 93% and the average accuracy of statistical models for all three components of profit ranged from 76% to 83%. After check outing the non-normalization of the Average prediction accuracy of machine learning models and statistical models for the profit components by Kolmogorov-Smirnov test, non-parametric U-Mann-Whitney test was used to compare the accuracy of prediction of machine learning models and statistical models in predicting for the changes in the components of profit.



Conclusion

The results of testing the research hypotheses indicate high efficiency of machine learning models in predicting the changes in net profit (loss), gross profit (loss) and operating profit (loss) than statistical models. The results of ROC curve also indicate that the decision tree model with 100% accuracy in predicting the direction of net profit (loss) changes and 99.38% accuracy in predicting the direction of gross profit (loss) changes and Rule induction model with 86.76% prediction accuracy in predicting direction of profit (loss) operation, are the best performers and have been selected as the optimal model.

کلیدواژه‌ها [English]

  • Direction of profit changes
  • Machine learning models
  • Statistical models