مدلسازی و پیش‌بینی بازده عرضه اولیه سهام با استفاده از الگوریتم‌های یادگیری ماشین تقویت گرادیان

نوع مقاله : مقاله علمی پژوهشی

نویسندگان

1 گروه حسابداری، واحد بروجر ، دانشگاه آزاد اسلامی، بروجرد ، ایران .

2 گروه حسابداری ، دانشکده اقتصاد و حسابداری، دانشگاه رازی، کرمانشاه ، ایران

3 گروه مهندسی کامپیوتر، واحد بروجرد، دانشگاه آزاد اسلامی، بروجرد، ایران

4 گروه حسابداری ، واحد بروجرد، دانشگاه آزاد اسلامی ، بروجرد ، ایران

10.22059/frj.2025.400625.1007779

چکیده

هدف: این پژوهش با هدف توسعه مدلی نوین مبتنی بر الگوریتم تقویت گرادیان و معماری ترانسفورمر برای پیش‌بینی دقیق نسبت‌های ارزش‌گذاری شرکت‌ها در زمان عرضه اولیه سهام در بازار ایران انجام شده است. برخلاف رویکردهای سنتی که بر بازده روز اول تمرکز دارند، این تحقیق به ارزیابی قیمت‌گذاری نسبی شرکت‌ها از طریق سه نسبت کلیدی (ارزش بازار به ارزش دفتری، ارزش شرکت به کل دارایی‌ها، و ارزش شرکت به فروش) می‌پردازد. با توجه به پیچیدگی‌های بازار ایران شامل نوسانات شدید اقتصادی، تورم مزمن، تحریم‌های اقتصادی و محدودیت‌های نظارتی، این پژوهش ابزاری کارآمد برای سرمایه‌گذاران، پذیره‌نویسان و نهادهای نظارتی جهت تصمیم‌گیری آگاهانه‌تر ارائه می‌دهد.

روش‌شناسی: این مطالعه با رویکرد کمی-کاربردی و با استفاده از داده‌های 163 شرکت (42 بورسی و 121 فرابورسی) در بازه 1392 تا 1402 انجام شد. این دوره شامل شرایط اقتصادی متنوع از جمله تحریم‌های شدید، نوسانات ارزی، رکود و رونق اقتصادی است. متغیرهای مستقل شامل ویژگی‌های مالی شرکت‌ها (اندازه، نسبت بدهی، سودآوری، بازده دارایی‌ها، حاشیه سود، نسبت جریان نقدی، اهرم مالی و میانگین موزون هزینه سرمایه) و متغیرهای کلان اقتصادی (نرخ تورم، شاخص کل بورس، شاخص تحریم، نرخ ارز و نرخ بهره) بودند. معماری پیشنهادی ترکیبی از الگوریتم‌های درختی تقویت گرادیان، شبکه‌های حافظه طولانی-کوتاه‌مدت و مکانیزم‌های خودتوجهی است که از طریق جستجوی خودکار معماری بهینه‌سازی شد. پارامترهای بهینه شامل نرخ یادگیری 0.001، 150 درخت تصمیم، 4 گام زمانی و 3 لایه خودتوجهی است. مدل با روش‌های سنتی (رگرسیون خطی) و پیشرفته (الگوریتم‌های تقویت گرادیان استاندارد، جنگل تصادفی و شبکه‌های عصبی بازگشتی) مقایسه و اعتبارسنجی از طریق روش اعتبارسنجی متقابل ده‌تایی و بوت‌استرپ انجام شد.

یافته‌ها: نتایج تحقیق برتری قاطع مدل پیشنهادی را در پیش‌بینی هر سه نسبت ارزش‌گذاری نشان داد. برای نسبت ارزش بازار به ارزش دفتری، مدل توسعه‌یافته با ضریب تعیین 0.853 و ریشه میانگین مربعات خطای 0.497، بهبود 60 درصدی در دقت پیش‌بینی نسبت به رگرسیون خطی (ضریب تعیین 0.534) حاصل کرد. در پیش‌بینی نسبت ارزش شرکت به کل دارایی‌ها، ضریب تعیین 0.865 و کاهش 69 درصدی میانگین مربعات خطا (از 0.152 به 0.047) حاصل شد. برای نسبت ارزش شرکت به فروش نیز با ضریب تعیین 0.846، بهبود 67 درصدی در دقت نسبت به روش‌های سنتی مشاهده گردید. سایر مدل‌های پیشرفته نیز عملکرد قابل قبولی داشتند اما به سطح مدل پیشنهادی نرسیدند. آزمون‌های اعتبارسنجی متقابل پایداری بالای مدل را با انحراف معیار بسیار پایین (در حدود 0.01) تأیید کرد که نشان‌دهنده قابلیت تعمیم‌پذیری و اعتماد‌پذیری مدل در شرایط مختلف است. تحلیل اهمیت متغیرها نشان داد که نرخ تورم با میانگین اهمیت 0.19 به عنوان دومین عامل مهم در تمامی مدل‌ها عمل می‌کند که بیانگر تأثیر عمیق شرایط اقتصادی کلان بر ارزش‌گذاری شرکت‌ها در بازار ایران است. بازده دارایی‌ها با اهمیت 0.21 برای نسبت ارزش بازار به ارزش دفتری، حاشیه سود با اهمیت 0.225 برای نسبت ارزش شرکت به فروش، و نسبت جریان نقدی به دارایی‌ها با اهمیت 0.2 برای نسبت ارزش شرکت به دارایی‌ها به عنوان مهم‌ترین شاخص‌های عملکرد مالی شناسایی شدند.

نتیجه‌گیری: یافته‌ها بر اهمیت به‌کارگیری تکنیک‌های نوین یادگیری ماشین در پیش‌بینی نسبت‌های ارزش‌گذاری عرضه‌های اولیه تأکید دارد. مدل توسعه‌یافته با کاهش 60 تا 69 درصدی خطای پیش‌بینی، ابزاری پیشرفته برای پذیره‌نویسان، سرمایه‌گذاران و مدیران سرمایه فراهم می‌آورد تا ریسک کم‌ارزش‌گذاری یا بیش‌ارزش‌گذاری را کاهش دهند. شناسایی نقش محوری نرخ تورم نشان‌دهنده حساسیت بالای ارزش‌گذاری‌ها به شرایط کلان اقتصادی در بازار ایران است. این تحقیق در سه حوزه کلیدی مشارکت دارد: معرفی معماری نوین ترکیبی، ارائه چارچوب جامع اعتبارسنجی، و شناسایی تفاوت‌های اهمیت متغیرها برای نسبت‌های مختلف ارزش‌گذاری در شرایط اقتصادی ناپایدار.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Modeling and Predicting IPO Returns Using Gradient Boosting Machine Learning Algorithms

نویسندگان [English]

  • Fatemeh Malmir 1
  • Farshid kheirollahi 2
  • Hossein Yarahmadi 3
  • Farid Sefaty 4
1 Department of accounting, Bo.C., Islamic Azad University , Borujerd , Iran
2 Department of accounting ,Faculty economic and accounting , Razi university , Kermanshah , iran.
3 Department of computer Engineering, Bo.C. Islamic Azad University , Borujerd , Iran
4 department of accounting, Bo.C., Islamic Azad University , Borujerd , Iran
چکیده [English]

Objective: This research aims to develop a novel model based on the Gradient Boosting algorithm and Transformer architecture for accurately predicting corporate valuation ratios at the time of Initial Public Offering (IPO) in the Iranian market. Contrary to traditional approaches focusing on first-day returns, this study evaluates the relative pricing of companies through three key ratios: Price-to-Book Value (P/B), Enterprise Value-to-Total Assets (EV/TA), and Enterprise Value-to-Sales (EV/S). Given the complexities of the Iranian market, including severe economic volatility, chronic inflation, economic sanctions, and regulatory restrictions, this research provides an efficient tool for investors, underwriters, and regulatory bodies to make more informed decisions.

Methodology: This quantitative-applied study utilized data from 163 companies (42 listed on the Tehran Stock Exchange and 121 on the over-the-counter market - Farabourse) spanning the period 1392 to 1402 (approximately 2013-2023). This period encompasses diverse economic conditions, including severe sanctions, currency fluctuations, recession, and economic booms. Independent variables included firm-specific financial features (size, debt ratio, profitability, return on assets, profit margin, cash flow ratio, financial leverage, and weighted average cost of capital) and macroeconomic variables (inflation rate, main stock market index, sanctions index, exchange rate, and interest rate). The proposed architecture is a hybrid of Gradient Boosting Decision Trees, Long Short-Term Memory (LSTM) networks, and self-attention mechanisms, optimized through an Automated Machine Learning (AutoML) architecture search. Optimal parameters included a learning rate of 0.001, 150 decision trees, 4-time steps, and 3 self-attention layers. The model was compared with traditional methods (Linear Regression) and advanced methods (standard Gradient Boosting algorithms, Random Forest, and Recurrent Neural Networks) and validated using ten-fold cross-validation and bootstrapping.

Findings: The results demonstrated the decisive superiority of the proposed model in predicting all three valuation ratios. For the Price-to-Book Value ratio, the developed model achieved an R2 of 0.853 and a Root Mean Square Error (RMSE) of 0.497, representing a 60% improvement in prediction accuracy compared to Linear Regression (R2 of 0.534). In predicting the Enterprise Value-to-Total Assets ratio, an R2 of 0.865 and a 69% reduction in Mean Squared Error (MSE) (from 0.152 to 0.047) were obtained. For the Enterprise Value-to-Sales ratio, an R2 of 0.846 was achieved, showing a 67% improvement in accuracy over traditional methods. Other advanced models also performed acceptably but did not reach the level of the proposed model. Cross-validation tests confirmed the model's high stability with a very low standard deviation (around 0.01), indicating its generalizability and reliability under various conditions. Variable importance analysis revealed that the inflation rate acts as the second most important factor across all models, with an average importance of 0.19, indicating the profound impact of macroeconomic conditions on corporate valuation in the Iranian market. Return on Assets (0.21) was identified as the most important financial performance indicator for the P/B ratio, Profit Margin (0.225) for the EV/S ratio, and Cash Flow to Assets Ratio (0.2) for the EV/TA ratio.

Conclusion: The findings emphasize the importance of employing novel machine learning techniques in predicting IPO valuation ratios. The developed model, by reducing prediction error by 60% to 69%, provides an advanced tool for underwriters, investors, and fund managers to mitigate the risk of undervaluation or overvaluation. The identification of the pivotal role of the inflation rate highlights the high sensitivity of valuations to macroeconomic conditions in the Iranian market. This research contributes in three key areas: introducing a novel hybrid architecture, providing a comprehensive validation framework, and identifying the differential importance of variables for various valuation ratios under unstable economic conditions.

کلیدواژه‌ها [English]

  • Prediction
  • Initial Public Offering (IPO)
  • Gradient Boosting Algorithm
  • Machine Learning
  • Iranian Capital Market