پیش‌بینی تعهدهای آتی شرکت‌های بیمه با استفاده از مدل حافظۀ بلندمدت ـ کوتاه‌مدت

نوع مقاله : مقاله علمی پژوهشی

نویسندگان

1 دانشجوی دکتری، گروه مدیریت دولتی، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی، تهران، ایران.

2 استاد، گروه مدیریت دولتی، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی، تهران، ایران.

3 استاد، گروه آموزشی مهندسی هسته‌ای، دانشکده فیزیک و مهندسی انرژی، دانشگاه صنعتی امیرکبیر، تهران، ایران.

4 دانشیار، گروه مدیریت صنعتی، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی، تهران، ایران.

10.22059/frj.2024.367421.1007532

چکیده

هدف: این پژوهش به‌دنبال ارائۀ مدلی برای محاسبۀ تعهدهای آتی شرکت‌های بیمه است تا به چالش‌های بالقوۀ موجود در روش سنتی پاسخ مناسبی دهد. به‌صورت سنتی، شرکت‌های بیمه از روش زنجیرۀ نردبانی، به‌عنوان نوعی ابزار آماری، برای پیش‌بینی روند توسعۀ خسارت‌ها استفاده می‌کنند. این روش آماری به‌دلیل سادگی فرضیه‌ها و تفسیر روشن، تأیید نهادهای نظارتی در کشورهای مختلف را نیز به همراه دارد. با این حال، وجود فرضیه‌هایی نظیر ایستایی در ساختار توسعۀ داده‌ها و ارتباط خطی بین متغیرها، ممکن است کارایی مدل را در مواجهه با تغییرات ناشی از عوامل داخل و خارج از سازمان، مانند اِعمال سیاست‌های داخلی یا عوامل خارجی مانند همه‌گیری کووید۱۹ متأثر سازد. محاسبۀ نزدیک به واقعیت تعهدهای شرکت‌های بیمه با توانگری مالی آن‌ها ارتباط تنگاتنگی دارد. مبلغی که شرکت‌های بیمه برای پاسخ به تعهدهای آتی خود تخصیص می‌دهند، به‌عنوان ذخیره شناسایی می‌شود. محاسبۀ ذخایر کمتر از تعهدهای آتی، شرکت بیمه را در ایفای تعهدهایش دچار مشکل می‌کند و از سویی دیگر، محاسبۀ بیش از مبلغ مورد نیاز، صورت‌های مالی شرکت‌های بیمه را تحت تأثیر قرار می‌دهد.
روش: مدل ارائه شده در این پژوهش با استفاده از یادگیری ماشین و هوش مصنوعی، تعداد حوادث روزانه با خسارت‌های جانی را در بخش بیمۀ شخص ثالث پیش‌بینی می‌کند. خروجی این مدل، یعنی ترکیب تعداد و زمان وقوع حوادث، در محاسبۀ تعهدهای آتی و ذخیرۀ خسارت در این بخش بیمه‌ای نقش کلیدی دارد. این مدل با کمک داده‌های تاریخی خسارت بیمه‌گذاران شرکت بیمۀ کارآفرین، در بخش بیمۀ شخص ثالث آموزش دیده است. این مدل قادر است لایه‌های پنهان و ارتباطات غیرخطی و پیچیدۀ بین داده‌های خسارتی را شناسایی کند. در این پژوهش، از الگوریتم شبکۀ عصبی با حافظۀ بلندمدت ـ کوتاه‌مدت که در سری‌های زمانی توانایی پیش‌بینی بیشتری دارد، استفاده شده است. داده‌های تاریخی مربوط به خسارت‌های جرحی بیمه‌گذاران، در بازۀ زمانی فروردین ۱۳۹۶ تا شهریور ۱۴۰۰ بوده است.
یافته‌ها: کارایی مدل با بهینه‌سازی ابرپارامترها ارتباط نزدیک دارد. برای بهینه‌سازی مدل دو رویکرد، یعنی جست‎وجوی شبکه‌ای و تصادفی برای شناسایی ابرپارامترها با یکدیگر مقایسه شده‌اند. میانگین مربعات خطا به‌عنوان شاخص سنجش عملکرد در نظر گرفته شده است. این شاخص برای داده‌های آموزش، در هر دو مدل با فاصلۀ کمی از یکدیگر (33/16 در مقابل 4/17) برتری جست‌‎وجوی شبکه‌ای را نشان می‌دهد؛ اما در این روش، نتیجۀ داده‌های آزمون از داده‌های آموزش بهتر بود (22/15 در برابر 33/16) که این امر می‌تواند نشانه‌ای از وقوع بیش‌پردازش باشد.
نتیجه‌گیری: این مقاله برای طراحی مدل پیش‌بینی تعداد روزانۀ حوادث با خسارت‌های جانی، استفاده از روش جست‎وجوی تصادفی را برای تنظیم ابرپارامترهای مدل طراحی شده بر مبنای شبکۀ عصبی حافظۀ بلندمدت ـ کوتاه‌مدت پیشنهاد می‌کند؛ زیرا مدل طراحی‌شده بر این مبنا، بر مشکل بیش‌پردازش غلبه می‌کند و می‌تواند در کار با داده‌های ناآشنا عملکرد مناسبی داشته باشد. بیش‌پردازش زمانی رخ می‌دهد که مدل بیش از حد از داده‌های آموزشی تأثیر بگیرد و نه تنها الگوهای واقعی را یاد بگیرد، بلکه نویزها و جزئیات جزئی داده‌ها را نیز یاد بگیرد. این ممکن است باعث کاهش جامع‌پذیری مدل شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Forecasting Insurance Company Commitments with Long Short-Term Memory Models

نویسندگان [English]

  • Negar Tehraniyazdi 1
  • Reza Vaezi 2
  • Saeed Setayeshi 3
  • Iman Raeesi Vanani 4
1 Ph.D Candidate, Department of Public Administration, Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran.
2 Prof., Department of Public Administration, Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran.
3 Prof., Department of Physics and Energy Engineering Nuclear Engineering, Faculty of Physics and Energy Engineering, Amirkabir University of Technology, Tehran, Iran.
4 Associate Prof., Department Industrial Management, Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran.
چکیده [English]

Objective
This study aims to present a novel model for predicting the future commitments of insurance companies that can adequately address the potential challenges of traditional methods. Traditionally, insurance companies use the Chain Ladder approach as a statistical tool to forecast the trend of claims development. This statistical method is favored by regulatory authorities in various countries due to its simplicity in assumptions and clear interpretation. However, certain assumptions, such as the stability of data development and linear relationships between variables, can affect the efficiency of this model when faced with internal policies or external factors like the COVID-19 pandemic. Forecasting future commitments close to reality is closely related to the financial stability of insurance companies. The amount that insurance companies allocate to meet their future obligations is identified as reserves. Calculating reserves that are less than the required amounts can pose challenges for insurance companies in fulfilling their commitments while calculating more than necessary amounts can negatively impact the financial statements of insurance companies.
 
Methods
In this study, a dynamic model based on machine learning algorithms is proposed. The model's output, which combines the number and timing of bodily injury accidents, plays a crucial role in calculating reserves for non-life insurance products. This model is specifically trained to predict the frequency of accidents in Vehicle Third-Party Liability Insurance. It can identify hidden patterns and non-linear, complex relationships within claims data. A Long Short-Term Memory (LSTM) neural network algorithm is employed, recognized for its strong predictive capability in time series data. The model is trained using historical data from Karafarin Insurance Company covering the years 2017 to 2021.
 
Results
The performance of the model is highly related to the hyperparameters chosen for the model. Two of the most common approaches for tuning the hyperparameters are tested in this study. These Two models are grid and random search. The Root Mean Square Error (RMSE) is used as a performance metric, and it indicates that the grid search has a lower RMSE than the random search for the training data with a slight difference (16.33 versus 17.4). However, the results for the test data in the grid search have a sign of overfitting.
 
Conclusion
This study recommends using random search for tuning the hyperparameters of the model to predict the frequency of daily incidents. The evaluation of the two approaches for tuning hyperparameters indicates that random search is more suitable for working with unfamiliar data and managing overfitting situations. Overfitting occurs when the model becomes overly influenced by the training data, learning not only the actual patterns but also the noise and minor details of the data. This issue can negatively impact the model's generalization ability.

کلیدواژه‌ها [English]

  • Insurance commitments
  • Machine learning
  • Long Short-Term Memory (LSTM)
  • Hyperparameter tuning
  • Overfitting
حاجی لو، ریحانه و کاظمی بوکانی، سید اسماعیل (1401). نقش هوش مصنوعی و سیستم‌های خبره در توسعۀ صنعت بیمه با رویکرد مرور ادبیات پژوهش. دهمین کنفرانس بین‌المللی پژوهش‏های نوین حسابداری، مدیریت و علوم انسانی در هزاره سوم. تهران.
شریفی، مهدی؛ سربخشیان، احمد و رشیدی، آیدین (1397). کاربرد الگوریتم‏های یادگیری ماشینی در پیش‏بینی ریسک بیمه‌های زندگی. بیست‌وپنجمین همایش ملی بیمه و توسعه. تهران، ایران.
احمدی، سیما و نبی‌زاده، علی (1402). استفاده از مدل حافظه طولانی کوتاه‏مدت پیچشی برای پیش‏بینی سیلاب در استان گلستان، ایران. نشریه علمی پژوهشی سنجش از دور و اطلاعات مکانی، 1(2)، 239- 246.
سهرابی، بابک، رئیسی وانانی، ایمان و قانونی شیشوان، وحیده (1394). ارزیابی عملکرد شرکت‏ها و تحلیل روندهای مالیاتی با استفاده از اگوریتم داده‌کاوی. تحقیقات مالی، 17(2)، 219- 238.
عباسیان، عزت اله؛ ابراهیمی، محسن و فرزانگان، الهام (1394). طراحی بهینۀ اوراق بهادارسازی در رابطه کارفرما-کارگزار براساس رویکرد استنباط بیزین از مخاطرۀ اخلاقی. تحقیقات مالی، 17(1)، 123- 140.
باغبانی، غزاله و اسکندری، فرزاد (1396). برآورد وجه نقد ورودی و خروجی شعب بانک تجارت برای محاسبه وجه نقد مورد نیاز شعبه با استفاده از تحلیل چندمتغیره خوشه‌بندی بیزین و پیاده‌سازی آن در شبکه‏های عصبی. تحقیقات مالی، 19(1)، 41- 60.
زیادی، حسین؛ صلواتی، عرفان و لطفی هروی، محمدمهدی (1402). پیش‌بینی قیمت مسکن با استفاده از الگوریتم هوش مصنوعی LSTM. تحقیقات مالی، 25(4)، 557- 576.
 
References
Abbasian, E., Ebrahimi, M. & Farzanegan, E. (2015). Optimal design of securitization in a principal-agent relationship based on Bayesian inference for moral hazard. Financial Research Journal, 17(1), 123-140. doi: 10.22059/jfr.2015.50708 (in Persian)
Ahmadi, S., & Nabizadeh, A. (2023). Using Convolutional Long Short-Term Memory Model for Flood Prediction in Golestan Province, Iran. Journal of Remote Sensing and Geoinformation Research, 1(2), 239-246. doi: 10.22061/jrsgr.2023.2021 (in Persian)
Araujo, J., Patnam, M., Popescu, A., Valencia, F., & Yao, W. (2024). Effects of macroprudential policy: Evidence from over 6000 estimates. Journal of Banking & Finance, 169, 107273.
Avanzi, B., Wong, B. & Yang, X. (2016). A micro-level claim count model with overdispersion and reporting delays. Insurance: Mathematics and Economics, 71, 1-14.
Baghbabi, G. & Eskandari, F. (2017). Estimation of Input & Output Cash of Tejarat Branches in order to Calculate Branches’ Required Cash Via Multivariate Bayesian Clustering Analysis and the Implementation in Neural Network. Financial Research Journal19(1), 41-60. doi: 10.22059/jfr.2017.60152 (in Persian)
Balona, C., & Richman, R. (2020). The actuary and IBNR techniques: A machine learning approach. Available at SSRN 3697256.
Bellec, G., Salaj, D., Subramoney, A., Legenstein, R., & Maass, W. (2018). Long short-term memory and learning-to-learn in networks of spiking neurons. Advances in neural information processing systems, 31.
Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization. Journal of machine learning research, 13(2).
Blier-Wong, C., Cossette, H., Lamontagne, L., & Marceau, E. (2020). Machine learning in P&C insurance: A review for pricing and reserving. Risks, 9(1), 4.
Bolancé, C. & Vernic, R. (2020). Frequency and severity dependence in the collective risk model: an approach based on Sarmanov distribution. Mathematics8(9), 1400.
Brownlee, J. (2018). How to develop LSTM models for time series forecasting. Machine learning mastery, 14.
Brownlee, J. (2019). How to Prepare Univariate Time Series Data for Long Short-Term Memory Networks. Deep Learning for Time Series.
Chai, T., & Draxler, R. R. (2014). Root mean square error (RMSE) or mean absolute error (MAE)? Model Development Discussion, 7(3),1247-1250.
Chen, G. (2018). A Gentle Tutorial of Recurrent Neural Network with Error Backpropagation. arXiv:1801.01078, 1-10.
Cheng, G., Peddinti, V., Povey, D., Manohar, V., Khudanpur, S., & Yan, Y. (2017, August). An Exploration of Dropout with LSTMs. In Interspeech (pp. 1586-1590).
Crevecoeur, J., Antonio, K. & Verbelen, R. (2019). Modeling the number of hidden events subject to observation delay. European Journal of Operational Research, 277(3), 930-944.
De Felice, M., & Moriconi, F. (2019). Claim watching and individual claims reserving using classification and regression trees. Risks, 7(4), 102.
Ding, G. & Qin, L. (2020). Study on the prediction of stock price based on the associated network model of LSTM. International Journal of Machine Learning and Cybernetics, 11(6), 1307-1317.
Elsworth, S., & Güttel, S. (2020). Time series forecasting using LSTM networks: A symbolic approach. arXiv preprint arXiv:2003.05672.
Embrechts, P., Mao, T., Wang, Q., & Wang, R. (2021). Bayes risk, elicitability, and the Expected Shortfall. Mathematical Finance, 31(4), 1190-1217.
Feurer, M., & Hutter, F. (2019). Hyperparameter optimization. Automated machine learning: Methods, systems, challenges, 3-33.
Frees, E. W., Derrig, R. A., & Meyers, G. (Eds.). (2014). Predictive modeling applications in actuarial science (Vol. 1). Cambridge University Press.
Fröhlich, A., & Weng, A. (2018). Parameter uncertainty and reserve risk under Solvency II. Insurance: Mathematics and Economics, 81, 130-141.
Gabrielli, A., Richman, R., & Wüthrich, M. V. (2020). Neural network embedding of the over-dispersed Poisson reserving model. Scandinavian Actuarial Journal, 2020(1), 1-29.
Guelman, L. (2012). Gradient boosting trees for auto insurance loss cost modeling and prediction. Expert Systems with Applications39(3), 3659-3667.
Hajilo, R. & Kazemi Boukani, S.E. (2021). The role of artificial intelligence and expert systems in the development of the insurance industry with a literature review approach. The 10th International Conference on Modern Research in Accounting, Management and Humanities in the Third Millennium. Tehran. (in Persian)
Halliwell, L. (2020). Chain Ladder Bias: Its Reason and Meaning. Casualty Acturial Society, 1(2), 214-248.
Hazan, E. & Yang Yuan, K. (2018). Hyperparameter Optimization. ICLR, 1-18.
Hochreiter, J. (1997). Long short-term memory. Neural Computation, MIT Ress.
Kartikasari, M. D., & Imani, N. (2018). Time Series Analysis of Claims Reserve in General Insurance Industry. The 8th Annual Basic Science International Conference (pp. 227-233). Maglang, Indonesia: ISSN.
Khalid, R., & Javaid, N. (2020). A survey on hyperparameters optimization algorithms of forecasting models in smart grid. Sustainable Cities and Society, 61, 102275.
Lindemann, B., Müller, T., Vietz, H., Jazdi, N., & Weyrich, M. (2021). A survey on long short-term memory networks for time series prediction. Procedia Cirp, 99, 650-655.
Merity, S., Keskar, N. S., & Socher, R. (2017). Regularizing and optimizing LSTM language models. arXiv preprint arXiv:1708.02182.
Peixeiro, M. (2022). Time Series Forecasting in Python. NY: Manning.
Peterson, T. (1984). Loss Reserving. Property/Casualty Insurance. The Journal of Risk and Insurance, 114-121.
Poufinas, T., Gogas, P., Papadimitriou, T., & Zaganidis, E. (2023). Machine learning in forecasting motor insurance claims. Risks, 11(9), 164.
Sharifi, M., Sarbakhshian, A. & Rashidi, A. (2018). Application of machine learning algorithms in life insurance risk prediction. 25th National Conference on Insurance and Development. Tehran, Iran. (in Persian)
Sohrabi, B., Raeesi Vanani, I. & Ghanooni Shishone, V. (2015). Evaluating the Corporate Tax Performance and Analyzing the Tax Trends through the Utilization of Data Mining Algorithms. Financial Research Journal, 17(2), 219-238. doi: 10.22059/jfr.2015.57311 (in Persian)
Taye, M. M. (2023). Understanding of Machine Learning with Deep Learning: Architectures, Workflow, Applications and Future Directions. Computers, 12(5), 91.
Taylor, G. & McGuire, G. (2016). Stochastic loss reserving using generalized linear models. CAS Monograph, 3, 1-112.
Weindorfer, B. (2012). A Practical guide to the use of the Chain Ladder Method for Determining technical provisions for outstanding claims in non life insurance. University of Applied Sciences of Vienna.
Wüthrich, M. (2018). Neural networks applied to chain-ladder reserving. European Actuar Journal, 8, 407–436.
Yadav, A., Jha, C. K., & Sharan, A. (2020). Optimizing LSTM for time series prediction in Indian stock market. Procedia Computer Science167, 2091-2100.
Yilmaz, D., & Büyüktahtakın, İ. E. (2023, June). Learning optimal solutions via an LSTM-optimization framework. In Operations Research Forum (Vol. 4, No. 2, p. 48). Cham: Springer International Publishing.
Zhang, L., Ji, T., Yu, S., & Liu, G. (2023). Accurate prediction approach of SOH for lithium-ion batteries based on LSTM method. Batteries, 9(3), 177.
Ziyadi, H. , Salavati, E. , & Lotfi Heravi, M. M. (2023). Housing Price Forecasting Using AI (LSTM). Financial Research Journal, 25(4), 557-576. doi: 10.22059/frj.2023.349924.1007398 (in Persian)