پیش‌بینی تعهدات آتی شرکت‌های بیمه با استفاده از مدل حافظه بلند مدت-کوتاه مدت

نوع مقاله : مقاله علمی پژوهشی

نویسندگان

1 استاد، گروه آموزشی مهندسی هسته‌ای، دانشکده فیزیک و مهندسی انرژی، دانشگاه صنعتی امیرکبیر، تهران، ایران

2 دانشجوی دکتری، گروه مدیریت دولتی، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی، تهران، ایران

3 استاد، گروه مدیریت دولتی، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی، تهران، ایران.

4 دانشیار، گروه مدیریت صنعتی، دانشکده مدیریت و حسابداری، دانشگاه علامه طباطبائی، تهران، ایران

10.22059/frj.2024.367421.1007532

چکیده

هدف:این پژوهش به دنبال ارائه مدلی جهت محاسبه تعهدات آتی برای شرکت های بیمه است که بتواند برای چالش های بالقوه موجود در روش سنتی، پاسخ مناسبی ارائه دهد. به صورت سنتی، شرکت‌های بیمه از روش زنجیره نردبانی به عنوان یک ابزار آماری برای پیش‌بینی روند توسعه خسارت‌ها استفاده می‌کنند. این روش آماری به دلیل سادگی در فرضیات و تفسیر روشن، تایید نهادهای نظارتی در کشورهای مختلف را نیز به همراه دارد. با این حال، وجود فرضیاتی نظیر ایستایی در ساختار توسعه داده‌ها و ارتباط خطی بین متغیر ها، ممکن است کارایی مدل را در مواجه با تغییرات ناشی از عوامل داخل و خارج از سازمان مانند اعمال سیاست‌های داخلی یا عوامل خارجی مانند همه‌گیری کووید-19 متأثر سازد. محاسبه نزدیک به واقعیت تعهدات شرکت های بیمه ارتباط تنگاتنگی با توانگری مالی آن‌ها دارد. مبلغی که شرکت های بیمه جهت پاسخ به تعهدات آتی خود تخصیص می دهند، به عنوان ذخیره شناسایی می شود. محاسبه ذخائر کم‌تر از تعهدات آتی، شرکت بیمه را در ایفای تعهداتش دچار مشکل می‌کند و از سویی دیگر، محاسبه بیش از مبلغ مورد نیاز، صورت های مالی شرکت های بیمه را تحت تاثیر قرار می دهد.

روش: مدل ارائه شده در این پژوهش، با استفاده از یادگیری ماشین و هوش مصنوعی تعداد حوادث روزانه با خسارت های جانی را در رشته بیمه شخص ثالث پیش‌بینی می نماید. خروجی این مدل، یعنی ترکیب تعداد و زمان وقوع حوادث، نقش کلیدی در محاسبه تعهدات آتی و ذخیره خسارت در این رشته بیمه ای دارد. این مدل با کمک داده‌های تاریخی خسارت بیمه گذاران شرکت بیمه کارآفرین در رشته بیمه شخص ثالث، آموزش دیده است. این مدل قادر است لایه‌های پنهان و ارتباطات غیرخطی و پیچیده بین داده‌های خسارتی را شناسایی ‌نماید. در این تحقیق، از الگوریتم شبکه عصبی با حافظه کوتاه مدت بلند (LSTM) که از توانایی بالای پیش‌بینی در سری‌های زمانی برخوردار است، استفاده شده است. ، داده های تاریخی مربوط به خسارت های جرحی بیمه گذارارن، در بازه زمانی فروردین 1396 تا شهریور 1400 است.

یافته‌ها: کارایی مدل با بهینه سازی ابرپارامترها ارتباط نزدیک دارد. برای بهینه سازی مدل دو رویکرد، یعنی جستجوی شبکه ای و تصادفی برای شناسایی ابرپارامترها با یکدیگر مقایسه شده اند. میانگین مربعات خطا به عنوان شاخص سنجش عملکرد در نظر گرفته شده است. این شاخص برای داده‌های آموزش در هر دو مدل با فاصله کمی از یکدیگر (16.33 در مقابل 17.4) برتری جستجوی شبکه ای را نشان می‌دهد. اما در این روش نتیجه داده های آزمون از داده های آموزش بهتر بود (15.22 در برابر 16.33)، که این امر می تواند نشانه ای از وقوع بیش‌بردازش باشد.

نتیجه: این مقاله برای طراحی مدل پیش‌بینی تعداد روزانه حوادث با خسارت های جانی، استفاده از روش جستجوی تصادفی را برای تنظیم ابرپارامترهای مدل LSTM پیشنهاد می کند. زیرا مدل طراحی شده بر این مبنا، توانایی غلبه بر مشکل بیش‌پردازش را دارد و می تواند عمالکرد مناسبی در کار با داده‌های ناآشنا داشته باشد. بیش‌پردازش زمانی رخ می‌دهد که مدل بیش از حد از داده‌های آموزشی تاثیر بگیرد و نه تنها الگوهای واقعی را یاد بگیرد بلکه نویزها و جزئیات جزئی داده‌ها را نیز یاد بگیرد. این ممکن است باعث کاهش جامع‌پذیری مدل شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Predicting the Future Commitments of Insurance Companies Using Long-Short Term Memory (LSTM) Model

نویسندگان [English]

  • Saeed Setayeshi 1
  • Negar Tehraniyazdi 2
  • Reza Vaezi 3
  • Iman Raeesi Vanani 4
1 Prof., Faculty of Physics and Energy Engineering, Amirkabir University of Technology, Tehran, Iran
2 Ph.D Candidate, Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran
3 2Prof., Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran
4 Associate Prof., Faculty of Management and Accounting, Allameh Tabataba’i University, Tehran, Iran
چکیده [English]

Aim: The study is done to present a novel model for predicting the future commitments of insurance companies. Traditionally, insurance companies use the Cahin_ladder approach as a statistical tool to forecast future claims and the trend of claims development. The forecasted amount of money insurers calculate for their futute liabilities are called claim reserves. The Chain_ladder as statistical approach is also favored by regulatory authorities in various countries due to its simplicity in assumptions and clear interpretation. However, some assumptions such as the stability in data development and linear relationships between variables can affect the efficiency of this model when faced with internal policies or external factors like the COVID-19 pandemic. Forecasting future commitments close to reality may lead to the financial stability of Insurance companies. The amount that insurance companies allocate to meet their future technical obligations is known as reserves. Calculating reserves less than the required amounts can pose challenges for insurance companies in fulfilling their commitments while calculating more than necessary amounts, can impact the financial statements of insurance companies negatively.



Method: In this study, a dynamic model based on machine learning algorithms is proposed. The model's output, which is the combination of the number and timing of bodily injury accidents, plays a key role in calculating reserves in nonlife insurance products. This model is trained to predict the frequency of accidents in a Vehicle Third-Party liability insurance. The model can identify hidden layers and non-linear, complex relationships among claims data. A Long Short-Term Memory (LSTM) neural network algorithm is implemented in this study which is known for its high predictive capability in time series data. The model is trained by the historical data of Karafarin Insurance Company from 1396 to 1400.



Findings: The performance of the model is highly related to the hyperparameters chosen for the model. Two of the most common approaches for tuning the hyperparameters are tested in this study. These Two models are grid and random search. The Root Mean Square Error (RMSE) is used as a performance metric, and it indicates that the grid search has a lower RMSE than the random search for the training data with a slight difference (16.33 versus 17.4). However, the results for the test data in the grid search have a sign of overfitting.



Conclusion: The recommendation of this study is to use the random search for tuning the hyperparameters of the model to predict the frequency of daily incidents. The evaluation between the two approaches for tuning hyperparameters reveals that the random search is more suitable for working with unfamiliar data and handling overfitting situations. Overfitting occurs when the model is heavily influenced by the training data and learns not only the actual patterns but also the noise and minor details of the data. This issue may affect the generalizations of the model.

کلیدواژه‌ها [English]

  • Long short-term memory algorithm
  • Hyperparameters tuning
  • Random search
  • Grid search
  • Loss reserves