چکیده:
Regarding to an increased growth of nonperforming loan plus banks benefits being at risk through the recent years، this study aims to investigate the influential factors in credit behavior of real applicants of retail facilities. Therefore، the researchers identified 35 factors، followed by which they selected 429 credit files to evaluate the effect of these factors on Probability of default applying data mining techniques such as decision trees (C5، QUEST، CART، CHAID)، artificial neural network، Support vector machine، logistic regression and discriminant analysis. The results are indicative of the fact that the artificial neural network has a higher prediction ability compared to other methods. Besides these 35 factors، 12 other indicators (including repayment duration، type of the loan contract، repayment installments number، collateral type، the number of invalid checks before receiving loans، installment amounts، depositing time (short-term deposits)، economic sector، gender، job، transaction average through 6 month prior to receiving the loan and the property status) were respectively of highest importance in explaining the creditors behavior. Among the aforementioned factors، only 3 factors (including the property status، gender and Job) were out of bank control. In the end، the regulations resulted from the decision tree were extracted for decision creating (designing a credit evaluation model) in bank.
خلاصه ماشینی:
در اين راستا پژوهشگران اقدام به شناسايي ٣٦ شاخص کرده و سپس با استفاده از روش نمونه گيري احتمالي طبقه بنديشده ٥، ٤٢٩ پرونده اعتباري انتخاب و با بهرهگيري از تکنيک هاي دادهکاوي مانند انواع درخت تصميم (CHAID٦، CART٧، CQUEST٩٥٨)، شبکه عصبي،١٠ ماشين بردار پشتيبان،١١ رگرسيون لجستيک ١٢ و تحليل تشخيصي ١٣ اقدام به ارزيابي ميزان اثرگذاري اين شاخص ها براحتمال نکول تعهدات کردند.
در اين پژوهش ، ابتدا شاخص هاي مؤثر بر احتمال نکول تعهدات شناسايي شده، سپس از طريق مکاتبه با شعب اطلاعات مورد نظر جمع آوري شد، در ادامه ضمن آمادهسازي و پالايش دادهها از انواع تکنيک هاي دادهکاوي و آماري همچون درخت تصميم (CHAID،CART ،QUEST ، C٥)، شبکه عصبي مصنوعي ، SVM، رگرسيون لجستيک و تحليل تشخيصي براي ارزيابي احتمال نکول تعهدات اعتباري مشتريان حقيقي استفاده شده است .
در ادامه به تعدادي از آنها اشاره ميکنيم : کشاورز و آيتي (١٣٨٦) در پژوهشي که در بانک مسکن انجام دادهاند، اقدام به تعريف شاخص هاي تعداد فرزندان، درجه تحصيلي و وضعيت شغلي همسر و شخص درخواست کننده اعتبار، صاحبخانه بودن يا نبودن گيرنده اعتبار، سن و جنسيت گيرنده اعتبار براي ارزيابي رفتار متقاضيان تسهيلات کردهاند.
در پژوهشي ديگر محمدي صداقت و سپه وند (١٣٨٨)، اقدام به رتبه بندي ٢٠٠ نفر از مشتريان حقيقي بانک تجارت در حوزه کسب وکار با استفاده از مدلهاي لاجيت و شبکه عصبي کردند.
جدول (٨) ماتريس اغتشاشي فرضي يک دسته بندي به تصویر صفحه مراجعه شود از آنجا که مهم ترين معيار براي تعيين کارايي يک الگوريتم يا مدل دسته بندي، شاخص صحت يا ACC است ابتدا به روش محاسبه اين شاخص اشاره ميشود.