چکیده:
پژوهش حاضر به پیش بینی بحران مالی شرکت های پذیرفته شده در بورس اوراق بهادار تهران با استفاده از طبقه بندی کننده غیرخطی جنگل های تصادفی می پردازد. در این راستا، پس از بررسی متون پژوهش و شناسایی 69 متغیر پیش بین اولیه، از روش انتخاب متغیر ریلیف برای شناسایی متغیرهای پیش بین بهینه استفاده شد. یافته های تجربی مربوط به بررسی 95 شرکت - سال سالم (بدون درماندگی مالی) و 95 شرکت - سال (درمانده مالی) پذیرفته شده در بورس اوراق بهادار تهران در سال های 1380 تا 1392 بیانگر عملکرد بهتر جنگل های تصادفی نسبت به رگرسیون لجستیک است. به بیان دیگر، در صورت استفاده از این طبقه بندی کننده، به طور معناداری، میانگین دقت افزایش و خطای نوع اول و دوم کاهش می یابد. افزون بر این، یافته های پژوهش بیانگر سودمندی روش انتخاب متغیر ریلیف در پیش بینی بحران مالی است. به عبارت دیگر، در صورت استفاده از متغیرهای منتخب روش ریلیف (نسبت به استفاده از 69 متغیر اولیه)، به طور معناداری، میانگین دقت افزایش وخطای نوع اول و دوم کاهش می یابد.
خلاصه ماشینی:
"در اغلب پژوهشهای بعدی از روش تجزیه و تحلیل خطی لجستیک 10 استفاده شده Financial Distress Bankruptcy Neural Networks Support Vector Machine Random Forests Feature (Variable) Selection Relief Univariate Analysis Multivariate Discriminant Analysis Logistic Regression است.
به منظور حل این مشکل در این پژوهش از روش نظاممند انتخاب متغیر ریلیف به منظور انتخاب متغیرهای بهینه استفاده شده و به بررسی این موضوع پرداخته شده است که آیا متغیرهای منتخب روش مزبور از بین متغیرهای اولیه، تأثیر مثبت و معناداری بر عملکرد پیشبینی بحران مالی شرکتهای پذیرفته شده در بورس اوراق بهادار تهران دارد یا خیر.
بنابراین، با توجه به بهتر بودن معیارهای عملکرد در حالت استفاده از متغیرهای منتخب روش ریلیف نسبت به استفاده از کل متغیرها و معنادار بودن آن از نظر آماری (به استثنای خطای نوع اول) میتوان استنباط کرد که روش انتخاب متغیر ریلیف، تأثیر مثبت و معناداری بر عملکرد پیشبینی طبقهبندیکنندۀ جنگل تصادفی دارد؛ زیرا به رغم کاهش تعداد متغیرهای پیشبین (از 69 به 10 متغیر)، عملکرد پیشبینی بهتر شده است.
عملکرد جنگلهای تصادفی بر اساس متغیرهای منتخب و متغیرهای اولیه مقدار احتمال آمارۀ t براساس متغیرهای اولیه براساس متغیرهای منتخب عملکرد متغیرها 000/0 757/3 90/0 93/0 میانگین دقت 436/0 782/0 09/0 08/0 میانگین خطای نوع اول 000/0 865/3 10/0 06/0 میانگین خطای نوع دوم منبع: یافتههای پژوهش در فرضیۀ چهارم، معیارهای ارزیابی مربوط به پیشبینی بحران مالی با استفاده از طبقهبندی کننده رگرسیون لجستیک در دو حالت (براساس 10 متغیر منتخب روش ریلیف و 69 متغیر اولیه) مقایسه میشود."