خلاصه ماشینی:
"در این مقاله سعی شده است که ضمنمعرفی اجمالی علم دادهکاوی و روشهای آن به عنوانیکی از دانشهای روز دنیا،به بررسی نقش آن در کشفدانش پنهان در پایگاههای داده موجود در صنعت بیمه وبهبود این حوزه پرداخته شود.
شناسایی عوامل ریسک که سود،خسارت و زیانرا پیشبینی میکند از مهمترین سؤالات در اکچوئری این است که کدامعوامل و متغیرهای ریسک در پیشبینی توزیع خسارت واندازه آن مهم هستند؟ هر چند که بسیاری از عوامل ریسک که بر نرخ اثرمیگذارند بدیهیاند،ممکن است بین متغیرها روابط دقیقو غیر شهودی برقرار باشد که کشف آنها بدون استفادهاز تکنیکهای پیچیدهتر اگر محال نباشد،کار بسیارسختی است.
نمودار 3 نشان میدهد که متغیر«نوع ماشین»و«مکان»،ورودیهایی کلیدی هستند که&%15803BJTG158G% (به تصویر صفحه مراجعه شود)کمک میکنند رانندگان را در دسته(1)از تمام رانندگانمجموعه دادهای متمایز کنند.
اگر چهدرختهای تصمیمگیری میتوانند دادهها را به چند بخشهمگن بشکنند و قوانین ایجاد شده توسط درخت میتواندمورد استفاده قرار بگیرد تا اثرات متقابل میان متغیرها راردیابی کند،ولی نسبتا ناپایدار است و ردیابی روابط خطییا درجه دوم بین متغیر پاسخ و متغیرهای دشوار میباشد (Michalski et al,1998) .
(به تصویر صفحه مراجعه شود) همانطور که در نمودار 5 نشان داده شده توالی شکایت بامهمترین ریسک فاکتور(وضعیت میزان اعتبار در این مطالعه)در میان سایر متغیرها تغییر میکند،بر مبنای آنالیز درخت،سنماشین،پوشش و نوع ماشین فاکتورهای غیر مرتبط هستند.
در این مقاله مقدمهای برایعملیات و تکنیکهای دادهکاوی فراهم شد و دو کاربردبالقوه آن در اکچوئری اموال/حوادث توصیف شده کهدر یک بخش از خوشهبندی k-means استفاده کردیمتا گروهی از رانندگان را با تقسیمبندی بهتر توصیف کنیم."