چکیده:
طبقهبندی دادهها از مباحث اساسی علم مدیریت است که از رویکردهای مختلفی مورد بررسی قرار گرفته است. روشهای هوش مصنوعی از مهمترین روشهای طبقهبندی هستند که اغلب آنها تابع دقت کل را در ارزیابی عملکرد مد نظر قرار میدهند. از آنجاییکه در دیتاستهای نامتوازن، این تابع، هزینه خطاهای پیشبینی را یکسان در نظر میگیرد، در این پژوهش علاوه بر تابع دقت کل، از تابع حساسیت نیز به منظور افزایش دقت در هر یک از کلاسهای از پیشتعریفشده، استفاده شده است. بهعلاوه، بدلیل پیچیدگی فرآیند کسب اطلاعات از تصمیمگیرنده، از الگوریتم فرا ابتکاری NSGA II جهت استنتاج مقادیر پارامترها، (بردار وزن و سطوح برش بین کلاسها) استفاده گردیده است. در هر تکرار، الگوریتم با استفاده از بردار وزن برآورد شده و دیتاستها، امتیاز هر آلترناتیو را با تابع Sum Product محاسبه نموده و در مقایسه با سطوح برش تخمینی، آن آلترناتیو را به یکی از دستهها تخصیص میدهد. سپس با استفاده از توابع برازش، دسته تخمینی و دسته واقعی را مقایسه نموده و این فرایند تا بهینهسازی پارامترها ادامه مییابد. مقایسه نتایج الگوریتمهای NSGA II و NRGA، نشاندهنده کارایی بالای الگوریتم ارائه شده است.
Data classification is one of the main issues in management science which took into account from different approaches. Artificial intelligence methods are among the most important classification methods, most of them consider total accuracy function in performance evaluation. Since in imbalanced data sets this function considers the cost of prediction errors as a fix amount, in this research a sensitivity function in used in addition to the accuracy function in order to increase the accuracy in all of the predefined classes. In addition, due to complexity in process of seeking information from decision maker, NSGA II algorithm is used to extract the parameters (Weight vector and cut levels between classes). In each iteration, based on the estimated weight vector and data sets, the algorithm calculate the score of each alternative using Sum Product function and then allocates the alternative to one of the classes, comparing to the estimated cut levels,. Then, using the fitness functions, the estimation class and the actual class will compare by two algorithms and this process will continue since optimizing the parameters. Comparison of the NSGA II and NRGA algorithms show the high efficiency of the proposed algorithm.
خلاصه ماشینی:
هدف اصلی در مدل های طبقه بندی مبتنی بر هوش مصنوعی ١ آن است که وزن معیارها و سطح برش ، بوسیله الگوریتم های شناخته شده ای مانند: الگوریتم ژنتیک ، بهینه سازی ازحام ذرات و غیره برآورد شوند (هدهمی کعبی و همکاران ، ٢٠١٥؛ ژوهانگ یو و همکاران ، ٢٠١٣).
زرین صدف و دانشور (١٣٩٥) روشی ارائه نمودند که با یادگیری مقادیر پارامترها از داده های آموزشی با استفاده از الگوریتم بهینه سازی تراکم ذرات (PSO)، آنها را در طبقه بندی موجودیهای جدید به کار میبرد.
از آنجاییکه مساله چندهدفه مورد مطالعه به دسته مسائل NP-hard تعلق دارد، برای حل مدل پیشنهادی در یک زمان موجه از الگوریتم های ژنتیک مرتب سازی نامغلوب NSGA II و ژنتیک رتبه بندی نامغلوب NRGA استفاده شده است .
نتایج شبیه - سازی الگوریتم با استفاده از داده های مسائل موجود نشان میدهد که الگوریتم ژنتیک غیر مسلط در مقایسه با الگوریتم NSGA II در بیشتر مواقع قادر به دستیابی به جواب های بهتر و همگرایی سریع تر به پارتو بهینه است .
با بررسی مطالعات صورت گرفته در مبانی نظری که برخی از آنها در بخش فوق مورد اشاره قرار گرفتند، مشخص میشود که مدل مناسبی برای طبقه بندی دیتاست های نامتوازن چند کلاسه با توجه به اهداف چندگانه و متعارض وجود ندارد.
تطبیق II NSGA با مساله دو هدفه طبقه بندی داده های نامتوازن تولید جمعیت اولیه : کارکرد الگوریتم تکاملی در این مساله یافتن پارامترهای بردار وزن و نقاط برش است .