چکیده:
تخمین تعداد بهینه خوشه ها در دسته بندی بدون نظارت داده ها، از زمینه های چالش برانگیز برای
محققان در سالهای اخیر بوده که منجر به ارائه شاخص های اعتبار خوشه بندی متعدد شده است. این شاخصها اغلب از دو معیار فشردگی و جدایش برای ارزیابی خوشه بندی انجام شده استفاده
که توسط ECAS می کنند. در این مقاله، یک معیار جدایش جدید برای شاخص اعتبار خوشه بندی
فاضل و همکاران ] 1[ ارائه شده است، معرفی می گردد، که در آن از معیار فاصله جاکارد استفاده شده است. فاصله جاکارد از اندازه اشتراک و اجتماع دو مجموعه فازی استفاده می کند. بنابراین اطلاعات بیشتری در مورد هم پوشانی و جدایش خوشه ها در اختیار شاخص اعتبار خوشه بندی قرار می دهد. این قابلیت باعث می شود که شاخص جدید در مقابل تغییرات درجه فازی بودن خوشه بندی، پایداری داشته باشد. برای مقایسه عملکرد شاخص جدید با 9 شاخص موجود ECAS بیشتری نسبت به شاخص در ادبیات، از 11 مجموعه داده ( 3 مجموعه داده مرسوم و 12 مجموعه داده مصنوعی) به عنوان داده های آزمون استفاده شده است. نتایج به دست آمده نشان دهنده پایداری و قابلیت بالای شاخص ارائه شده در مقایسه با سایر شاخص ها است.
Estimating the optimal number of clusters in an unsupervised partitioning of data sets has been a challenging area in recent years. These indices usually use two criteria called compactness and separation to evaluate the efficiency of the performed clustering. In this paper a new separation measure for ECAS cluster validity index، proposed by Fazel et al. [1] is identified، which uses Jaccard distance in order to consider the whole shape of clusters. Jaccard distance uses the size of intersection and union of fuzzy sets، giving the cluster validity index more information about the overlap and separation of clusters. This property results in high robustness of the proposed index dealing with various degrees of fuzziness in comparison with ECAS. To test the efficiency of the proposed index in comparison with nine other indices existing in the literature، 15 data sets (3 existing datasets and 12 artificial data sets) have been used. Computational results indicate robustness and high capability of the proposed index in comparison with previous indices.