Abstract:
مقدمه: روشهای تشخیص بیماریهای عروق کرونر معمولاً در معرض خطا بوده و برای بیمار رنجآور و هزینه بر است. بنابراین، توسعه و ارائه روشهای یادگیری ماشین با دقت بالا در تشخیص بیماریهای عروق کرونر از اهمیت خاصی برخوردار است. هدف این پژوهش کمک به تشخیص بیماری عروق کرونری با استفاده از الگوریتم شاهین هریس و روشهای یادگیری ماشین میباشد. روش ها: در این پژوهش از روش جدید مبتنی بر انتخاب ویژگی توسط شاهین هریس در حالت ترکیبی با روش یادگیری ماشین شامل درخت تصمیم و کای نزدیکترین همسایه استفاده شد. که جهت ارزیابی روش پیشنهادی از دو مجموعه داده با پرونده پزشکی 303 بیمار در مجموعه داده Cleveland و Z-Alizadeh-Sani استفاده گردید. ارزیابی مدل پیشنهادی در پایتون نسخه 2016 انجام شد. یافته ها: بر اساس یافته ها انتخاب ویژگی با استفاده از الگوریتم شاهین هریس در حالت ترکیبی با روش یادگیری ماشین منجر به افزایش دقت در نتایج شد. به طوری که در مجموعه داده Z-Alizadeh-Sani درصد دقت در ترکیب با درخت تصمیم برابر با 0/98 و در ترکیب با کای نزدیک ترین همسایه برابر با 0/78 بود. همچنین، در مجموعه داده Cleveland درصد دقت در ترکیب با درخت تصمیم برابر با 0/88 و در ترکیب با کای نزدیک ترین همسایه برابر با 0/77 بود. این در حالی است که هریک از این مقادیر در حالت تمام ویژگیها مقادیر کمتری از دقت را دارا بود. بنابراین، الگوریتم شاهین هریس در ترکیب با درخت تصمیم توانست به بالاترین دقت تشخیص بیماری عروق کرونر در حالت انتخاب ویژگی نسبت به کل ویژگیها دست یابد. نتیجهگیری: نتایج این مطالعه به خوبی نقش فرآیند انتخاب ویژگیهای مؤثر در تشخیص بیماری عروق کرونر توسط الگوریتم شاهین هریس در ترکیب با روشهای یادگیری ماشین را نشان داد.
Introduction: Methods of detecting Coronary Artery Disease (CAD) are often prone to error and are also expensive and painful for the patient; therefore, the development and introduction of accurate machine learning-based methods for diagnosing this condition is of high importance. This research aimed to help detect coronary artery disease using the Harris Hawks Optimization (HHO) algorithm and machine learning techniques.
Methods: In this research, a novel approach based on feature selection was employed through a combination of HHO and machine learning techniques such as a Decision Tree (DT) and k-Nearest Neighbors algorithm (k-NN). To evaluate the proposed approach, we used two datasets (Cleveland & Z-Alizadeh-Sani) with medical records of 303 patients, and the evaluation was conducted by means of python 2016.
Results: On the basis of the findings of this research, feature selection by using the Harris hawks optimization algorithm in combination with machine learning methods resulted in an increase in the accuracy of the results in such a way that in the case of Z-Alizadeh-Sani dataset, the percentage of accuracy in combination with a decision tree was equal to 0.98 and in combination with the k-nearest neighbors algorithm was equal to 0.78. Furthermore, the results of the Cleveland dataset showed that using the HHO in combination with a decision tree led to 88 percent accuracy and in combination with the k-nearest neighbors algorithm led to 77 percent accuracy. However, in the case of using all of the features (HHO only mode), accuracy was lower in all cases. Therefore, the HHO algorithm in combination with the decision tree was able to achieve the highest accuracy in diagnosing CAD in the feature selection mode compared to using all of the features.
Conclusion: The results from this study showed that the Harris hawk optimization algorithm in combination with machine learning techniques can have a positive role in the process of selecting effective features in diagnosing coronary artery disease.