چکیده:
داده های بزرگ یا عظیم داده ترجمه اصطلاح Big Data میباشد که معمولا به مجموعه از داده ها اطلاق میشود که اندازه آنها فراتر از حدی است که با نرم افزارهای معمول بتوان آنها را در یک زمان معقول اخذ، دقیق سازی، مدیریت و پردازش کرد.
مفهوم «اندازه » در داده های بزرگ بطور مستمر در حال تغییر است و به مرور بزرگتر میشود. از این رو با رشد روز افزون داده ها و نیاز به بهره برداری و تحلیل از این داده ها، بکارگیری زیرساخت های Big Data از اهمیت ویژه ای برخوردار شده است .
ما به ارائه خلاصه ای از بررسی کلی برروی مسایل داده های حجیم میپردازیم که شامل فرصت ها و چالش های داده های حجیم ، تکنیک ها و فناوریهای فعلی می باشند. برای بهینه سازی عملکرد وتحلیل داده های بزرگ الگوریتم های تکاملی و داده کاوی مطرح میشوند. الگوریتم های تکاملی (EA) معروف است که کشف کننده های بهتر در فضای جستجو در مقایسه با تکنیک های سنتی هستند؛ که روش های قطعی را در برمیگیرند و از مکانیزم ها و عملیات ابتدایی برای حل مسئله استفاده می کنند و طی یک سری از تکرارها به راه حل مناسب برای مسئله می رسند. ما در اینجا از ترکیب الگوریتم k- میانگین و الگوریتم ژنتیک برای رسیدن به نتیجه مطلوب استفاده کردیم که الگوریتم ژنتیک یکی از مشهورترین و متداول ترین الگوریتم - ها در بین الگوریتم های تکاملی است . این الگوریتم یک روش سراسری کمینه سازی است که برای حل مسائل بهینه سازی کاربردهای بسیار دارد.
Big Data is usually referred to as a set of data that exceeds the extent which can be obtained, managed and
processed using standard software within a reasonable time. The concept of size in big data is constantly
changing and becoming gradually bigger. Hence, with the increasing growth of the data and the need to exploit
and analyze these data, it is particularly important to apply the Big Data infrastructures. We provide a summary
of a comprehensive review of big data issues, including the opportunities and challenges of big data and the
current techniques and technologies. Evolutionary algorithms (Eas) and data mining are used for optimizing the
performance and analyzing the big data. EAs are known as better discoverers in search space than the traditional
techniques. They include definitive methods and use basic mechanisms and operations to solve the problem and,
provide a suitable solution to the problem through a series of repetitions. We have used a combination of the kmean
algorithm and the genetic algorithm in order to arrive at a desirable result, and the genetic algorithm is one
of the most popular and commonly used algorithms among the evolutionary algorithms. This algorithm is a
global minimization method with many uses for solving optimization problem
خلاصه ماشینی:
ارائه يک روش ترکيبي از الگوريتم ژنتيک براي استفاده در خوشه بندي داده ها ميثم رهنماي فلاح ١، مرضيه فريدي ماسوله ٢*، محمدرضا عسگري پور٣ ١ و٢ و٣ دانشگاه آزاد اسلامي، واحد الکترونيکي، گروه کامپيوتر، تهران ، ايران * نويسنده مسئول مکاتبات چکيده داده هاي بزرگ يا عظيم داده ترجمه اصطلاح Big Data ميباشد که معمولا به مجموعه از داده ها اطلاق ميشود که اندازه آنها فراتر از حدي است که با نرم افزارهاي معمول بتوان آنها را در يک زمان معقول اخذ، دقيق سازي، مديريت و پردازش کرد.
مقدمه داده هاي بزرگ يا عظيم داده ترجمه اصطلاح Big Data ميباشد که معمولا به مجموعه از داده ها اطلاق ميشود که اندازه آنها فراتر از حدي است که با نرم افزارهاي معمول بتوان آنها را در يک زمان معقول اخذ، دقيق سازي، مديريت و پردازش کرد.
عبارت Big Data مدت ها است که براي اشاره به حجم هاي عظيمي از داده ها که توسط سازمان هاي بزرگي مانند گوگل يا ناسا ذخيره و تحليل ميشوند مورد استفاده قرار ميگيرد؛ اما به تازگي، اين عبارت بيشتر براي اشاره به مجموعه هاي داده اي بزرگي استفاده ميشود که به قدري بزرگ و حجيم هستند که با ابزارهاي مديريتي و پايگاه هاي داده سنتي و معمولي قابل مديريت نيستند.
در اين بخش روشي براي خوشه بندي مجموعه داده هاي مختلط بزرگ با استفاده از k- ميانگين و الگوريتم ژنتيک ارايه شده است .
اما با توجه به زمان مصرفي بالاي الگوريتم ژنتيک ، خوشه بندي مجموعه داده هاي بزرگ به اين روش امکان پذير نمي باشد.