Abstract:
امروزه رشد استفاده از شبکههای اجتماعی در میان اقشار مختلف جامعه جهانی، بهصورت غیرقابلانکاری رو به فزونی افزایش یافته است. پایگاه داده شبکههای اجتماعی؛ شامل منابع غنی و با ارزشی هستند که انتشار یا تحلیل آنها جهت برای مقاصد بازاریابی، تبلیغاتی، امنیت ملی، سلامت و ... میتواند برای محققان موسسات دولتی و خصوصی سودمند واقع گرددباشد؛ اما رعایت حریم خصوصی موجودیتهایی که اطلاعات آنها در اختیار تحلیلگران دادهکاوی قرار میگیرد، بهعنوان یک پروتکل حقوقی ضروری است. در این مقاله، از طریق روششناسی کیفی فراترکیب، کلیه ابعاد، شاخصها و کدهای مربوطه استخراج و سپس میزان اهمیت و اولویت هر یک از عوامل، تعیین شده و متعاقبا مدل بهبودیافته گمنامی، بهوسیله الگوریتم بهینهسازی کرم شبتاب و خوشهبندی فازی، ارائه گردیده شده است. نتایج شبیهسازی و ارزیابیهای مدل پیشنهادی بر روی دادههای چهار شبکه اجتماعی فیسبوک، یوتیوب، توییتر و گوگل پلاس، حاکی از حفظ حریم خصوصی دادهها با کمترین نسبت انحراف و بیشترین سودمندی است.
Machine summary:
با توجه به موارد پیش گفته ، این پژوهش به دنبال آن است تا ضمن رعایت محرمانگی داده ها، از طریق اصول الگوریتم بهینه سازی کرم شب تاب ٢ و تکنیک خوشه بندی میانگین فازی ، یک 3 مدل جامع ، فارغ از نوع ساختار شبکه های اجتماعی ارائه نماید.
هدف از مدل پیشنهادی مبتنی بر خوشه بندی فازی و الگوریتم کرم شب تاب ، خوشه بندی نمونه ها به C دسته مختلف است که تعداد نمونه های موجود در هر دسته حداقل K عضو و معیارهای L-تنوع و T-همسایگی نیز به طور هم زمان برای همه خوشه ها برقرار باشد.
معیارهای ارزیابی معیارهای ارزیابی برای پیاده سازی و مقایسه روش پیشنهادی با روش های منتخب ، به شرح ذیل است : § خطای خوشه بندی ١ (CE): این معیار کیفیت خوشه بندی را نشان میدهد و به صورت نسبت میانگین فواصل درون خوشه ای به میانگین فواصل بین خوشه ای محاسبه میشود.
ایجاد خوشه های متوازن با در نظر گرفتن قیدهای مسئله در قالب یک تابع جریمه ، معیارهای K-گمنامی، L-تنوع و T- همسایگی را برای تمام خوشه های مدل پیشنهادی تضمین کرده و حداقل نسبت انحراف در سطح ویژگیها، گراف و داده در حین فرآیند گمنام سازی برقرار است .
دلیل این امر این است که الگوریتم TLKL٣ هر سه معیار K- گمنامی، L-تنوع و T- همسایگی را بکار گرفته است اما خطاهای مختلف ایجادشده در اثر فرآیند گمنام سازی را مدنظر قرار نداده است ؛ بنابراین ، میتوان این گونه نتیجه گرفت که روش پیشنهادی FFA و KFCM قادر به تشکیل خوشه های متوازن تر و کاهش خطای خوشه بندی، معیار CAVG و ADR به مراتب بهتر از چهار الگوریتم منتخب پژوهش هستند.