خلاصة:
پژوهشهای اخیر نشان میدهد که داده یکی از ارزشمندترین سرمایههای سازمانها و کسب کارها است. پردازش و تحلیل دادهها به شرکتها وسازمانها کمک میکند تا بینش لازم را کسب کرده و از آن در راستای تصمیمگیری استراتژیک بهره گیرند. انتشار و فراهم کردن دسترسی باز به اطلاعات به یک فرایند متداول و نیاز حیاتی سازمانهای دولتی و خصوصی مبدل شده است. دادههای جمعآوری شده در سازمانها حاوی اطلاعات خصوصی افراد است که انتشار آنها میتواند منجر به افشای اطلاعات حساس و نقض حریم خصوصی شود. اطلاعات حساس همچنین اسرار دولتی و اسرار تجاری را نیز شامل میشود. چالش اصلی حوزه حفظ حریم خصوصی در انتشار داده، انتشار یک شکل تغییریافته از دادههای جمعآوری شده است که بتواند حریم خصوصی مالکان داده را حفظ نماید و قابلیت پاسخ به پرسوجوها و تحلیلهای دادهکاوی را با دقت مناسب داشته باشد. در سناریوی انتشار داده حفاظت از حریم خصوصی مالکان در حضور دانش پیشزمینه مهاجم مهم است. چارچوب گمنامی به عنوان یکی از راهبردهای حفظ حریم خصوصی، سودمندی داده راکاهش میدهد. در این پژوهش برآنیم یک چارچوب گمنامی برای ممانعت از حمله دانش پیشزمینه، افشای هویت و ویژگی مالکان طراحی کنیم که سودمندی دادههای گمنام را بیشینه کند. برای این منظور بعد از مدلسازی دانش پیشزمینه مهاجم، مدل حریم خصوصی تعیین و در ادامه الگوریتم گمنامی ارائه میشود. تمرکز این پژوهش بر مدلهای حریم خصوصی نحوی مانند k- گمنامی و توسعههای آن است. الگوریتم پیشنهادی رکوردها را به چندین گروه افراز میکند به نحویکه در هرگروه مدل حریم خصوصی برآورده میشود. نتایج به کارگیری چارچوپ پیشنهادی بر روی دو مجموعه داده ارزیابی و تحلیل میشود. برای ارزیابی کارایی چارچوب پیشنهادی از معیارهای سودمندی و حریم خصوصی استفاده میشود. نتایج آزمایشات نشان میدهد چارچوب پیشنهادی از نظر سودمندی بر الگوریتم های ارائه شده در جدیدترین پژوهشها برتری دارد.
Recent research shows that Data is one of the most valuable and important assets of organizations and businesses. Privacy in the dissemination of Data is becoming increasingly challenging. Anonymity as one of the privacy strategies, on the one side, conceals the relationship between individuals and records in a metadata table and, on the other side, preserves the usefulness of the data for subsequent analysis. Preventing information disclosure becomes difficult when the adversary possesses background knowledge. We propose an anonymization framework to protect against background knowledge attack, identity disclosure, and feature disclosure. The anonymization algorithm creates equivalence classes of records whose probability distributions extracted by background knowledge are similar. Our proposed algorithm satisfies k-anonymity and its extension too. The proposed anonymity algorithm tries to satisfy the privacy model while preserving the usefulness of the anonymous data. We verify the theoretical study by experimentation on two datasets. Experimental results show that our proposed algorithm outperforms the state of the art anonymization approaches in terms of loss of information.