چکیده:
سخنان تنفرآمیز اسلام هراسی در رسانه های اجتماعی دغدغه ای فزاینده در سیاست و جامعه غربی معاصر است. این امر می تواند آسیب های قابل توجهی بر تک تک قربانیان مورد هدف داشته باشد و احساس ترس و محرومیت را در بین جو.امع آنان ایجاد و گفتمان عمومی را زهر آلود کند و دیگر شکل های افراط گرایی و رفتارهای تنفرآمیز را موجب شود. براین اساس، نیاز مبرمی برای ایجاد ابزارهای قوی خودکار و در مقیاس بالا جهت شناسایی و طبقه بندی سخنان تنفر آمیز اسلام هراسی وجود دارد تا به وسیله آن تجزیه و تحلیل های کمی پایگاه های داده متنی بزرگ از جمله موارد گردآوری شده از رسانه های اجتماعی امکانپذیر باشد. تحقیق قبلی به میزان زیادی به شناسایی خودکار سخنان تنفرآمیز به عنوان یک کار باینری نزدیک شد. اما ماهیت گوناگون اسلام هراسی به این معنی است که این موضوع غالبا به لحاظ علوم اجتماعی نظری و نیز پایش موثر پلتفرم های رسانه های اجتماعی امری بیمورد و نابجاست. ما با ترسیم کار عمیق مفهومی، یک ابزار نرم افزاری خودکار ساخته ایم که بین محتوای غیر اسلام هراسی، اسلام هراسی ضعیف و اسلام هراسی قوی تمایز قائل می شود.
Islamophobic hate speech on social media is a growing concern in contemporary Western politics and society. It can inflict considerable harm on any victims who are targeted, create a sense of fear and exclusion amongst their communities, toxify public discourse and motivate other forms of extremist and hateful behavior. Accordingly, there is a pressing need for automated tools to detect and classify Islamophobic hate speech robustly and at scale, thereby enabling quantitative analyses of large textual datasets, such as those collected from social media. Previous research has mostly approached the automated detection of hate speech as a binary task. However, the varied nature of Islamophobia means that this is often inappropriate for both theoretically informed social science and effective monitoring of social media platforms. Drawing on in-depth conceptual work we build an automated software tool which distinguishes between non-Islamophobic, weak Islamophobic and strong Islamophobic content. Accuracy is 77.6% and balanced accuracy is 83%. Our tool enables future quantitative research into the drivers, spread, prevalence and effects of Islamophobic hate speech on social media.
خلاصه ماشینی:
بر این اساس ، نیاز زیادی برای ایجاد ابزارهای قوی خودکار و در مقیاس بالا برای شناسایی و طبقه بندی سخنان تنفرآمیز اسلام هراسی وجود دارد تا به وسیله آن تجزیه وتحلیل های کمی پایگاه های داده متنی بزرگ ازجمله موارد گردآوریشده از رسانه های اجتماعی امکان پذیر باشد.
این امر با خوش بینی قابل توجهی مواجه شد: لازر و همکاران استدلال میکنند که علوم اجتماعی محاسباتی منجر به سطح جدیدی از طبقه بندی و وسعت دست یافته است ، و البته بده بستان اندکی بین آن ها وجود دارد (لازر و همکاران ، ٢٠٠٩)، واتس استدلال میکند که داده های بزرگ میتوانند با ایجاد «فرآیندهای اجتماعی قابل مشاهده » که بررسی آن ها در شرایط سازمانی متعارف بسیار دشوارتر است ، بینشی در مورد پرسش های قدیمی ایجاد کنند (واتس ، ٢٠٠٧) و در علوم سیاسی گریمر و استوارت استدلال میکنند که «روش های محتوای خودکار میتواند موارد قبلی را غیرممکن کند» (گریمر و استوارت ، ٢٠١٣).
این مسئله زمانی اهمیت ویژه ای مییابد که سخنان نفرت پراکنی آنلاین بررسی شود، زیرا آنچه منفور تلقی میشود به شدت مورد مناقشه است و برحسب گروه هدف میتواند متفاوت باشد (بسیاری افراد بیشتر با نژادپرستی دمخور هستند تا اسلام هراسی (رانی مد تراست ، ٢٠١٧)، چشم انداز ذهنی فرد (که میتواند تحت تأثیر پیشینه آن ها، تجربیات زندگی و ارزش ها باشد (سلمینن ، ورونسی، آلمرخی، یونگ و یانسن ٢٠١٨) و متن یا زمینه (چه کسی صحبت میکند، با چه اختیاراتی و با چه کسی همه میتواند بر معنای هر بیت محتوا تأثیرگذار باشد (لیدر مینارد و بنش ٢٠١٦).
این موضوع در هدف این مقاله منعکس شده است ، که در مقدمه مطرح شد: برای ایجاد یک طبقه بندی کننده تشخیص محتوای اسلام هراسی در شبکه های اجتماعی که بین نقاط قوت گوناگون اسلام هراسی تمایز قائل شود.