چکیده:
متن قرآن کریم خصوصیتهای منحصر بهفردی از نظر چگالی موضوعی، مفهومی و دانهبندی در مقایسه با سایر متون دارد. یکی از نکات مهم در این زمینه، لزوم مرجعیابی ضمیر است که به افزایش دقت نتایج جستجو کمک شایانی مینماید. هدف استفاده از دستهبندی خودکار متن (ATC)که یکی از شاخههای متنکاوی است، به گونهای است که باعث بهبود جستجو در نرمافزارهای قرآنی شود. در این مقاله، پس از تحلیل متن قرآن کریم و مقایسه آن با سایر متون، روشی ارائه شده است که با توجه به خصوصیات متن قرآن کریم قادر است آیات را ابتدا درون موضوعاتی از پیش تعریفشده دستهبندی کند. سپس، آیات همه سورهها را با توجه به وزن کلمات آن برای هر موضوع، درون دستهها طبقهبندی میکند. در این زمینه، از ارتباط موضوعات و مفاهیم مختلف برای دستهبندی، مدد جسته و فرآیند دستهبندی را بهبود میدهد. در پایان، با توجه به وزن کلمات هر آیه برای هر موضوع، میزان ارتباط آن آیه با موضوع محاسبه شده و دسته آیه مشخص میشود. الگوریتم ارائهشده، مبتنی بر TFIDF بوده و پارامترهای موثر، نظیر ضریب تفکیک متن، به شکلی تنظیم شده که خصوصیات قرآن کریم را در نظر بگیرد. روش پیشنهادی در قالب یک نرمافزار نمونه جستجوی موضوعی قرآن کریم پیادهسازی شده است. نتایج حاصل از این نرمافزار با سایر نرمافزارهای قرآنی و نیز با دستهبندی دستی آیات از لحاظ پارامترهای دقت و فراخوانی مقایسه شده؛ که نشاندهنده مزایای روش پیشنهادی است
خلاصه ماشینی:
جدول 2: کلمات پربسامد و کمبسامد و تعداد تکرارها در متن نمونه قرآن تکرار کلمات کلمات پر بسامد تکرار کلمات کلمات پر بسامد تکرار کلمات کلمات پر بسامد تکرار کلمات کلمات کم بسامد تکرار کلمات کلمات کم بسامد تکرار کلمات کلمات کم بسامد 4 4 4 4 4 4 4 4 4 4 4 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 راه قرار دارند آفریده من هم زمین نشانه شود گویند اوست مهربان تو جانب داده آرى نخواهند فرو کند پیروى پاداشى زنده رسولان نیستید پروردگار خواهد گفت کنید بود 6 6 6 6 6 6 6 6 5 5 5 5 5 5 5 5 5 5 5 4 4 4 4 4 4 4 4 4 4 بیم چه با مگر ایشان چون گفته آنچه توانند پیش فرستاده کنیم گفتند مرا همه شد وى هیچ بناگاه قطعا آنکه رحمان چیزى کردیم مانند آشکار نیست باز جاى 89 46 44 41 37 33 21 19 19 19 16 15 13 13 11 10 10 10 9 9 9 8 8 8 8 7 7 6 6 و را که از به در ما آن است آنان شما بر آنها این براى تا کسى هر پس نه خدا سوى جز اگر آیا خود او راست شده 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 فروغ آینه گواهى ساختند فراهم بدانچه پاهایشان دستهایشان نهیم دهانهاى درآیید اکنون ورزیدید جهل کردید تعقل گمراه سخت انبوه گروهى بپرستید دشمن زیرا مپرستید شیطان بودم نکرده عهد آدم فرزندان 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 غیر شکرگزار نوشیدنیها سودها بعضى گیرند سوارى برخى رام باشند مالک چهارپایانى قدرت کافران دلى قرآنى اندرز خور نیاموختیم شعر اندیشند گردانیم شکسته فروکاسته خلقت نظر دهیم دراز عمر بروند 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 توانا آسمانها افروزید آتش افتد نیازتان نهاد اخگر سبزفام درخت برایتان همو داناست آفرینشى پدید بار نخستین بگو بخشد زندگى پوسیده استخوانها فراموش آفرینش جویى ستیزه نطفه ندانسته آدمى دانیم / / شکل 2: نمودار درصد بسامد کلمات پربسامد و کمبسامد در قرآن (نمودار سمت چپ بسامد پایین و نمودار سمت راست بسامد بالا) همان طور كه در شكل مشخص است، تعداد كلمات برجسته نسبت به متن عمومي زياد است.