چکیده:
غنی سازی محتواهای علوم انسانی و اسلامی، از اهمیت ویژه ای برخوردار است. استفاده از شبکه واژگانی، از مهم ترین راهبردهای تحقیقاتی در رشته های مرتبط با علوم انسانی است. شبکه واژگانی، مجموعه ای از کلمات است که به واسطه ارتباطات معنایی به یکدیگر متصل شده و در سطحی جامع تر از یک لغت نامه در یادگیری یا استخراج اطلاعات مورد نیاز محققان کاربرد دارد. روند فعالیت در دستیابی خودکار به یک شبکه واژگانی منسجم، در گرو پردازش لفظی و پردازش معنایی بر اساس متن کاوی داده های عربی در منابع زبانی دقیق و مناسب است. استفاده از فرآیند ماشینی در هر یک از این مراحل پردازش و یافتن منابع عربی دقیق علوم اسلامی، با چالش های مختلفی رو به رو بوده که در این مقاله، به بررسی برخی جزئیات این طرح، به ویژه بر اساس دادگان موجود در مرکز تحقیقات کامپیوتری علوم اسلامی و روش مقابله با چالش ها پرداخته شده است.
خلاصه ماشینی:
استفاده از فرآیند ماشینی در هر یک از این مراحل پردازش و یافتن منابع عربی دقیق علوم اسلامی، با چالش های مختلفی رو به رو بوده که در این مقاله، به بررسی برخی جزئیات این طرح، به ویژه بر اساس دادگان موجود در مرکز تحقیقات کامپیوتری علوم اسلامی و روش مقابله با چالش ها پرداخته شده است.
فراتر از فرهنگ لغت، با استفاده از فرآیند ماشینی، اطلاعات زبانی بیشتری امکان پذیر شده است؛ مانند ترجمه ماشینی که در گذشته مهم ترین انگیزه طراحی این شبکه واژگانی بوده است، ابهام زدایی واژگان(6)، طبقه بندی اسناد، طراحی هستان شناسی در وب و همچنین غنی سازی محتوای لغت نامه ها مانند تعداد تکرار کلمات، تنوع استعمال و چگونگی ساختارهای گرامری[7] و بسیاری دیگر از فواید مرتبط با متن کاوی به ویژه در علوم اسلامی.
[15] اگر چه از سال 2006 برخی از زبان شناسان عرب زبان قدم های مؤثری را در ایجاد یک شبکه واژگانی عربی برداشتند (AWN : Arabic WordNet ا[16] )، ولی ضرورت طرح مبحث در داده های علوم اسلامی، این ضرورت را ایجاب نمود تا بر اساس سیستم های هوشمندی که در مرکز نور به کار گرفته شده و نسبتاً به موارد مشابه از امتیازات قابل توجهی برخوردار است، به طراحی یک شبکه واژگان منسجم و دقیق در این زمینه اقدام نموده و آن را مقدمه ای برای ورود به ایجاد یک پیکره دادگان جامع قرار دهیم.
(رجوع شود به تصویر صفحه) ارتباطات شبکه ای شبکه واژگانی که با استفاده از یک نوع ارتباط معانی بین واژگان فراهم آمده است، بر پایه مختصات زبانی بوده و چه بسا در هر زبان دارای ویژگی های مخصوص خود باشد.