چکیده:
شیوههای گوناگون در نوشتن یک واژه،یکی از مشکلاتی است که در بازیابی مدارک مربوطه از طریق ابزارهای جستجو وجود دارد.در زبان فارسی نیز برخی از واژهها به ریختهای متفاوتی نوشته میشوند.به همین دلیل این پژوهش به بررسی مسائلی پرداخته است که کاوشگران فارسی در کاوش ریختهای مختلف یک واژه با آن روبهرو هستند.برای پاسخگویی به سؤالهای پژوهش از دو روش پیماش مقایسهای و اسنادی استفاده شده است.جامعه پژوهش شامل سه موتور کاوش گوگل،یاهو و آلتاویستا است که امکان جستجو به زبان فارسی را فراهم کردهاند.
با مطالعه و دقت در متون فارسی،سیاههای شامل 17 کلیدواژه انتخاب شد که هرکدام نمایانگر یک مورد از چالشهای زبان فارسی در بازیابی اطلاعات هستند.پژوهشگران کلیدواژهها را وارد فیلد جستجوی ابزارهای کاوش انتخابی کرده و تعداد بازیافتها برای هرکدام از موتورهای کاوش را ثبت کردند.
تجزیه و تحلیل دادهها در دو سطح آمار توصیفی و استنباطی انجام شد.یافتهها نشان داد که موتورهای کاوش وب،شیوههای نگارش زبان فارسی را به منظور بهبود کاوش،مورد توجه قرار ندادهاند.همچنین رابطه معناداری بین شکل واژه و نوع ابزار جستجو وجود دارد.
خلاصه ماشینی:
محمد صادق عبد الهی1،دکتر عبد الرسول جوکار2 تاریخ دریافت:5/12/86 تاریخ پذیرش:21/7/88 چالشهای شیوه نگارش زبان فارسی در بازیابی اطلاعات از موتورهای کاوش وب چکیده شیوههای گوناگون در نوشتن یک واژه،یکی از مشکلاتی است که در بازیابی مدارک مربوطه از طریق ابزارهای جستجو وجود دارد.
سؤال مهمی که در اینجا مطرح میشود این است که: چگونه میتوان بر این مسئله فایق آمد؟آیا باید دست به اصلاح شیوه نگارش فارسی زد،یا اینکه نظامهایی پیشرفته و سازگار با این شیوه نگارش طراحی کرد؟ پیشینه پژوهش ابزارهای جستجو اساسا برمبنای زبان انگلیسی طراحی شدهاند و کشورهای غیر انگلیسیزبان چالشهای مشابهی با آنها دارند.
راثی ساربانقلی(1384)در پژوهش خود به بررسی مشکلات جستجو و بازیابی اطلاعات به زبان فارسی در اینترنت به کمک کاربران مرکز اینترنت دانشگاه آزاد اسلامی شبستر پرداخت.
کدامیک از ویژگیهای شیوه نگارش زبان فارسی در بازیابی اطلاعات از وب مشکل ایجاد میکند؟ در پاسخ به این سؤال باید بهطور کلی شرایطی که موجب نگارش یک واژه به ریختهای گوناگون میشود را مورد مطالعه قرار داد.
آمار بازیافتها برای مقوله شیوه برگردان واژهها خارجی (n-2) (تصویرتصویر) همانطور که در جدول نشان داده شد،بهطور کامل دو نتیجه متفاوت برای این دو کلید واژه بازیابی شده است.
تعداد بازیافتها برای مقوله شیوه نگارش نشانههای جمع (n-2) (تصویرتصویر) چنانچه کاربری کلید واژه"باغها"را انتخاب کند،بیشتر اطلاعات موجود که با کلید واژه"باغها" ذخیره شده است را از دست میدهد.
بنابراین میتوان نتیجه گرفت که به کار بردن یک شکل خاص از کلیدواژه و نیز استفاده از یک ابزار جستجوی خاص،در بازیابی اطلاعات اثرگذار است.
شیوه نگارش فارسی باعث بروز چالشهای جدی در امر نمایهسازی این زبان شده است.