چکیده:
در این مقاله تکنیکهای بازخورد ربط با استفاده از روشهای مدلسازی رتبهای و به شکلی ساده مطرح میشود و نمودارهای مربوط،مفهوم روش مدلسازی زبان در بازیابی اطلاعات را شفافتر میسازد. سه مسئلهای که انتظار میرود یک مدل بازیابی اطلاعات بدان پاسخ دهد عبارتند از:1)وزندهی به لغات؛2)بازخورد ربط؛3)پرسشهای ساختارمند.براساس این پرسشهاست که رخداد ربط میان منابع متفاوت سنجیده میشود. در متون،از مدلهای بازیابی قابل رتبهبندی متعددی نامبرده شده است که مقالهء حاضر به توصیف اجمالی برخی از آنها و ذکر مزایا و معایب آنها میپردازد.
خلاصه ماشینی:
"بررسی اجمالی مزایا و معایب مدلهای بازخورد ربط فاطمه فهیمنیا1 آنچه در مقابل کلمهء مدل در واژهنامهء و بستر آمده عبارت است از:"نظامی مفروض برای توصیف ریاضی دادهها،نتایج،ماهیت یا وضع امور".
مدلهای بازیابی با قابلیت رتبهبندی نتایج این مدلها معمولا از روشهای آماری برای سنجش بسامد کلمه در متون استفاده کرده و بر آن اساس رتبه را محاسبه مینمایند.
مدل برداری براساس این مدل زمانی که پرسش،حاوی کلمهای باشد که در متن بایستی بازیابی شود،از آنجایی که هر کلمه در پرسش امکان رخداد مخصوص خود را دارد که ممکن است با امکان رخداد آن در متن متفاوت باشد،کلمات موجود در پرسش به عنوان یک بردار تلقی شده و بسامد آن در متن بردار دوم را تشکیل میدهد.
رابرتسون4در 7791،مدل بولی را از طریق نمودار زیر با مدل احتمال ربط تلفیق کرده است: (به تصویر صفحه مراجعه شود) فرض بر این است که لغات جدای از هم و مدارک نیز به صورت مستقل سنجش احتمال میشوند(رابرتسون،6791؛و ون ریسبرگن،9791).
مزیت اصلی این مدل نیز عدم نیاز به الگوریتم وزندهی برای کلمات اضافی است (هارتر2،5791)لیکن در کاربرد ضرایب در محاسبه به طریقی عمل شده که گویی طول مدارک یکسان است؛و این امری نادر است که مدارک از نظر تعداد کلمات موجود در متن یکسان باشند.
مدل ساده آن به شکل زیر است: (به تصویر صفحه مراجعه شود) این مدل ساده نمایانگر آن است که،بهطور مثال،یک مدرک از طریق 3 کلمه با یک پرسش مرتبط میشود.
"Using probabilistic models of document retrieval without relevance information"."