چکیده:
این مقاله شیوهای برای جداسازی کلیدواژههای مدارک متنی یا فرامتنی ارائه مینماید.این کلیدواژههای جدا شده، همانند کلیدواژههای فهرست شده در یک مقاله، محتوای مدرک را مشخص میکند.برای مثال، میتوان از فرایند پیشنهادی برای نشان دادن محتوای مدارکی که به زبان اچ.تی.ام.ال 4P}از موتورهای جستجو بازیابی میشوند، استفاده کرد.این شیوه به کاربران اجازه میدهد که اطلاعات مورد نیاز خود را به سرعت پیدا کنند.این شیوه نه تنها همانند شیوههای دیگر، به بسامد واژههای موجود در مدرک توجه دارد بلکه بسامد مترادفهای آن واژه را نیز مدنظر قرار میدهد.با استفاده از روش یاد شده عبارات کلیدی شامل دو یا سه واژه نیز بررسی میشوند.در این شیوه برای افزایش درستی بسامد شمارش واژهها، الگوریتم ریشهیابی برای حذف پسوند واژهها به کار برده میشود.آزمایشها نشان میدهد که به طور متوسط 7/56 درصد از مجموع زمان محاسبه شده، در استفاده از الگوریتم ریشهیابی صرف میشود، همچنین فرایند پیشنهادی توانسته به طور میانگین 52 درصد از کلید واژههای تهیه شده توسط مؤلفان مدارک مورد آزمایش را جداسازی نماید.
خلاصه ماشینی:
"این شیوه نه تنها همانند شیوههای دیگر، به بسامد واژههای موجود در مدرک توجه دارد بلکه بسامد مترادفهای آن واژه را نیز مدنظر قرار میدهد.
آزمایشها نشان میدهد که به طور متوسط 7/56 درصد از مجموع زمان محاسبه شده، در استفاده از الگوریتم ریشهیابی صرف میشود، همچنین فرایند پیشنهادی توانسته به طور میانگین 52 درصد از کلید واژههای تهیه شده توسط مؤلفان مدارک مورد آزمایش را جداسازی نماید.
در این پژوهش پیشنهاد میشود که از کلیدواژهها برای خلاصهسازی نتایج صفحات وبی که از موتورهای جستجو بازیابی میشوند، استفاده شود.
هدف از این پیشنهاد کمک به کاربران برای بررسی سریع نتایج جستجو و بازیابی اطلاعات مورد نظر در زمان کوتاهتر است.
این شیوه نه تنها همانند شیوههای دیگر، به بسامد واژههای موجود در مدرک توجه میکند بلکه، بسامد مترادفهای واژه مورد نظر را نیز مد نظر قرار میدهد.
سیاهه مترادفهای واژههای باقی مانده مجاز تهیه میشود و پس از این مرحله، الگوریتم ریشهیابی برای از بین بردن پسوندها و باقی گذاردن واژگان مجاز به کار میرود.
شیوه مورد نظر با جزئیات کامل در ادامه توضیح داده شده است: ریشهیابی واژگان دو نوع الگوریتم برای ریشهیابی واژگان وجود دارد که به طور گسترده، از آنها استفاده میشود:الگوریتم لووینز 13P}الگوریتم پورتر 14P}.
هدف از این پیشنهاد یاری رساندن به کاربران برای بررسی سریع نتایج جستجو و یافتن اطلاعات مورد نظر در مدت زمان کوتاهتر است.
در نظام مورد نظر برای پردازش تعداد زیادی از صفحات وبی که از موتورهای جستجو بازیابی شدهاند و فراهم کردن زمان مناسبی برای پاسخ، شیوه نسبتا سادهای برای این تحقیق انتخاب گردید."