Skip to main content
فهرست مقالات

شیوه جداسازی کلید واژه ها از مدارک فرامتنی

نویسنده:

مترجم:

علمی-ترویجی (6 صفحه - از 169 تا 174)

کلیدواژه ها : بازیابی اطلاعات ،وب کاوی ،استخراج کلیدواژه ،فرامتن (1) txtrepyH morF drowyeK gnitcartsbA no ecnerefnoC lanoianretnIstnemcoD ,gnireenignE egdelwonK dna noitamrofnI ،731:pp,2002 P}

کلید واژه های ماشینی : شیوه جداسازی کلید واژه‌ها ،واژه ،جداسازی کلید واژه‌ها از مدارک ،جداسازی کلیدواژه‌های مدارک متنی ،کلیدواژه‌ها ،کلید واژه ،بسامد ،کلید واژه‌ها از مدارک فرامتنی ،شیوه ،تی ،الگوریتم ریشه‌یابی ،مقاله شیوه جداسازی‌های مدارک متنی ،استفاده از الگوریتم ریشه‌یابی ،مترادف‌های ،رتبه‌بندی ریشه‌های تک کلمه‌ای استفاده ،فرایند ،بسامد واژه‌های موجود در مدرک ،الگوریتم ریشه‌یابی صرف ،بسامد مترادف‌های ،رتبه‌بندی ریشه‌های تک ،محتوای مدرک ،واژگان مدارک ،حذف پسوند واژه‌ها به کار ،موتورهای جستجو بازیابی ،مقاله ،ریشه‌یابی واژگان ،فرایند تولید کلید واژه ،صفت ،کلید واژه‌های تهیه‌شده ،کلیدواژه‌های فهرست‌شده

این مقاله شیوه‌ای برای جداسازی کلیدواژه‌های مدارک متنی یا فرامتنی ارائه می‌نماید.این کلیدواژه‌های جدا شده، همانند کلیدواژه‌های فهرست شده در یک مقاله، محتوای مدرک را مشخص می‌کند.برای مثال، می‌توان از فرایند پیشنهادی برای نشان دادن محتوای مدارکی که به زبان اچ.تی.ام.ال 4P}از موتورهای جستجو بازیابی می‌شوند، استفاده کرد.این شیوه به کاربران اجازه می‌دهد که اطلاعات مورد نیاز خود را به سرعت پیدا کنند.این شیوه نه تنها همانند شیوه‌های دیگر، به بسامد واژه‌های موجود در مدرک توجه دارد بلکه بسامد مترادف‌های آن واژه را نیز مدنظر قرار می‌دهد.با استفاده از روش یاد شده عبارات کلیدی شامل دو یا سه واژه نیز بررسی می‌شوند.در این شیوه برای افزایش درستی بسامد شمارش واژه‌ها، الگوریتم ریشه‌یابی برای حذف پسوند واژه‌ها به کار برده می‌شود.آزمایش‌ها نشان می‌دهد که به طور متوسط 7/56 درصد از مجموع زمان محاسبه شده، در استفاده از الگوریتم ریشه‌یابی صرف می‌شود، همچنین فرایند پیشنهادی توانسته به طور میانگین 52 درصد از کلید واژه‌های تهیه شده توسط مؤلفان مدارک مورد آزمایش را جداسازی نماید.

خلاصه ماشینی:

"این شیوه نه تنها همانند شیوه‌های دیگر، به بسامد واژه‌های موجود در مدرک توجه دارد بلکه بسامد مترادف‌های آن واژه را نیز مدنظر قرار می‌دهد. آزمایش‌ها نشان می‌دهد که به طور متوسط 7/56 درصد از مجموع زمان محاسبه شده، در استفاده از الگوریتم ریشه‌یابی صرف می‌شود، همچنین فرایند پیشنهادی توانسته به طور میانگین 52 درصد از کلید واژه‌های تهیه شده توسط مؤلفان مدارک مورد آزمایش را جداسازی نماید. در این پژوهش پیشنهاد می‌شود که از کلیدواژه‌ها برای خلاصه‌سازی نتایج صفحات وبی که از موتورهای جستجو بازیابی می‌شوند، استفاده شود. هدف از این پیشنهاد کمک به کاربران برای بررسی سریع نتایج جستجو و بازیابی اطلاعات مورد نظر در زمان کوتاه‌تر است. این شیوه نه تنها همانند شیوه‌های دیگر، به بسامد واژه‌های موجود در مدرک توجه می‌کند بلکه، بسامد مترادف‌های واژه مورد نظر را نیز مد نظر قرار می‌دهد. سیاهه مترادف‌های واژه‌های باقی مانده مجاز تهیه می‌شود و پس از این مرحله، الگوریتم ریشه‌یابی برای از بین بردن پسوندها و باقی گذاردن واژگان مجاز به کار می‌رود. شیوه مورد نظر با جزئیات کامل در ادامه توضیح داده‌ شده است: ریشه‌یابی واژگان‌ دو نوع الگوریتم برای ریشه‌یابی واژگان وجود دارد که به طور گسترده، از آنها استفاده می‌شود:الگوریتم لووینز 13P}الگوریتم پورتر 14P}. هدف از این پیشنهاد یاری رساندن به کاربران برای بررسی سریع نتایج جستجو و یافتن اطلاعات مورد نظر در مدت زمان کوتاهتر است. در نظام مورد نظر برای پردازش تعداد زیادی از صفحات وبی که از موتورهای جستجو بازیابی شده‌اند و فراهم کردن زمان مناسبی برای پاسخ، شیوه نسبتا ساده‌ای برای این تحقیق انتخاب گردید."

  • دانلود HTML
  • دانلود PDF

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.