Skip to main content
فهرست مقالات

خزنده و ساختواره وب

نویسنده:

ISC (10 صفحه - از 63 تا 72)

کلیدواژه ها :

ساختار نموداری وب ،خزنده ها ،حرکت عمق ،شروع ،حرکت توزیع ،حرکت بهترین ،نمایه سازی وب ،خزنده‌ها ،حرکت عمق ـ شروع ،حرکت توزیع ـ شروع ،حرکت بهترین ـ شروع ،نمایه‌سازی وب

کلید واژه های ماشینی : وب ، موتورهای جستجو ، خزنده ، حرکت خزنده‌ها در موتورهای جستجو ، حرکت ، حرکت خزنده در سطح وب ، لینکهای ، ساختار خزنده‌ها الگوریتم رتبه‌بندی صفحات ، ساختار وب ، ساختواره وب

وب به عنوان بستر فعالیت موتورهای جستجو، ساختاری نموداری دارد. این ساختار حرکت خزنده‌ها در موتورهای جستجو را به روشهایی منطبق بر خود محدود می‌سازد. مقاله حاضر، به بررسی تأثیر ساختار وب بر چگونگی حرکت خزنده‌ها و فعالیت نمایه سازها در موتورهای جستجو می پردازد. پس از بحثی مقدماتی در باب نمودارهای جهت‌دار و فرایند کار خزنده، عمده‌ترین روشهای حرکت خزنده در سطح وب شامل حرکت «عمق ـ شروع»، «توزیع ـ شروع» و «بهترین ـ شروع» مطرح شده و سپس واحد سازه‌یابی و چگونگی تشکیل درختهای سازه‌یابی از قالب HTML مورد بررسی قرار خواهد گرفت.

خلاصه ماشینی:

"آنچه نهایتا در پایگاه ذخیره می‌شود در واقع حاصل فرایند نمایه‌سازی است که تحت قالب تعریف شده در الگوریتم موتور جستجو به صورت واژگان و عبارات مختل پایگاه نمایه واحد کار واحد جداسازی لینکها نمایه‌ساز واحد کنترل گردآورنده وب ف در آمده است (Cothey, 2004). 0 7 1 3 2 5 6 4 Seed از آنجا که تقریبا تمام صفحه‌های وب لینکهایی به سایر صفحات برقرار می‌کنند، چنانچه سطح عمق برای واحد کنترل تعریف شده نباشد، حرکت به عمق آن‌ قدر ادامه خواهد یافت که به مرور زمان، عملا پایگاه نمایه موتور جستجو را از مطالب بی کیفیت خواهد انباشت. در حرکت عمق ـ شروع، با انتخاب هر لینک و رفتن به صفحه بعدی و ادامه این کار، یک مطلب خاص (حوزه موضوعی مربوط به سطح عمق اول حرکت) به صورت اختصاصی دنبال شده و از آنجا که گرایش واحد کنترل نسبت به حرکت عمقی گردآورنده بیشتر از حرکت در سطح است، در نهایت صفحاتی که برای نمایه‌ساز فرستاده می شوند به احتمال، اغلب حول یک مطلب یا موضوع خواهند بود. از آنجا که سازه‌یاب براساس دستور زبان از قبل تعریف شده به هدف دستیابی به محتوای مشخصی عمل می‌کند، تقسیم‌بندی واژگان استخراج شده و وزن دهی به آنها کار ساده‌‌ای خواهد بود(Fischer, 2005) زبان HTML زبان غالب در سطح وب به شمار می‌آید، لذا کلیه موتورهای جستجو دارای نرم افزارهای سازه‌یابی سازگار با HTML برای زبانهای مختلف هستند."


برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.