Skip to main content
فهرست مقالات

مروری بر قالب بندی ایکس. ام. ال و کاربرد آن در بازیابی اطلاعات

نویسنده:

علمی-ترویجی/ISC (7 صفحه - از 81 تا 87)

کلیدواژه ها :

بازیابی اطلاعات ،موتور جستجو ،قالب‌بندی ،ایکسامال

کلید واژه های ماشینی : اطلاعات، بازیابی اطلاعات، نظام‌های بازیابی اطلاعات، وب، قالب، قالب‌بندی ایکس، کاربر، موتورهای کاوش، قالب‌بندی، مدارک ایکس

با پیشرفت فناوری و فنون اطلاعات و ارتباطات در قرن اخیر، اهمیت دسترسی به اطلاعات صحیح و جامع روز به روز بیشتر می‌شود طبق آمارهای موجود، روزانه حدود 7 میلیون صفحه جدید به فضای شبکه جهانی اضافه می‌شود.باتوجه به حجم اطلاعات موجود در اینترنت، و ناهمگن بودن اطلاعات، لزوم به کارگیری روش‌های خودکار در نمایه‌سازی و بارزیابی دقیق اطلاعات بیشتر احساس می‌شود. کاربران پرسش‌های خود را به نظام‌های بازیابی اطلاعات(موتورهای کاوش) ارائه می‌دهند و جواب نظام، باید مرتبط با پرسش کاربر باشد، ولی به دلیل حجم اطلاعات موجود در وب و نبود قالب مشخص که ساختار معنایی مدارک را حفظ نماید، دقت موتورهای کاوش کم می‌شود.ساختار ایکس.ام.ال 1 قالب مناسبی برای حفظ ساختار معنایی مدارک در سطح وب است.این قالب علاوه بر حفظ ساختار معنایی، دارای امکاناتی برای ساخت نمایش وبی مدارک در مرور گرهاست.موتورهای کاوش دقت بیشتر و کارآیی بالاتری را در جستجوی مدارک در قالب ایکس.ام.ال از خود نشان می‌دهند.جستجو گرهای مدارک ایکس.ام.ال به سه دسته تقسیم می‌شوند:جستجو گرهایی براساس پایگاه داده‌ها، جستجو گرهایی مدارک ایکس.ام.ال.

خلاصه ماشینی:

"کاربران پرسش‌های خود را به نظام‌های بازیابی اطلاعات(موتورهای کاوش) ارائه می‌دهند و جواب نظام، باید مرتبط با پرسش کاربر باشد، ولی به دلیل حجم اطلاعات موجود در وب و نبود قالب مشخص که ساختار معنایی مدارک را حفظ نماید، دقت موتورهای کاوش کم می‌شود. همان‌طور که در مثال 1-2 مشاهده می‌شود، در این قالب‌بندی علاوه بر مشخص شدن قالب نمایشی وبی مقاله(برای مثال عنوان مقاله بزرگ‌تر از متن مقاله است و در وسط تراز می‌گردد)، نوع مدرک(مقاله بودن با بر چسب ELCITRA )و همچنی اجزای آن به تفکیک مشخص شده است. ال این قابلیت وجود دارد که علاوه بر تعریف داده‌ها، ساختار آن را نیز بیان کنیم، به عبارت دیگر، یک سری قواعد معنایی 3 برای بر چسب‌ها تعریف می‌شود، تا علاوه بر نمایش ظاهری ساختار، شکل صحیح به کارگیری آن را نیز مشخص کند. در روش ترکیبی ابتدا مدارک با کمک روش‌های بازیابی اطلاعات، نمایه‌سازی می‌شود، و در ذخیره اطلاعات و همچنین پرسش‌هایی که باید به نظام داده شود، از پایگاه داده‌ها استفاده می‌شود. مزیت این‌روش آن است که با سرعت بالا می‌تواند پایگاه‌هایی را که باید جستجو شوند، مشخص می‌کند و بیان درخواست و پرسش کاربر با زبان استاندارد پایگاه داده‌ها، باعث کارآیی بهتر نظام بازیابی از نظر زمان و فضای دیسک می‌شود، برای مثال‌ dniFZYX نظامی‌ست که با دریافت مدارک ایکس. روش سوم، ترکیب روش اول و دوم است، بنابر این علاوه بر حفظ ساختار معنایی داده‌ها، جامعیت داده‌ها و رابطه میان آنها، کارآیی نظام نیز در سطح قابل قبولی قرار دارد."

  • دانلود HTML
  • دانلود PDF

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.