چکیده:
پژوهش حاضر، با هدف تبیین واکنش موتورهای کاوش وب به پیشینههای فرادادهای مبتنی بر روش ترکیبی دادههای خرد و روش دادههای پیوندی با رویکرد تجربی انجام شد. جامعه پژوهش را 200 پیشینه فرادادهای در قالب دو گروه گواه و آزمون با تعداد پیشینهی برابر تشکیل میدادند. پیشینههای یاد شده به روش نمونهگیری تصادفی، از میان پیشینههای فرادادهای دروازه اطلاعاتی کنسرسیوم محتوای ملی انتخاب شدند. در گروه آزمون، 100 پیشینه فرادادهای انتخاب شده با رویکرد ترکیبی بر مبنای دو روش دادههای خرد، به عنوان بهترین روش تولید خردههای غنی، و دادههای پیوندی (قالب آردیاف/ ایکسامال) ایجاد، و در گروه گواه، 100 پیشینه بدون تغییر و با قالب اولیه آماده، و بر روی وب سایت http: //ww. rnikzad. ir منتشر شدند. سپس وب سایت بیان شده به صورت مستقیم و بر اساس روشهای توصیه شده، به موتورهای کاوش گوگل و بینگ معرفی شد. با استفاده از سیاهه وارسی، وضعیت نمایهپذیری و پیدانمایی پیشینههای فرادادهای هر دو گروه در محیط موتورهای کاوش انتخابی مورد بررسی قرار گرفت. یافتههای پژوهش حاکی از آن است، موتورهای کاوش گوگل و بینگ ارزشهای عناصر پیشینههای فرادادههای گروههای گواه و آزمون را نمایهسازی کردند، و پیشینههای مرتبط را با جستجوی ارزشهای عناصر فرادادهای در نتایج جستجو پدیدار مینمایند، اما نمایش آنها به شکل معنادار و همانند پیشینههای فرادادهای تولید شده فقط مبتنی بر روشهای تولید خردههای غنی نبود. به عبارت دیگر، نرمافزارهای خزنده-نمایهساز موتورهای کاوش وب توانایی شناسایی و تشخیص برچسبهای (عناصر) توصیه شده براساس روش دادههای خرد را که در قالب چارچوب توصیف منبع (آردیاف)، به عنوان چهارچوب و بستر نحوی روش دادههای پیوندی، پیادهسازی شدهاند، ندارند، و به پیروی از آن، این پیشینهها را در نتایج جستجو به صورت معنادار نمایش نمیدهند. بنابراین موتورهای کاوش وب با وجود تلاش برای ایجاد وب معنایی، سازگاری کامل با استانداردهای وب معنایی ندارند.
The purpose of this research was to find out the reaction of Web Search Engines to Metadata records created based on the combined method of Rich Snippets and Linked Data. 200 metadata records in two groups (100 records as the control group with the normal structure and, 100 records created based on microdata and implemented in RDF/XML as experimental group) extracted from the information gateway of Iranian Content National Consortium (INCN) were analyzed through an experimental approach. The metadata records of two groups were published on an independent website (www.rnikzad.ir), and were introduced to Google and Bing search engines directly. The using a checklist, the status of index ability and visibility of the published metadata records in two search engines were examined. Findings show all the element values of the metadata records of two groups indexed by Google and Bing, and were visible in the search results; but the records were not displayed in the search results semantically like the metadata records created in rich snippets methods only. In the other words, the spider-indexer software of Web search engines are not able to identify and index the metadata elements (tags) created based on microdata method and implemented in RDF (as the syntax of linked data method) and, the search engines cannot display the records in the search results semantically. So Web search engine are not adaptable to the standards of the semantic web.
خلاصه ماشینی:
به عبــارت ديگــر، نرم افزارهــاي خزنده -نمايه ســاز موتورهــاي کاوش وب توانايــي شناســايي و تشــخيص برچســب هاي (عناصــر) توصيه شــده بــر اســاس روش داده هــاي خــرد را کــه در قالــب چارچــوب توصيــف منبــع (آردي اف )، به عنــوان چهارچــوب و بســتر نحــوي روش داده هــاي پيونــدي پياده ســازي شــده اند، ندارنــد و بــه پيــروي از آن ، ايــن پيشــينه ها را در نتايــج جســت وجو به صــورت معنـادار نمايـش نمي دهنـد.
org بـا وجـود اين کـه تاکنـون اقدامـات گوناگونـي بـراي ايجـاد قابليـت معنايـي در محيـط وب توسـط فراهم کننـدگان اطلاعـات و خدمـات پيوسـته صـورت گرفتـه ، امـا در ايـن ميـان ، دو راه کار 641 روش داده هــاي پيونــدي بــر اســاس ايــدة وب معنايــي و توليــد خرده هــاي غنــي به عنــوان لايــۀ معنايــي نســخۀ جديــد زبــان نشــانه گذاري فرامتــن (اچ تــي ام ال ) کــه از ســوي موتورهــاي کاوش توصيــه شــده ، بيــش از ديگــران مــورد توجــه قــرار گرفتــه اســت .
بــا توجــه بــه اين کــه هــر دو راه کار بــر معنابخشــي بــه فرايندهــاي نمايه ســازي و بازيابــي اطلاعــات تأکيــد دارنــد، مســئله اي کــه مطــرح مي شــود ايــن اســت کــه واکنــش موتورهــاي کاوش وب بــه پيشــينه هاي فــراداده اي توليدشــده بــر اســاس روش ترکيبــي (داده هـاي پيونـدي و خرده هـاي غنـي ) چگونـه خواهـد بـود؟ آيـا نرم افزارهـاي خزنده -نمايه سـاز موتورهـاي کاوش قـادر بـه تشـخيص عناصـر فـراداده اي به طـور کامـل (بـا نـام و ارزش برچسـب ) و ارائـۀ سـاختارمند و معنـادار آن هـا در نتايـج خـود هسـتند؟ پژوهـش حاضـر، بـراي پاسـخگويي بـه ايـن مسـئله طرح ريـزي شـده اسـت .