چکیده:
فنون نمایهسازی به تکامل خوبی رسیده است.کتابخانهها و دیگر مجموعههای رقومی برای ذخیره و بازیابی مدارک از این فنون بهره فراوان میبرند.از طرف دیگر ما فنونی داریم که به کاربر اجازه گردآوری اطلاعات را میدهد.رویکردهای جاری به اندازه کافی برای رضایت کاربر پیشرفته نیستند.در"آزمایشگاه فیزیک ذرات اروپا 4P}ما مشغول ایجاد یک برنامه نمایهساز مبتنی بر توصیفگرهای اصطلاحنامه هستیم.با مجموعهای از مدارک مرتبط با اصطلاحنامه، کاربر میتواند آنها را به شیوه مفهومیتر بازیابی کند.در این مقاله به توصیف هسته این نظام، یعنی تخصیص دهنده توصیفگر خودکار پرداخته میشود.
خلاصه ماشینی:
"کلیدواژهها نمایهسازی مفهومی، نمایهساز فیزیک با انرژی بالا 5P}، جستجوی تمام متن، تخصیص خودکار توصیفگرها مقدمه فنون نمایهسازی توجه محققان بازیابی اطلاعات را جلب کرده است، زیرا به وضوح بیان کننده یکی از مشکلات اصلیست که باید رفع، و بهینهسازی شود.
3. نظام به مجموعه دسترسی دارد و مجموعهای از مدارک را برای کاربر بازیابی میکند.
برخی نشریات کلید واژه دارند و تعداد اندکی هم ردهبندی«طرح ردهبندی فیزیک و ستارهشناسی» 12P}را که مورد حمایت جامعه فیزیک آمریکا 13P}ست، پذیرفتهاند(1)؛اما بعید است که از این رویکردها در همه مدارک به طور کامل استفاده شود، بنابراین برای جستجو در مقیاس جهانی مفید نیستند.
3. پیشینه کار امکان دسترسی به مجموعه عظیمی از مدارک به صورت تمام متن نشان دهنده ظهور عصری جدید در بازیابی اطلاعات است.
نظام"نمایهساز فیزیک با انرژی بالا"، هسته همه این موارد است و به صورت خودکار توصیفگرهایی برای مدارک تمام متن ارائه شده، پیشنهاد میکند.
4. نمایهساز"فیزیک با انرژی بالا" الگوریتم به کار رفته به مجموعهای از دادهها نیاز دارد که باید از قبل در فرایند آموزش تولید شده باشد.
hcsenamkehcstuK P} از مدارک مرتبط با"فیزیک با انرژی بالا"ست که در آن توصیفگرهای دسی به هر مدرک اختصاص داده شده است.
کاربر با استفاده از مرورگرهای وب میتواند نظام را با مدارکی از مجموعه آزمایشی امتحان کند یا کلیدواژههای پیشنهادی را با ارائه مدرک جدید تمام متن، در قالب پست اسکریپ 29P}یا پی.
اگر چه این نظام فقط میتواند توصیفگرهای اصلی دسی را پیشنهاد دهد، اما نتیجه از نظر دقت و بازیابی در حد 60 درصد است."