چکیده:
نمایهسازی معانی پنهان روشی است که اطلاعات را در قالب معانی ذخیره میکند، و از رابطة پنهان میان اصطلاحات و متن استفاده مینماید. در این روش معایب توجه به اصطلاح در یک سند به صورت منفرد، برطرف میگردد. در نظام بازیابی که به این روش فراهم میآید، بهجای تطبیق لغوی اصطلاحات کلیدی، رابطة معنایی میان اصطلاحات نیز مورد توجه قرار میگیرد. در این مقاله، نظریه و کاربردهای نمایهسازی معانی پنهان در نظامهای بازیابی مورد بررسی قرار میگیرند
خلاصه ماشینی:
"کلیدواژهها: بازیابی اطلاعات، نمایهسازی معانی پنهان، تجزیة مقدار ویژه مقدمه در میان گونههای مختلف اطلاعات موجود در اینترنت، بیشتر اطلاعات، بخصوص اسناد و مدارک علمی، دارای قالببندی متنی میباشند و بنابراین بازیابی اطلاعات متنی از اهمیت بسیاری برخوردار است (Kowalski, 1997).
روش بهتر آن است که در زمان بازیابی اطلاعات، مفهوم و معنای پایة اسناد مورد استفاده قرار گیرد(Bery, Dumais & Shippy, 1995; Rosario, 2000).
در فضای معانی پنهان، سند و درخواست میتوانند شباهت کسینوسی (کسینوس زاویة میان دو بردار، که هرچه به 1 نزدیکتر باشد زاویة میان دو بردار کمتر است) زیادی داشته باشند، حتی اگر از نظر لغوی، اصطلاحات مشترک نداشته باشند؛ درواقع شباهت میان معنای اصطلاحات، سنجیده میشود.
امکانات مورد نیاز فقط فضای مشترک برای پیادهسازی اصطلاحات و بردارها است، بنابراین میتوان اسناد و ماتریس اصطلاحـ سند را برای مدارکی که در بیش از یک زبان دارای نسخة متنی هستند مورد استفاده قرار داد.
مثلا میتوان از زبان انگلیسی و فرانسوی استفاده کرد و یک فضای مشترک برای هر دو زبان ایجادکرد، و در این حالت نیاز به ترجمة درخواست نیست و مشکلی در بازیابی اسناد مرتبط به وجود نخواهد آمد(Foltz, 1998; Rosario, 2000; Dumais, 1997).
اگر غلط املایی فقط در یک مکان وجود داشته باشد در فضای جدید اسناد، ترمیم میگردد و با نسخة صحیح از اصطلاح، در میانگین مربعات جایگزین میگردد (Foltz, 1998; Rosario, 2000; Dumais, 1997 نتیجه نمایهسازی معانی پنهان روشی تازه و امیدبخش در بازیابی اطلاعات است، که اسناد را در فضایی با ابعاد کمتر، شاخصگذاری و بازیابی میکند."