چکیده:
نمایهسازی توزینی به منظور کاهش اختلالات معنایی در بازیابی اطلاعات طراحی شده است.به این ترتیب که هنگام نمایهسازی برای هر کلید واژه، وزنی مناسب با میزان ربط آن با محتوای مدرک تعیین میشود.در نمایهسازی توزینی ارتباط محتمل مدارک بازیابی شده برای پاسخگویی به سؤال محاسبه و همچنین میزان ربط احتمالی هر یک تعیین می شود.زمانی که نتیجه جستجو به جستجوگر ارائه میشود، مدارک براساس میزان ربط احتمالی موضوعی مدارک با موضوع سؤال از زیاد به کم، مرتب میگردد.
خلاصه ماشینی:
"در نمایهسازی توزینی ارتباط محتمل مدارک بازیابی شده برای پاسخگویی به سؤال محاسبه و همچنین میزان ربط احتمالی هر یک تعیین می شود.
علاوه بر آن، این مقاله برای تشریح نظریه اولیه و شیوههای نمایهسازی توزینی، مفهوم و طریقه محاسبه میزان آن را که معیاریست برای اندازهگیری احتمال بط میان سؤال مطرح شده و مدرک مورد بازیابی، تعریف کرد.
راهنمای تخصیص وزنهای متحمل ترجمهای اجمالی از زبانی به زبان دیگر انجام دهد و هم چنین به دلیل مقایسه میان واژههای تعیین شده در مدرک با واژههای مشابه موجود در سؤال، میتوان از آن در بازیابی مدارک استفاده کرد، ولی نتیجه به دست آمده همیشه مطلوب نیست.
استفاده از تزاروس میتواند این اختلال را کاهش دهد، ولی کاملا از میان نمیبرد چرا که قدری نامطمئنی در واژههای نمایه و موضوعی که به آن رهنمون شدهاند وجود دارد، زیرا اینکه متقاضی اطلاعات با همان واژه خاصی که مدرک ذخیره شده است موافق باشد و آن را واژه مناسب جستجو بداند، یک احتمال است.
این بار اطلاعاتی یا وزن واژه به وسیله نمایهساز به طور دستی محاسبه و تخمینزده میشود،، یعنی اگر کسی بخواهد نوع اطلاعات موجود در مدرکرا درخواست کند از کلید واژه تعیین شدهاستفاده خواهد کرد.
به علاوه نمایهسازی توزینی مستلزم آن است که ارتباط محتمل همه مدارک بازیابی شده برای سؤال، محاسبه شود و احتمال میزان ربط هر یک را تعیین نماید.
سالتن نشان داده است که در نظام بازیابی ماشینی، وزن نمایهسازی میتواند به طور خودکار براساس حضور کلمات در چکیده مدارک مشخص شود و این وزنها همانند وزنهای نمایهسازی احتمالی در نظامهای دستی میتواند تفسیر و مورد استفاده قرار گیرد."