چکیده:
بازآرایی و به نظم درآوردن نتایج جستجو در بازیابی اطلاعات، بخصوص وقتی حجم منابع بازیابی شده بسیار زیاد است. به کاربران در تسهیل امر بازیابی اطلاعات کمک میکند. بازآرایی و سازماندهی مدارک همواره بر اساس ویژگیهای هر مدرک صورت میپذیرد. بنابراین، بازسازی نتایج جستجو نیز منوط به ویژگیهای مذکور است. ویژگیهای مدارک را میتوان به دو گروه ردیف اول و ردیف دوم دستهبندی کرد. در این مقاله، با اشاره به انواع ویژگیهای مطرح برای مدارک و اشاره به این نکته که خوشهبندی یکی از روشهای رایج در دستهبندی نتایج جستجوست تلاش شده تا فصل مشترک میان این ویژگیها و نیز روشهای مختلف خوشهبندی مشخص گردد. در نهایت، با توجه به اینکه خوشهبندی نتایج جستجو از فناوریهای نسبتا رایج در سطوح وب بوده و طراحان موتورهای جستجو برای بهبود نتایج، پژوهشی تکمیلی به منظور امکانسنجی و بررسی وجود ملزومات (نمایهسازی ویژگیها) در جهت دستهبندی نتایج نشان دهندة آن است که با وجود توجه به ویژگیها و نمایهسازی آنها توسط موتورهای جستجوی مختلف، و نیز ساده بودن الگوریتمهای خوشهبندی مورد نیاز در جهت بازآرایی نتایج بر مبنای این ویژگیها (خوشهبندی مسطح)، حتی موتورهای جستجوی خوشهساز نیز از این ویژگیها در بازآرایی نتایج خود استفاده نمیکنند.
خلاصه ماشینی:
"در این نوشتار، با ارائه تعریفی عام از خوشهبندی، خوشهبندی نتایج جستجو به منزلة راهبرد دستهبندی نتایج جستجو در نظر گرفته شده و با توجه به اینکه اثر خوشهبندی نتایج جستجو بر بازیابی اطلاعات نسبتا مناسب ارزیابی شده است (Manning, Raghavan & Schütze, 2007)، مدلهای مختلف خوشهبندی، با انواع ویژگیهای مطرح در بازیابی اطلاعات انطباق داده می شود.
اشاره به این ویژگیها برای دستهبندی مدارک، اگرچه کمتر مورد توجه قرار گرفته است، اما گرایش جدیدی نیست، زیرا سالها پیش از ظهور کتابداری نوین، کتابخانههای ما بر مبنای پارهای از همین ویژگیها سازماندهی میشدند؛ ویژگیهایی همچون قطع، رنگ، جلد و ...
استفاده از ویژگی موضوع (از ویژگیهای گروه اول) و نیز تمامی ویژگیهای ردیف دوم برای دستهبندی ثانویه نتایج، بخصوص در محیطهایی که تعداد نتایج بازیابی شدة اولیه بسیار زیاد است، راهبردی است که به منظور بهینهسازی کارکرد نظام اطلاعاتی مورد استفاده قرار میگیرد.
با توجه به ویژگیهای روشهای مختلف خوشهبندی، اعم از سخت و نرم و نیز خوشهبندیهای سلسله مراتبی و تک سطحی، ماتریسی به منظور انطباق انواع روشهای خوشهبندی بر ویژگیهای ردیف اول و دوم تشکیل شده است (ماتریس 1) تا پیش از هر بررسی در محیط وب، روشهای مناسب خوشهبندی برای بازآرایی نتایج جستجو مشخص گردد.
همچنین، بحث در زمینة دستهبندی نتایج جستجو برای ویژگیهای مختلف بخصوص ویژگیهای ردیف اول (پدید آور و عنوان) با سایر ویژگیها (بویژه ویژگیهای ردیف دوم) متفاوت است، اما هدف نوشتار حاضر از کنار هم قراردادن این ویژگیها، در واقع رسیدن به یک نوع آگاهی از اهمیت نوع شناسی ویژگیهای مطرح در جستجو برای بازآرایی و سازماندهی نتایج است."