چکیده:
خوشهبندی، فرایند سازماندهی عناصر به گروههایی است که اجزای آن به هم شبیه هستند. یک خوشه، مجموعة عناصری است که با هم مشابهت دارند و با اجزای دیگر خوشهها ناهمگون میباشند. هدف خوشهبندی، دستیابی سریع و مطمئن به اطلاعات همبسته، و شناسایی ارتباط منطقی میان آنهاست. بنابراین، الگوریتمهای خوشهبندی میتواند دربسیاری از حوزههای موضوعی بهکار گرفته شود. از آنجا که نتایج خوشهبندی میتواند با تعداد اصطلاحهای مورد استفاده تغییر یابد، روشهای تجربی متعددی برای تشخیص تعداد تقریبی اصطلاحهایی که میتوان انتظار داشت تا توزیع متناسب دادهها را در میان خوشهها فراهم سازد و حدود بالا و پایین الگوریتم خوشهبندی را تعیین کند، ارائه شده است. یکی از کاربردهای خوشهبندی، سازماندهی اصطلاحنامههاست. در این مقاله، با بهرهگیری از روش مطالعة کتابخانهای، ضمن بررسی مفهوم خوشهبندی اطلاعات، روشهای موثر خوشهبندی اطلاعات و کاربرد آن در ساختار تزاروس (اصطلاحنامه) بیان شده است. از جمله روشهای عمدة خوشهبندی چهار شیوة خوشهبندی دستهای، تکپیوندی، ستارهای، و رشتهای است. نتیجة این مطالعه نشان میدهد که بهرهگیری از الگوریتمهای متناسب و روشهای سودمند خوشهبندی اطلاعات میتواند نقشی مهم در سازماندهی بهینة اصطلاحنامه داشته باشد.
خلاصه ماشینی:
"با توجه به الگوریتم به کار رفته برای تهیۀ خوشهها با استفاده از شیوۀ تک پیوندی ماتریسرابطه واژه در شکل 3 به ایجاد ردههای زیر منجر میشود که در قالب دو ردۀ اصلی قابلنمایش است: Class 1(Term 1,Term 3,Term 4,Term 5,Term 6,Term 2) Class 2(Term 7) خوشهبندی ستارهای:در این روش،یک واژه را انتخاب کرده و سپس تمام واژههایمربوط به آن واژه را در همان رده قرار میدهیم.
با تکیه بر این رویکرد،سه ردۀاصلی ایجاد شده که به صورت زیر به نمایش درمیآید: Class 1(Term 1,Term 3,Term 4,Term 2,Term 8,Term 6) Class 2(Term 5) Class 3(Term 7) بر این اساس،میان اصطلاحهای تعریف شده ارتباطی چندوجهی ایجاد میشود که میتوان اینروابط را به صورت یک نمودار شبکهای با ترسیم خطوط ارتباطی به شکل زیر نشان داد: (به تصویر صفحه مراجعه شود)شکل 4 نمودار شبکهایمشابهتهای اصطلاح(کوالسکی،1997،ص 135) به عنوان نتیجهگیری از مبحث روشهای خوشهبندی،در صورتی که بخواهیم یکمقایسه میان دو نوع از انواع مهم و پراستفادۀ خوشهبندی،یعنی خوشهبندی دسته ای وخوشهبندی تکپیوندی انجام دهیم باید به نکات زیر اشاره کنیم: خوشهبندی دستهای،ردههایی را ایجاد میکند که قویترین روابط بین تمام واژههای آنوجود دارد؛این رده احتمالا مفهوم خاصی را تشریح میکند؛بیشترین ردهها را نسبت به سایرالگورتیمها ایجاد میکند؛تعداد واژههای یک رده را کاهش میدهد؛در این الگوریتم مانعیتبیشتری وجود داشته و جامعیت آن کاهش مییابد(کوالسکی،1997،ص 133-136).
ولیویژگیهای خوشهبندی تک پیوندی را میتوان به شرح ذیل برشمرد:واژهها را بین ردههاتقسیمبندی میکند(جزء بندی)؛این روش کمترین تعداد رده را ایجاد میکند؛ناپایدارترینارتباط بین لغات را در نظر میگیرد؛این احتمال نیز وجود دارد که دو واژهای که مشابهتآنها نزدیک به صفر است در یک رده قرار گیرد(سالتون،1972)؛ردهها به جای رساندن یکمفهوم،تنوعی از مفاهیم را دربر میگیرند؛جامعیت را به حد اکثر میرساند ولی مانعیت راکاهش میدهد."