استخراج خودکار عبارت های کلیدی از متون مقاله های فارسی مقاله

کتابداری و اطلاع رسانی پاییز 1385 - شماره 35 ISC (‎9 صفحه - از 66 تا 74 )

کلیدواژه ها: کلیدواژه ها عبارتهای کلیدی مقاله های فنی كليدواژه مقاله‌هاي فنيسازماندهي اطلاعات نظامهاي بازيابي اطلاعات فايل واژه‌نامه ريشه‌يابي واژگان خوشه‌بندي اطلاعات اطلاعات بازیابی اطلاعات سیستمهای بازیابی اطلاعات واژگان استخراج خودکار کاربر متن سازماندهی اطلاعات

چکیده:

در پژوهش حاضر، عبارتهای کلیدی از متون مقاله‌های فارسی به صورت خودکار جداسازی گردیده است. استخراج عبارتها مبتنی بر روشهای آماری، نحوة توزیع واژگان، مجاورت و ... صورت پذیرفته است. سیستمی که بر پایه پژوهش حاضر طراحی گردیده، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، با توجه به بازخوردهای کاربر از قابلیت یادگیری برخوردار است، به گونه‌ای که در طول زمان مرتبا به کارایی آن افزوده می‌شود. استخراج عبارتهای کلیدی می‌تواند در پهنه گسترده‌ای از مسائل از جمله در طراحی سیستمهای بازیابی اطلاعات، کاربر داشته باشد.هر نظام بازیابی اطلاعات (نرم‌افزار) دارای یک مبنای خاص برای تجزیه و تحلیل اطلاعات است، که نظام بر اساس آن به تفسیر اطلاعات و مطابقت بین اقلام و درخواستهای اطلاعاتی پرداخته و بدین ترتیب بازیابی اطلاعات صورت می‌گیرد. این تجزیه و تحلیل «سازماندهی اطلاعات» نامیده می‌شود. بدون یک سازماندهی بهینه اطلاعات، بازیابی اطلاعات به صورت کامل و دقیق صورت نخواهد گرفت. با توجه به متفاوت بودن سیاستهای بازیابی اطلاعات باید به صورت همزمان امکان استفاده از روشهای خودکار و نیمه‌خودکار فراهم آورده شود. پیش‌بینی سیاهه بازدارنده، ایجاد انواع واژه‌نامه‌ها مانند واژه‌نامه ریشه لغات، سیاهه پسوندها، واژه‌نامه عبارات، واژه‌نامه مفاهیم، برقراری روابط سلسله مراتبی مفاهیم، ریشه‌یابی واژگان، محاسبه همبستگی و خوشه‌بندی اطلاعات همگی از امکاناتی هستند که باید در یک نظام بازیابی اطلاعات بهینه وجود داشته باشد. مقاله حاضر، به بررسی این مفاهیم پرداخته است.

خلاصه ماشینی:

برنامه در روشی قابل مقایسه با آنچه توسط انسان خوانده می‌شود، اطلاعات را مورد پردازش قرار می‌دهد و از میان کلیه واژگان موجود در مقاله، عبارتهای کلیدی را که نشان‌دهنده مرتبط‌ترین عبارتها و اطلاعات مقاله می‌باشند، استخراج می‌کند. انجام این کار به صورت خودکار می‌تواند به عنوان یک استاندارد، نوعی یکدستی و مطابقت نوشته با کارکرد سیستم بازیابی اطلاعات و در نتیجه اطلاع‌رسانی صحیح‌تر را به همراه داشته باشد. تعیین اهمیت واژگان برای تعیین عبارتهایی که می‌توانند به عنوان عبارتهای کلیدی متن مورد استفاده قرار گیرند، به یک معیار برای مقایسه و نمره‌گذاری محتوای اطلاعاتی مقاله نیاز داریم. آنچه در مقاله حاضر برای اندازه‌گیری رتبه اهمیت یک کلمه مناسب تشخیص داده شده و پیشنهاد می‌شود تعداد رخداد کلمه، مجاورت مکانی این واژگان با یکدیگر و موقعیت مکانی آنها در مقاله نسبت به هم می‌باشد. دلیل استفاده از تعداد رخداد برای اندازه‌گیری رتبه اهمیت، بر این باور استوار است که نویسنده معمولا از واژگان معینی برای پیشبرد، بحث یا تشریح دقیق جنبه‌های مختلف موضوع موردنظر استفاده و آنها را تکرار می‌کند. به همین منظور، علاوه بر اینکه می‌توان حد بالایی[13] را برای رخداد واژگان در نظر گرفت، یک سیاهه بازدارنده که قابلیت افزایش و کاهش آن توسط کاربر وجود دارد، در سیستم گنجانده می‌شود که از این طریق اثر بعضی از واژگان را خنثی و آنها را نادیده گرفت. در نهایت، عبارتهای کلیدی از میان کلمات با رخداد بالایی که در کنار یکدیگر در سطح مقاله تکرار شده‌اند مشخص و با توجه به تکرارشان به هر کدام نمره‌ای اختصاص داده می‌شود و کاربر می‌تواند سیاهه این عبارتها همراه با نمره‌های آنها را مشاهده کند.

دریافت فایل ارجاع :
(پژوهیار, , , )

دانلود HTML
دانلود PDF

ورود / عضویت

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.

ورود

عضویت

تحتاج دخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر webmaster@noormags.com .

You need Sign in to view the content of the article. If you are not a member, proceed from part Sign up.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via webmaster@noormags.com .

لینک کوتاه:

1402

1401

1400

1399

1398

1397

1396

1395

1394

1393

1392

1391

1390

1389

1388

1387

1386

1385

1384

1383

1382

1381

1380

1379

1378

1377

1376

استخراج خودکار عبارت های کلیدی از متون مقاله های فارسی مقاله