خلاصة:
نمایه سازی ماشینی به گونه ای از نمایه سازی گفته می شود که در آن با
استفاده از الگوریتم رایانه ای، واژه های کلیدی یک مدرک از عنوان یا متن،
استخراج و سپس به شکل مدخل های نمایه مرتب و سازمان دهی می شوند . با
وجود نیاز روزافزون به کاربرد رایانه در نمایه سازی، تاکنون برای زبان فارسی،
نمایه ساز ماشینی ساخته نشده است . از این رو در این مقاله نتیجه بررسی و
شناخت جنبههای علمی و عملیاتی این سیستم نمایهسازی در پژوهشگاه علوم و
فناوری اطلاعات ایران ارائه می شود که بر پایه مأموریت و دانش سازمانی خود
یکی از آماده ترین بسترها را برای ساخت اینگونه نمایه ساز دارد. به این منظور،
ابتدا به پیوند میان نمایه سازی و بازیابی اطلاعات، مباحث نظری و سیر تحول
نمایه سازی ماشینی، نمایه سازی ماشینی از دیدگاه های عملیاتی و فرایندی،
پروژه های موفق نمایه سازی به زبان های گوناگون در دنیا پرداخته شده و
نیازمندیهای نمایه ساز ماشینی برای زبان فارسی توصیف شده است . سپس
اجزای یک نمایه ساز برای زبان فارسی تشریح و مدل مفهومی نمایه ساز ماشینی
و همچنین روابط میان اجزا، جزئیات زیرسیستم ها، و مدل مفهومی سیستم
طراحی شده اند. در پایان، نیازمندی های ساخت نمایه ساز ماشینی برای این
پژوهشگاه به بحث گذاشته شده است و وضعیت پروژه های انجام شده و
تجربه های موجود در این زمینه نیز تبیین شده اند.
Machine indexer is referred to as a kind of indexing
system in which keywords are extracted from the title or body of a
text and organized in the index entries using computer algorithm.
Althogh there is an increasing need for applying computer in indexing
machine indexer has not been developed for Persian language yet.
Therefore in this paper the results of investigating and identifying of
theoretical and practical aspects of such system in the Iranian
Research Institute for Information Science and Technology are
presented. To do so, firstly the relationship between indexing and
information retrieval, theoretical debates and the machine indexing
revolution, the practical and procedural viewpoints of machine
indexing, successful projects in different countries and for different
languages, and the requirements of machine indexer for Persian
language are discussed. Then the elements of a machine indexer for
Persian language are defined and its conceptual model and also the
relationships between the elements, the details of subsystems, and the
indexer logical system are designed. Finally, the requirments of
developing the system for the Iranian Research Institute for Information Science and Technology are discussed and the state of the art of the
implemented projects and existing experiences in this regard are defined.
ملخص الجهاز:
نمايه ساز ماشيني منابع فارسي : مدلي يکپارچه براي پژوهشگاه علوم 1 و فناوري اطلاعات ايران عمار جلالي منش * کارشناس ارشد مهندسي صنايع ؛ عضو هيئت علمي پژوهشگاه علوم و فناوري اطلاعات ايران ؛ تهران سيروس عليدوستي ٢ دکتري مديريت ؛ استاديار پژوهشگاه علوم و فناوري اطلاعات ايران ؛ تهران محمود خسروجردي ٣ کارشناس ارشد علم اطلاعات و دانش شناسي ؛ عضو استعدادهاي درخشان ، باشگاه پژوهشگران جوان و نخبگان دانشگاه آزاد اسلامي ، واحد تهران مرکزي ؛تهران دريافت : ١٣٩١/٠٥/٢٥ پذيرش : ١٣٩١/١٠/١١ نمايه سازي ماشيني به گونه اي از نمايه سازي گفته مي شود که در آن با استفاده از الگوريتم رايانه اي ، واژه هاي کليدي يـک مـدرک از عنـوان يـا مـتن ، استخراج و سپس به شکل مدخل هاي نمايه مرتب و سـازمان دهـي مـي شـوند.
براي ساخت نمايه ساز ماشيني براي زبـان فارسـي بـه عنـوان يـک سيسـتم نـرم افـراري پيچيده ، بايد يک مدل مفهومي جامع با روش شناسي درخور، طراحي و سيستم بـر پايـه آن در طول زمان ساخته شود.
اين مقاله گزارش پژوهشي را ارائه مي کند که براي طراحي مـدل مفهـومي سيستم نمايه ساز ماشيني منابع فارسي انجام شده است .
در اين پژوهش ، پژوهشـگاه علـوم و فناوري اطلاعات ايران به عنوان سازماني که هم از نظـر مأموريـت و هـم از نظـر پيشـينه در زمينه نمايه سازي منابع فارسي يکي از آماده ترين بسترها را براي ساخت اين گونه نمايـه سـاز دارد، برگزيده و جنبه هاي اجرايي و عملياتي سيستم بر پايه وضعيت آن طراحي شده است .