چکیده:
نخستین پیکرة نقش های معنایی زبان فارسـی کـه حـدود ٣٠.٠٠٠ جملـه از زبـان فارسـی معاصر را شامل میشود، به صورت دستی برچسب گذاری شده است . ایـن پیکـره بـر اسـاس مفهوم نقش های معنایی فیلمور، لایه ای از اطلاعات مربوط به رابطه محمـول ـ موضـوع را به ساخت نحوی پیکرة وابستگی اضافه میکند. در این مجموعه ، افعال ، اسم های گـزاره ای و صفت های گزاره ای به عنوان محمول های جمله در نظر گرفته شده و بنا بر نـوع رویدادشـان ، در جمله تعیین ظرفیت شده اند. خروجی این پیکره بر اساس الگوی همـایش زبـان شناسـی رایانه ای و پردازش زبان طبیعی (CoNLL) آماده شـده اسـت . نقـش هـای معنـایی مـورد استفاده در برچسب زنی معنایی شامل دو گروه برچسب های موضوعی و برچسب های نقشی هستند. برچسب های موضوعی ساخت ظرفیتی محمول های جمله را به دسـت مـیدهنـد و برچسب های نقشی، افزوده های توصیف گر فعـل یـا کـل جملـه را شـامل مـیشـوند. تعـداد نقش های معنایی ٢٧ مورد و تعداد موضوع های نقشی ١٥ مورد است . دو برچسب وجه نمـا و نفی هم به عنوان برچسب نقشی مورد استفاده قرار گرفته است .
خلاصه ماشینی:
"پروپ بنک ، پیکرة دادگان معنایی زبان انگلیسـی، بـا روش شناسـی مشخص در تعریف نقش های معنایی، لایه ای از اطلاعات مربوط به نقش هـای معنـایی را بـه پیکـرة دادگان نحوی پن تریبنک ١١ (مارکوس ١٢، ١٩٩٣) افزوده است .
لازم به توضیح است که پیکرة بزرگ نقش های معنایی زبان فارسی بر اساس این رویکرد نیز برچسب گذاری شده که بحث در خصوص شیوة تولید و آمار مربوط به آن در اثر دیگری بـه طـور مبسوط ارائه میشود.
برای مثال ، فاعل که در پیکرة دادگان نحوی زبان فارسی، فراوان ترین نقش نحوی مرتبط با فعل بوده است ، در پیکرة نقش هـای معنـایی زبـان فارسـی در ٤٣ درصـد از مـوارد به عنوان کنشگر، در ١٦ درصد موارد به عنوان کنش بر، در ٩ درصد به عنوان تجربـه گـر، در ٨ درصـد به عنوان کنش پذیر و در ٥ درصد از موارد به عنوان مکان دار برچسب خـورده اسـت .
در جدول (٦)، پربسامدترین روابط معنایی در میان تمامی برچسب های معنـایی اعـم از برچسـب هـای موضوعی، افزوده ها و نقش های کلامی ارائه شده است که برچسب قید با ٢٤/٧ درصد و فعل سـاز بـا ٢٢/٢ درصد به ترتیب بیشترین فراوانی را به خود اختصـاص داده انـد.
Proceedings of the 3rd International Conference on Language Resources and Evaluation (LREC-2002), pp.
Proceedings of the 3rd International Conference on Language Resources and Evaluation (LREC-2002), pp.
"Building a large annotated corpus of English: The Penn Treebank".
"The Penn Chinese TreeBank: Phrase structure annotation of a large corpus"."