چکیده:
فهم معنای زبانِ انسان برای ماشین همواره با چالشهایی رو به رو است. استعاره نیز یکی از موضوعهای دشوار در پردازش معنایی است. درک استعاره در ارتقا و توسعة فعالیتهای حوزة پردازش زبان طبیعی اهمیت فراوانی دارد. مقالة حاضر به معرفی روشی برای شناسایی استعارهها در زبان فارسی میپردازد. هدف این مقاله، پیشنهادِ شیوهنامهای است که به کمک آن بتوان پیکرهای برای استعارههای فارسی تدوین کرد. برای انجام چنین کاری نیاز است که ملاکهایی برای شناسایی و برچسبگذاری استعاره معرفی شود. روال شناسایی استعارهی دانشگاه آزاد آمستردام (ام.آی.پی.وی.یو) میتواند انواع استعاره را شناسایی کند و در ساخت پیکرة استعاره نیز از آن میتوان بهره برد. مبنای مقالة حاضر نیز همین روال شناسایی است. بهرهگیری از این روال از دو جهت مفید است: نخست، به کمک این روال میتوان پیکرهای از استعارههای فارسی تهیه کرد، دوم، به پژوهشگران حوزة استعاره، به ویژه زبانشناسان پیکرهای، کمک میکند که با روایی و پایایی مطلوبی استعارههای فارسی را تحلیل کنند. لازم به گفتن است که برای آزمودن کارآیی روال پیشنهادی، پیکرهای از دادههای فارسی (متون خبری و دانشگاهی) گردآوری و توسط سه کارشناس برچسبگذاری شده و یافتههای مطلوبی (ضریب کاپای ۰.۹۶۴) به دست آمدهاست که در پژوهشی جداگانه به آن خواهیم پرداخت.
Due to the development of smart devices, the ability of computers to understand human language has become a key issue in technology. By learning and analyzing machine-readable, annotated linguistic data, computers are able to comprehend human language (corpus). Corpora plays a crucial role in helping computers comprehend human language. Metaphor is one of the most complicated linguistic data that computers cannot comprehend. Despite the prevalence of metaphor in everyday language use and the importance of identifying it, no corpus has been published for Persian yet. Compiling a corpus of Persian metaphors is the initial step in learning metaphors for computers.To compile a corpus of Persian metaphors, it is necessary to meet two main criteria. Deciding the best definition is the first prerequisite. The best definition is both comprehensive and applicable; comprehensive in the sense that it covers a significant proportion of metaphorical instances, and applicable in the sense that it could be used to build a corpus. The second requirement is the construction of a method for metaphor identification. Without a straightforward data annotation method, it is impossible to identify metaphors.