چکیده:
در این مقاله یک سامانة بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدلهای آوایی با روشهای مستقل ازبافت و وابسته به بافت در این سامانه به کار رفته و نتایج به کارگیری آنها ارائه شده است . مدل زبانی سه کلمه ای نیز با روشهای مبتنی بر کلمه ، مبتنی بر مقولة نحوی و مبتنی بر طبقه ، با استفاده از پیکرة متنی زبان فارسی استخراج و در سامانة بازشناسی به کار گرفته شده است . همچنین مدل زبانی دستوری مبتنی بر دستور ساخت - گروهی تعمیم یافته در این سامانه پیادهسازی شده و نیز در ترکیب با مدل زبانی آماری به کار رفته است . نتایج حاصل نشان می دهد که مدل آوایی وابسته به بافت ، مطابق انتظار، بهترین عملکرد را دارد. همچنین مدل زبانی سه کلمه ای مبتنی بر کلمه ، نسبت به سایر روشهای استخراج مدل زبانی آماری برتری دارد. درضمن ترکیب مدل زبانی دستوری با مدل زبانی آماری منجر به بهبود نتایج بازشناسی می شود. سامانة بازشناسی گفتار معرفی شده در این مقاله ، اولین سامانة بازشناسی برای گفتار پیوستة فارسی بوده و با پشتوانة فعالیت های تحقیقاتی متعددی که برای پیادهسازی آن انجام شده است ، قابلیت استفاده به صورت کاربردی را یافته است .
In this paper، a continuous speech recognition system for the Persian language is introduced and the roles of acoustic and language models are examined. Context-independent and context-dependent acoustic models are used in the system and the results of their employment are presented. Moreover، word-based، POS-based and class-based triphone language models are extracted using Persian text corpus and incorporated in the speech recognition system. In addition، a grammatical language model based on GPSG is implemented in the system and is used in combination with the statistical language model. Experimental results demonstrated hat as expected، context-dependent phonetic models show the best performances. Also، the word-based triphone language model showed superiority over other statistical language models. Moreover، the combination of grammatical language models with statistical ones proved to lead to better recognition results. The system introduced in this paper is the first Persian speech recognition system capable of practical usage and is based on numerous research works performed for its design and implementation.
خلاصه ماشینی:
"به کارگیری اطلاعات زبانی در یک سیستم بازشناسی گفتار پیوستة فارسی محمد بحرانی دانشگاه صنعتی شریف ( آزمایشگاه پردازش گفتار) حسین صامتی دانشگاه صنعتی شریف ( آزمایشگاه پردازش گفتار) چکیده در این مقاله یک سامانة بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد.
مدل زبانی سه کلمه ای نیز با روشهای مبتنی بر کلمه ، مبتنی بر مقولة نحوی و مبتنی بر طبقه ، با استفاده از پیکرة متنی زبان فارسی استخراج و در سامانة بازشناسی به کار گرفته شده است .
در این مقاله موتور بازشناسی گفتار به صورت اجمالی معرفی می شود و بعضی پژوهش های انجام یافته برای به کارگیری مدل زبانی زبان فارسی شرح داده می شود.
٢. معرفی کلی سیستم بازشناسی گفتار موتور بازشناسی گفتار پیوستة فارسی ، مورد بحث در این مقاله ، حاصل به کارگیری آخرین روشهای شناخته شده برای پیادهسازی واحدهای مختلف یک سامانة بازشناسی گفتار و انطباق آن با اطلاعات واجشناسی و خواص دستوری و واژگانی زبان فارسی است .
به کارگیری مدل چندکلمه ای ، درحین جستجو به این صورت است که هنگامی که الگوریتم جستجو، فرضیه های مختلف را برای بازشناسی کلمات به پیش می برد، با شناسایی یک کلمة جدید، احتمال چندکلمه ای آنرا نیز، همراه با امتیاز آوایی آن ، در امتیاز فرضیه ضرب می کند.
"Building and Incorporating Language Models for Persian Continuous Speech Recognition Systems".
"A Large Vocabulary Continuous Speech Recognition System for Persian Language"."