به کارگیری اطلاعات زبانی در یک سیستم بازشناسی گفتار پیوسته ی فارسی مقاله

زبان و زبان شناسی بهار و تابستان 1389 - شماره 11 رتبه علمی-پژوهشی (وزارت علوم (‎26 صفحه - از 87 تا 112 )

کلیدواژه ها: بازشناسی گفتار پیوسته مدلسازی آوایی مدلسازی زبانی مدل زبانی آمـاری مـدل زبـانی دستوری continuous speech recognition acoustic modeling language modeling statistical language model grammatical language model بازشناسی گفتار واج مدل فارسی مدل‌سازی زبان فارسی

fa en

چکیده:

در این مقاله یک سامانة بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدلهای آوایی با روشهای مستقل ازبافت و وابسته به بافت در این سامانه به کار رفته و نتایج به کارگیری آنها ارائه شده است . مدل زبانی سه کلمه ای نیز با روشهای مبتنی بر کلمه ، مبتنی بر مقولة نحوی و مبتنی بر طبقه ، با استفاده از پیکرة متنی زبان فارسی استخراج و در سامانة بازشناسی به کار گرفته شده است . همچنین مدل زبانی دستوری مبتنی بر دستور ساخت - گروهی تعمیم یافته در این سامانه پیادهسازی شده و نیز در ترکیب با مدل زبانی آماری به کار رفته است . نتایج حاصل نشان می دهد که مدل آوایی وابسته به بافت ، مطابق انتظار، بهترین عملکرد را دارد. همچنین مدل زبانی سه کلمه ای مبتنی بر کلمه ، نسبت به سایر روشهای استخراج مدل زبانی آماری برتری دارد. درضمن ترکیب مدل زبانی دستوری با مدل زبانی آماری منجر به بهبود نتایج بازشناسی می شود. سامانة بازشناسی گفتار معرفی شده در این مقاله ، اولین سامانة بازشناسی برای گفتار پیوستة فارسی بوده و با پشتوانة فعالیت های تحقیقاتی متعددی که برای پیادهسازی آن انجام شده است ، قابلیت استفاده به صورت کاربردی را یافته است .

خلاصه ماشینی:

"به کارگیری اطلاعات زبانی در یک سیستم بازشناسی گفتار پیوستة فارسی محمد بحرانی دانشگاه صنعتی شریف ( آزمایشگاه پردازش گفتار) حسین صامتی دانشگاه صنعتی شریف ( آزمایشگاه پردازش گفتار) چکیده در این مقاله یک سامانة بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدل زبانی سه کلمه ای نیز با روشهای مبتنی بر کلمه ، مبتنی بر مقولة نحوی و مبتنی بر طبقه ، با استفاده از پیکرة متنی زبان فارسی استخراج و در سامانة بازشناسی به کار گرفته شده است . در این مقاله موتور بازشناسی گفتار به صورت اجمالی معرفی می شود و بعضی پژوهش های انجام یافته برای به کارگیری مدل زبانی زبان فارسی شرح داده می شود. ٢. معرفی کلی سیستم بازشناسی گفتار موتور بازشناسی گفتار پیوستة فارسی ، مورد بحث در این مقاله ، حاصل به کارگیری آخرین روشهای شناخته شده برای پیادهسازی واحدهای مختلف یک سامانة بازشناسی گفتار و انطباق آن با اطلاعات واجشناسی و خواص دستوری و واژگانی زبان فارسی است . به کارگیری مدل چندکلمه ای ، درحین جستجو به این صورت است که هنگامی که الگوریتم جستجو، فرضیه های مختلف را برای بازشناسی کلمات به پیش می برد، با شناسایی یک کلمة جدید، احتمال چندکلمه ای آنرا نیز، همراه با امتیاز آوایی آن ، در امتیاز فرضیه ضرب می کند. "Building and Incorporating Language Models for Persian Continuous Speech Recognition Systems". "A Large Vocabulary Continuous Speech Recognition System for Persian Language"."

دریافت فایل ارجاع :
(پژوهیار, , , )

دانلود HTML
دانلود PDF

ورود / عضویت

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.

ورود

عضویت

تحتاج دخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر webmaster@noormags.com .

You need Sign in to view the content of the article. If you are not a member, proceed from part Sign up.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via webmaster@noormags.com .

لینک کوتاه:

1401

1400

1399

1398

1397

1396

1395

1394

1393

1392

1391

1390

1389

1388

1387

1386

1385

1384

به کارگیری اطلاعات زبانی در یک سیستم بازشناسی گفتار پیوسته ی فارسی مقاله