Skip to main content
فهرست مقالات

طراحی و ضبط پایگاه‌دادگان گفتاری برای سیستم‌های تبدیل متن به گفتار فارسی

نویسنده:

علمی-پژوهشی (وزارت علوم)/ISC (16 صفحه - از 69 تا 84)

مقاله حاضر به ارائه روشی برای طراحی و ساخت پایگاه دادگانی مختص سیستم های تبدیل متن به گفتار با در نظر گرفتن ساخت نوایی فارسی می پردازد. این مجموعه به لحاظ آوایی و نوایی غنی و مشتمل بر 2826 نمونه جمله فارسی است. این نمونه جملات در شرایط استودیو و با تک صدای گوینده خانم که به صورت حرفه ای در زمینه صدا فعالیت می کند ضبط شده است. پوشش حالت های مختلف نوایی در کنار پوشش حالت های مختلف آوایی از نقاط قوت این پایگاه است که برای نخستین بار در سیستم های تبدیل متن به گفتار فارسی لحاظ می شود. این مجموعه در کنار فایل های صوتی، دارای برچسب های متن و صورت آوایی است که به صورت دستی اصلاح شده اند. در نهایت، با بکارگیری مجموعه دادگان مذکور و با استفاده از روش بازسازی گفتار آماری ـ پارامتری ساخت صدا انجام گرفت. آزمودنی ها کیفیت صدای ساخته شده را با استفاده از معیار میانگین امتیازات نظردهی (MOS) 4.3 ارزیابی کردند.


برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.