ارائه و پیاده‌سازی یک سیستم تشخیص جنسیت گوینده مبتنی بر به‌کارگیری اطلاعات طیفی و نوایی گفتار با استفاده از ابر بردارها مقاله

نویسنده: نفری افشاری، مریم ؛ ادبی تبار، محمد ؛

پژوهش در علوم، مهندسی و فناوری تابستان 1397 - شماره 11 (‎13 صفحه - از 17 تا 29 )

کلیدواژه ها: ماشین بردار پشتیبان تشخیص جنسیت گوینده مدل های مخلوط گاوسی ابربردار

چکیده:

ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ، ﺑﺮ اﺳﺎس ﺻﺪای ﮔﻮﯾﻨﺪه، ﺑﻪ ﻣﺴﺌﻠﻪی ﺗﻌﯿﯿﻦ اﯾﻨﮑﻪ ﺟﻨﺴﯿﺖ ﮔﻮﯾﻨﺪهی ﯾﮏ ﻗﻄﻌﻪ ﮔﻔﺘﺎری ﻣﺬﮐﺮ و ﯾﺎ ﻣﻮﻧﺚ اﺳﺖ ﻣﯽﭘﺮدازد. ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ ﮔﻮﯾﻨﺪه ﮔﺎﻣﯽ ﻣﻬﻢ در ﺳﯿﺴﺘﻢﻫﺎی ﺑﺎزﺷﻨﺎﺳﯽ ﮔﻮﯾﻨﺪه و ﮔﻔﺘﺎر اﺳﺖ. در ﻫﺮ دوی اﯾﻦ ﺳﯿﺴﺘﻢﻫﺎ ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ، ﻣﯽﺗﻮاﻧﺪ ﻣﺴﺌﻠﻪ را از ﯾﮏ ﻣﺴﺘﻘﻞ از ﺟﻨﺴﯿﺖ ﺑﻪ ﯾﮏ ﻣﺴﺌﻠﻪ واﺑﺴﺘﻪ ﺑﻪ ﺟﻨﺴﯿﺖ ﺗﺒﺪﯾﻞ ﮐﻨﺪ و ﺑﻪ اﯾﻦ ﺗﺮﺗﯿﺐ، اﻧﺪازه و ﭘﯿﭽﯿﺪﮔﯽ ﻣﺴﺌﻠﻪ ﮐﺎﻫﺶ ﭘﯿﺪا ﻣﯽﮐﻨﺪ. در اﯾﻦ ﻧﻮﺷﺘﺎر ﺑﻪ ﻣﻌﺮﻓﯽ روﺷﯽ ﺑﺮ ﻣﺒﻨﺎی اﺑﺮﺑﺮدارﻫﺎ ﺑﺮای ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ ﮔﻮﯾﻨﺪه ﻣﯽﭘﺮدازﯾﻢ. در اﺑﺘﺪا ﺑﺎ اﺳﺘﻔﺎده از وﯾﮋﮔﯽﻫﺎی اﺳﺘﺨﺮاج ﺷﺪه ﻣﺪلﻫﺎی ﻣﺨﻠﻮط ﮔﺎوﺳﯽ را آﻣﻮزش ﻣﯽدﻫﯿﻢ و ﺳﭙﺲ ﺑﺎ اﺳﺘﻔﺎده از ﻣﯿﺎﻧﮕﯿﻦ اﯾﻦ ﻣﻮﻟﻔﻪﻫﺎی ﮔﺎوﺳﯽ اﻗﺪام ﺑﻪ اﯾﺠﺎد اﺑﺮﺑﺮدارﻫﺎ ﻣﯽﮐﻨﯿﻢ و در ﻧﻬﺎﯾﺖ ﺑﺎ اﺳﺘﻔﺎده از دﺳﺘﻪﺑﻨﺪی ﮐﻨﻨﺪهی ﻣﺎﺷﯿﻦ ﺑﺮدار ﭘﺸﺘﯿﺒﺎن دﺳﺘﻪﺑﻨﺪی را اﻧﺠﺎم ﻣﯽدﻫﯿﻢ. در اﯾﻦ ﺗﺤﻘﯿﻖ ﺗﺎﺛﯿﺮ ﺣﺠﻢ دادهی آﻣﻮزﺷﯽ و ﺗﺴﺖ، ﻧﻮع وﯾﮋﮔﯽ ﺑﮑﺎر رﻓﺘﻪ، ﻣﯿﺰان ﮐﺎﻫﺶ ﺑﻌﺪ اﺑﺮﺑﺮدارﻫﺎ، ﻧﻮع ﮐﺮﻧﻞ SVM و ﻣﻮاردی از اﯾﻦ ﻗﺒﯿﻞ ﻣﻮرد ﺑﺮرﺳﯽ ﻗﺮار ﮔﺮﻓﺘﻪ اﺳﺖ و در ﺑﻬﺘﺮﯾﻦ ﺷﺮاﯾﻂ ﺑﺮ روی دادﮔﺎن ﻓﺎرﺳﺪات ﻣﯿﮑﺮوﻓﻨﯽ، ﺑﻪ راﻧﺪﻣﺎن 94% دﺳﺖ ﯾﺎﻓﺘﻪ اﯾﻢ.

خلاصه ماشینی:

در روش ارائه شده توسط آنها فاز آنالیز آکوستیکی با ایجاد دو مدل مخلوط گاوسی برای هر یک از جنسیت‌ها ساخته می‌شود و همچنین علاوه بر آن مقدار فرکانس گام نیز محاسبه می‌شود و با استفاده از تعیین یک سطح آستانه جنسیت گوینده تخمین زده می‌شود. مراحل انجام این پروژه را می‌توان اینگونه بیان کرد که برای هر جنسیت (مرد و زن) از گفتار مربوط به آن جنسیت، پس از فریم‌بندی اقدام به استخراج ویژگی می‌کنیم و سپس با استفاده از این ویژگی‌ها اقدام به ساخت یک مدل مخلوط گاوسی میشود که در نهایت تعدادی مولفه گاوسی خواهیم داشت که هر یک شامل بردار میانگین، کواریانس و وزن مربوطه خواهد بود. در مرحله‌ی بعد با استفاده از دیگر داده‌های آموزشی و همچنین مدل جهانی ایجاد شده در مرحله‌ی قبل، این مدل جهانی را برای هر یک از داده‌های آموزشی با استفاده از ویژگی‌های آنها تطبیق می‌دهیم سپس با ترکیب بردارهای میانگین مدل‌های ایجاد شده اقدام به ساخت ابر بردارها می‌کنیم و در نهایت با استفاده از روش دسته‌بندی ماشین بردار پشتیبان عمل مدل‌سازی و دسته‌بندی را انجام می‌دهیم. Huang, “Speaker and gender normalization for continuous-density hidden Markov models”, IEEE international conference on acoustics speech and signal processing, vol. Sturim, “Support vector machines using GMM supervectors for speaker verification”, IEEE Signal Processing Letters, vol. A. Reynolds, “Support vector machines using GMM supervectors for speaker verification”, IEEE Signal Processing Letters, vol.

دریافت فایل ارجاع :
(پژوهیار, , , )

دانلود HTML
دانلود PDF

ورود / عضویت

برای مشاهده محتوای مقاله لازم است وارد پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.

ورود

عضویت

تحتاج دخول لعرض محتوى المقالة. إذا لم تكن عضوًا ، فتابع من الجزء الاشتراک.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر webmaster@noormags.com .

You need Sign in to view the content of the article. If you are not a member, proceed from part Sign up.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via webmaster@noormags.com .

لینک کوتاه:

1402

1401

1400

1399

1398

1397

1396

1395

1394

ارائه و پیاده‌سازی یک سیستم تشخیص جنسیت گوینده مبتنی بر به‌کارگیری اطلاعات طیفی و نوایی گفتار با استفاده از ابر بردارها مقاله