چکیده:
ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ، ﺑﺮ اﺳﺎس ﺻﺪای ﮔﻮﯾﻨﺪه، ﺑﻪ ﻣﺴﺌﻠﻪی ﺗﻌﯿﯿﻦ اﯾﻨﮑﻪ ﺟﻨﺴﯿﺖ ﮔﻮﯾﻨﺪهی ﯾﮏ ﻗﻄﻌﻪ ﮔﻔﺘﺎری ﻣﺬﮐﺮ و ﯾﺎ ﻣﻮﻧﺚ اﺳﺖ ﻣﯽﭘﺮدازد. ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ ﮔﻮﯾﻨﺪه ﮔﺎﻣﯽ ﻣﻬﻢ در ﺳﯿﺴﺘﻢﻫﺎی ﺑﺎزﺷﻨﺎﺳﯽ ﮔﻮﯾﻨﺪه و ﮔﻔﺘﺎر اﺳﺖ. در ﻫﺮ دوی اﯾﻦ ﺳﯿﺴﺘﻢﻫﺎ ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ، ﻣﯽﺗﻮاﻧﺪ ﻣﺴﺌﻠﻪ را از ﯾﮏ ﻣﺴﺘﻘﻞ از ﺟﻨﺴﯿﺖ ﺑﻪ ﯾﮏ ﻣﺴﺌﻠﻪ واﺑﺴﺘﻪ ﺑﻪ ﺟﻨﺴﯿﺖ ﺗﺒﺪﯾﻞ ﮐﻨﺪ و ﺑﻪ اﯾﻦ ﺗﺮﺗﯿﺐ، اﻧﺪازه و ﭘﯿﭽﯿﺪﮔﯽ ﻣﺴﺌﻠﻪ ﮐﺎﻫﺶ ﭘﯿﺪا ﻣﯽﮐﻨﺪ. در اﯾﻦ ﻧﻮﺷﺘﺎر ﺑﻪ ﻣﻌﺮﻓﯽ روﺷﯽ ﺑﺮ ﻣﺒﻨﺎی اﺑﺮﺑﺮدارﻫﺎ ﺑﺮای ﺗﺸﺨﯿﺺ ﺟﻨﺴﯿﺖ ﮔﻮﯾﻨﺪه ﻣﯽﭘﺮدازﯾﻢ. در اﺑﺘﺪا ﺑﺎ اﺳﺘﻔﺎده از وﯾﮋﮔﯽﻫﺎی اﺳﺘﺨﺮاج ﺷﺪه ﻣﺪلﻫﺎی ﻣﺨﻠﻮط ﮔﺎوﺳﯽ را آﻣﻮزش ﻣﯽدﻫﯿﻢ و ﺳﭙﺲ ﺑﺎ اﺳﺘﻔﺎده از ﻣﯿﺎﻧﮕﯿﻦ اﯾﻦ ﻣﻮﻟﻔﻪﻫﺎی ﮔﺎوﺳﯽ اﻗﺪام ﺑﻪ اﯾﺠﺎد اﺑﺮﺑﺮدارﻫﺎ ﻣﯽﮐﻨﯿﻢ و در ﻧﻬﺎﯾﺖ ﺑﺎ اﺳﺘﻔﺎده از دﺳﺘﻪﺑﻨﺪی ﮐﻨﻨﺪهی ﻣﺎﺷﯿﻦ ﺑﺮدار ﭘﺸﺘﯿﺒﺎن دﺳﺘﻪﺑﻨﺪی را اﻧﺠﺎم ﻣﯽدﻫﯿﻢ. در اﯾﻦ ﺗﺤﻘﯿﻖ ﺗﺎﺛﯿﺮ ﺣﺠﻢ دادهی آﻣﻮزﺷﯽ و ﺗﺴﺖ، ﻧﻮع وﯾﮋﮔﯽ ﺑﮑﺎر رﻓﺘﻪ، ﻣﯿﺰان ﮐﺎﻫﺶ ﺑﻌﺪ اﺑﺮﺑﺮدارﻫﺎ، ﻧﻮع ﮐﺮﻧﻞ SVM و ﻣﻮاردی از اﯾﻦ ﻗﺒﯿﻞ ﻣﻮرد ﺑﺮرﺳﯽ ﻗﺮار ﮔﺮﻓﺘﻪ اﺳﺖ و در ﺑﻬﺘﺮﯾﻦ ﺷﺮاﯾﻂ ﺑﺮ روی دادﮔﺎن ﻓﺎرﺳﺪات ﻣﯿﮑﺮوﻓﻨﯽ، ﺑﻪ راﻧﺪﻣﺎن 94% دﺳﺖ ﯾﺎﻓﺘﻪ اﯾﻢ.
خلاصه ماشینی:
در روش ارائه شده توسط آنها فاز آنالیز آکوستیکی با ایجاد دو مدل مخلوط گاوسی برای هر یک از جنسیتها ساخته میشود و همچنین علاوه بر آن مقدار فرکانس گام نیز محاسبه میشود و با استفاده از تعیین یک سطح آستانه جنسیت گوینده تخمین زده میشود.
مراحل انجام این پروژه را میتوان اینگونه بیان کرد که برای هر جنسیت (مرد و زن) از گفتار مربوط به آن جنسیت، پس از فریمبندی اقدام به استخراج ویژگی میکنیم و سپس با استفاده از این ویژگیها اقدام به ساخت یک مدل مخلوط گاوسی میشود که در نهایت تعدادی مولفه گاوسی خواهیم داشت که هر یک شامل بردار میانگین، کواریانس و وزن مربوطه خواهد بود.
در مرحلهی بعد با استفاده از دیگر دادههای آموزشی و همچنین مدل جهانی ایجاد شده در مرحلهی قبل، این مدل جهانی را برای هر یک از دادههای آموزشی با استفاده از ویژگیهای آنها تطبیق میدهیم سپس با ترکیب بردارهای میانگین مدلهای ایجاد شده اقدام به ساخت ابر بردارها میکنیم و در نهایت با استفاده از روش دستهبندی ماشین بردار پشتیبان عمل مدلسازی و دستهبندی را انجام میدهیم.
Huang, “Speaker and gender normalization for continuous-density hidden Markov models”, IEEE international conference on acoustics speech and signal processing, vol.
Sturim, “Support vector machines using GMM supervectors for speaker verification”, IEEE Signal Processing Letters, vol.
A. Reynolds, “Support vector machines using GMM supervectors for speaker verification”, IEEE Signal Processing Letters, vol.