چکیده:
مشخصههای ریتم گفتار بر اساس دیرش مناطق همخوانی، واکهای و نیز هجا میتوانند گویشوران یک زبان خاص را از هم تمیز دهند. با وجود این، ریتم یک سیگنال آوایی تنها بر مبنای روابط دیرشی میان مناطق آوایی آن استوار نیست بلکه به تفاوتهای مربوط به الگوی شدت در آنها نیز بستگی دارد. پارامتر آکوستیکی شدت تا حد زیادی تحتتأثیر الگوهای حرکتی اندامهای گفتار مانند حرکت لبها و بازوبستهکردن دهان است. بنابراین انتظار میرود تفاوتهای فردی در حرکتهای اندامهای گویایی و نیز تفاوتهای آناتومیکِ مربوط به ساختار دستگاه آوایی افراد منجر به تغییر توزیع انرژی در سطح سیگنال و در نتیجه تغییر مقادیر شدت در سیگنالهای آوایی افراد شود. در پژوهش حاضر قصد داریم با استفاده از ابزارهای آواشناسی آزمایشگاهی و با رویکرد تشخیص هویت گوینده پارامترهای اکوستیکی ریتم گفتار را بر مبنای مشخصههای شدت-بنیاد در زبان فارسی بررسی کنیم. هدف این پژوهش بررسی توانایی پارامترهای شدت-بنیاد در سطح هجا جهت تشخیص هویت گویندگان فارسیزبان است. دو دسته از پارامترهای شدت-بنیاد یکی بر مبنای میانگین شدت هجا (stdevM, varcoM, rPVIm, rPVIm) و دیگری بر مبنای شدت قلهی هجا (stdevP, varcoP, rPVIp, nPVIp) برای بررسی و تحلیل دادهها انتخاب شد. صدای دوازده گویشور مرد فارسیزبان در محیط آزمایشگاهی و در دو نوبت مجزا به فاصلهی یک تا دو هفته ضبط شد. نمونههای آوایی با استفاده از برنامهی PRAAT ویرایش 34، 2، 5 مورد تجزیه و تحلیل آکوستیکی قرار گرفت و تحلیل آماری دادهها و مقادیر به دستآمده از بررسی آکوستیکی نمونههای آوایی با استفاده از نرمافزار SPSS ویرایش 0/21 و نرم افزار R ویرایش 3. 3. 3 صورت گرفت. نتایج نشان داد پارامترهای آکوستیکی ریتم گفتار بر مبنای نوسانات شدت نقش بسزایی در تشخیص هویت گویندگان فارسیزبان دارند. افزون بر آن، مشخصههای زبان-ویژه تأثیری در توانایی این پارامترها در تشخیص هویت گوینده ندارند. همچنین نتایج حاکی از آن بود که پارامترهای مبتنی بر شدت قلهی هجا ویژگیهای فردویژهی بیشتری را انعکاس میدهند.
Rhythmic characteristics of speech based on consonantal and vocalic intervals as well as syllabic intervals vary between speakers of the same language. Nonetheless, the rhythmicity of a speech signal is not solely dependent on the durational variability of phonetic intervals but it is also associated with the variability of the intensity patterns as well. Acoustic parameter of intensity is largely determined by the articulatory behaviors of the speech organs such as lip movement or mouth aperture. Therefore, it is plausible that speaker idiosyncrasy in movement of speech articulators and anatomical differences in individual’s vocal tracts may influence the energy distribution across a speech signal which subsequently leads to the variability in the values of the intensity measures. Using experimental phonetics tools and from an explicitly speaker-specific perspective, the present research attempts to explore potential speaker-specific acoustic parameters of speech rhythm which are extracted from the intensity contours across Persian speakers. This research aims to discover whether intensity-based measures of speech rhythm are able to discriminate between speakers in Persian. Two types of acoustic rhythmic measures based on the mean syllable intensity (stdevM, varcoM, rPVIm, nPVIm) and peak syllable intensity (stdevP, varcoP, rPVIp, nPVIp)) was selected for this study. Speech data from 12 Persian male speakers were recorded non-contemporaneously in laboratory environment on two different occasions separated by one to two weeks. Speech tokens were acoustically measured with PRAAT version 5.2.34 and statistical analyses were carried out with SPSS version 21 and R version 3.3.3. Results of the study indicated that speech rhythm measures based on intensity fluctuations plays an important role in between-speaker rhythmic variability. In addition, discriminatory power of intensity-based measures is not affected by the language-dependent characteristics of Persian. The results also showed that the peak syllable intensity measures carry more speaker-specific information compared to the mean syllable intensity measures.
خلاصه ماشینی:
در پژوهش حاضر قصد داريم با استفاده از ابزارهاي آواشناسي آزمايشگاهي و با رويکرد تشخيص هويت گوينده پارامترهاي اکوستيکي ريتم گفتار را بر مبناي مشخصه هاي شدت-بنياد در زبان فارسي بررسي کنيم .
peak syllable intensity ٢) کدام پارامتر شدت-بنياد بهتر ميتواند تغييرات بين -گوينده را در زبان فارسي توضيح دهد؟ ٣) اطلاعات فرد ويژه در پارامترهاي شدت-بنياد در چه سطوحي از هجا بهتر توزيع شده است ؟ با توجه به اين که پارامترهاي شدت-بنياد ريتم گفتار تحت تأثير الگوهاي واجآرايي و ساختار هجايي يک زبان هستند بنابراين تحليل و بررسي اين مشخصه ها در زبانهاي مختلف ميتواند به درک بهتر ماهيت اين پارامترها کمک کند و نيز اين مسئله را روشن سازد که آيا اين پارامترها ميتوانند فارغ از تأثير عوامل زبان-ويژه به عنوان پارامترهاي زبان-آزاد و جهاني در تشخيص هويت گوينده کاربرد داشته باشند يا خير.
شواهد به دست آمده از اين پژوهش نشان داد که با وجود حضور دو عامل به عنوان منابع تغييرات درون-گوينده يعني سبک گفتار و نيز کانال ارتباطي، گويندگان به لحاظ مشخصه هاي زبرزنجيري زماني با هم تفاوت معنيدار داشته اند.
در اين پژوهش مقادير به دست آمده از پارامترهاي شدت- بنياد ريتم گفتار با استفاده از دو برنامۀ اندازهگيري خودکار Intensity Variability و Intensity Analyzer نوشتۀ لي هي اندازهگيري شده است .
International Journal of Speech, Language and the Law, 25(2), 151-174.
International Journal of Speech, Language and the Law. Vol 23, 243-273.
Speech rhythm analysis withdecomposition of the amplitude envelope: Characterizing rhythmic patterns within and across languages.