چکیده:
در علوم رفتاری و اجتماعی برخورد با متغیرهای پنهان بسیار متداول است. یکی از بهترین روشها برای مدلبندی اینگونه متغیرها، مدل معادلات ساختاری است که از دو معادلهی اندازهگیری و ساختاری تشکیل یافته است و روابط بین متغیرهای پنهان با معادلهی ساختاری نشان داده میشوند. با وجود این، نظریهی ماکسیمم درستنمایی و نرمافزارهای کامپیوتری موجود نظیر لیزرل [8] و EQS [1] که در مطالعات روانشناسی و اجتماعی برای ارزیابی ارتباطات بین متغیرهای پنهان به کار میروند، بر اساس روابط خطی بین متغیرها و وجود دادههای کامل بنا نهاده شدهاند. وجود دادههای گمشده از یک طرف و از طرف دیگر وجود ارتباطات غیر خطی بین متغیرهای پنهان برای به دست آوردن مدلهای معنیدار از اهمیت بسیاری برخوردار است. لی و همکاران [10] الگوریتمی از نوع امیدگیری-ماکسیممسازی (EM) را معرفی کردند که برای براورد ماکسیمم درستنمایی پارامترهای معادلات ساختاری غیر خطی با دادههای بهطور تصادفی گمشده (MAR) به کار میرود. در این الگوریتم برای به دست آوردن انتگرالهای پیچیده در امید شرطی، گام E بهوسیلهی الگوریتم دورگهای کامل میشود که نمونهگیر گیبس [6] و الگوریتم متروپلیس-هستینگس را ترکیب میکند درحالیکه گام M بهطور کارایی بهوسیلهی ماکسیممسازی شرطی [15] کامل میگردد. در این مقاله قصد داریم تا با استفاده از یک مطالعهی شبیهسازی، کارایی این روش را زمانی که نرخ گمشدگی افزایش مییابد مورد بررسی قرار دهیم.
In behavioral and social sciences، it is very common to face latent variables. One of the best approaches to model these variables is using structural equation models which are constructed from a measurement equation and a structural equation. Relations between latent variables are taken into account by the structural equation. However، maximum likelihood theory and existing computer softwares such as LISREL (Joreskog and Sorbom، 1996، Scientific Software International: Hove and London) and EQS (Bentler، 1992، Los Angeles: BMDP Statistical Software) which are used in psychology and social studies to assess relations between variables، are based on a linear pattern and the assumption that complete data sets exist. On one side the presence of missing data and on the other side nonlinear relations between latent variables are very important to be considered to obtain significant models. Lee et al. (2003، J. Educat. Behav. Statist.، 28،
111-134) introduced an EM type algorithm which is used to obtain ML estimates of nonlinear structural equation models with missing at random data. In this algorithm to calculate complicated integrals in conditional expectation step، the E step is completed with a hybrid algorithm that combines Gibbs sampler (Geman and Geman، 1984، IEEE Trans. Pattern Anal. Machie Intell.، 6، 721-741) and Metropolis-Hastings algorithm، while the M step is efficiently completed with conditional maximization. In this paper we assess the efficiency of this method in a simulation study with high missing rate.
خلاصه ماشینی:
وجود دادههای گمشده از یک طرف و از طرف دیگر وجود ارتباطات غیرخطی بین متغیرهای پنهان برای به دست آوردن مدلهای معنیدار از اهمیت بسیاری برخوردار است.
لی و همکاران10الگوریتمی از نوع امیدگیری-ماکسیممسازی )ME( را معرفی کردند که برای براورد ماکسیمم درستنمایی پارامترهای معادلات ساختاری غیرخطی با دادههای بهطور تصادفی گمشده )RAM( به کار میرود.
لی و همکاران10الگوریتمی از نوع ME را معرفی کردند که برای براورد ماکسیمم درستنمایی پارامترهای معادلات ساختاری غیرخطی با دادههای بهطور تصادفی گمشده به کار میرود.
برای مدل معادلات ساختاری غیرخطی با دادههای گمشده،معرفیشده به واسطهی روابط غیرخطی بین متغیرهای پنهان و حضور دادههای گمشده،توزیع توأم دادههای مشاهدهشده پیچیده است.
در این مقاله ابتدا مدلهای معادلات ساختاری غیرخطی معرفی میشوند،سپس الگوریتم معرفیشده توسط لی و همکاران10ارائه میشود و در انتها کارایی این روش زمانی که تعداد دادههای گمشده افزایش مییابد با استفاده از یک مطالعهی شبیهسازی مورد بررسی قرار میگیرد.
(3)(به تصویر صفحه مراجعه شود) 3-تابع درستنمایی در تحلیل مدل فرض کنید sim,iy,sbo,iY-iy که sbo,iy مقادیر مشاهدهشده و sim,iy مقادیر گمشده هستند.
فرض کنید(به تصویر صفحه مراجعه شود)ماتریس متغیرهای پنهان در MESN باشد.
4-الگوریتم MECM برای MESN معرفی شده با دادههای گمشده،به واسطهی روابط غیرخطی بین متغیرهای پنهان و حضور دادههای گمشده،توزیع توأم دادههای کامل،پیچیده است.
1-4-اجرای گام E از طریق الگوریتم دورگه فرض کنید )Z,simY(h تابعی عمومی از simY و Z باشد که در(به تصویر صفحه مراجعه شود)وارد شده است.
)noissucsid htiw(partstooB eht dna,noitatupmi,atad gnissiM.
J. atad gnissim elbarongi htiw sledom noitauqe larutcurts raenilnon .
vaheB noitauqe larutcurts raenilnon fo sisylana lacitsitatS.