چکیده:
در طول 2۵ سال گذشته پیشرفت های روش شناسانه ای در زمینه ی تیمار داده های گم شده صورت گرفته است. بیش تر مطالعه های انتشاریافته روی داده های گم شده در متغیرهای وابسته تحت شرایط گوناگون تمرکز داشته اند. مطالعه ی حاضر در پی آن است که این خلا را با مقایسه ی دو رهیافت برای برخورد با داده های گم شده در متغیرهای کمکی رسته ای در رگرسیون لوژستیک پر کند: روش امید ریاضی- ماکسیمم سازی (EM) وزن ها و جانهی چندگانه (MI). داده های نمونه به صورت تصادفی از جامعه ای با مشخصه های معلوم انتخاب شده اند. داده های گم شده ی مربوط به متغیرهای کمکی تحت دو حالت شبیه سازی شده اند: گم شده ی کاملا تصادفی و گم شده ی تصادفی با نرخ های گم شدگی متفاوت. یک مدل رگرسیونی لوژستیک با استفاده از یکی از دو رهیافت EM یا MI بر هر نمونه برازش داده شده است. عملکرد این دو رهیافت با چهار معیار مورد مقایسه قرار گرفته است. اریبی، کارایی، پوشش و نرخ عدم پذیرش. نتیجه ها به طور کلی MI را بر EM ترجیح می دادند. مسائل عملی از جمله اجرا، گنجاندن متغیرهای کمکی پیوسته و اثر متقابل بین متغیرهای کمکی مورد بحث قرار گرفته اند.
For the past 25 years، methodological advances have been made in missing data treatment. Most published work has focused on missing data in dependent variables under various conditions. The present study seeks of fill the void by comparing two approaches for handling missing data in categorical covariates in logistic regression: the expectation-maximization (EM) method of weights and multiple imputations (MI). Sample data are drawn randomly from a population with known characteristics. Missing data on covariates are simulated under two conditions: missing completely at random and missing at random with different missing rates. A logistic regression model was fit to each sample using either the EM or MI approach. The performance of these two approaches is compared on four criteria: bias، efficiency، coverage، and rejection rate. Results generally favored MI over EM. Practical issues such as implementation، inclusion of continuous covariates، and interactions between covariates are discussed.
خلاصه ماشینی:
مطالعهی حاضر در پی آن است که این خلا را با مقایسهی دو رهیافت برای برخورد با دادههای گمشده در متغیرهای کمکی رستهای در رگرسیون لوژستیک پر کند:روش امید ریاضی-ماکسیممسازی )ME( وزنها و جانهی چندگانه )IM( .
بهطور خاص این دو رهیافت برای برخورد با دادههای گمشده در متغیرهای کمکی رستهای در رگرسیون لوژستیک مورد مقایسه قرار گرفتهاند.
یک مدل رگرسیونی لوژستیک با استفاده از یکی از دو رهیافت ME یا IM برای برخورد با دادههای گمشده در متغیرهای کمکی بر هر نمونه برازش داده شده است.
یافتههای حاصل از این مطالعهی شبیهسازی میتواند کار هورتون و لرد[9]را در جهت استفاده از رهیافت IM علاوهبر روش وزنی ME برای تیمار متغیرهای کمکی رستهای گمشده در رگرسیون لوژستیک بسط دهد.
در مرحلهی چهارم،همان مدل رگرسیون لوژستیک برازش داده شده به جامعه برای هر نمونه به کار رفته است؛ضریبهای رگرسیونی و خطاهای استاندارد آنها با استفاده از یکی از دو رهیافت ME یا IM برای تیمار دادههای گمشده در نمونه،براورد شدهاند و در مرحلهی پنجم،نتیجهها برای 1000 نمونهی شبیهسازیشده تحت هر حالت گرداوری شده است.
3- IM از نظر نرخ عدم پذیرش تحت هر دو مکانیزم RAM و RACM برای هر دو اندازهی نمونه به صورت سازگار بهتر از ME عمل کرده است.
ezis elpmas llams htiw atad etairavitlum rof noitatupmi elpitlum fo ecnamrofrep eht nO .
hcraeser lacinilc ni atad gnissim dna noitirtta gnildnah rof sdohtem lacitsitats dna larudecorp fo weiveR A .
hcraeser lanoitacude rof snoitacilpmi dna sdohtem atad gnissim ni secnavdA .