Abstract:
جانهی چندگانه روشی است که به طور مشخص برای براورد واریانس در حضور داده های گم شده طراحی شده است. فرمول ترکیبی روبین نیازمند آن است که روش جانهی «مناسب » باشد، که اساسا به این معنی است که جانهی ها، استخراج تصادفی از یک توزیع پسین در یک چارچوب بیزی باشند. در مؤسسات ملی آمار (NSI''s National Statistical Institutes) مانند مرکز آمار نروژ، روش هایی که برای جانهی بی پاسخی استفاده می شوند، مانند بعضی از انواع جانهی های بی درنگ طبقه بندی شده، نوعا غیر بیزی هستند. بنا بر این روش جانهی چندگانه ی روبین در مؤسسات ملی آمار معتبر نیست و نمی تواند استفاده شود. این مقاله به مسئله ی تعیین یک فرمول ترکیبی دیگر می پردازد که بتواند برای روش های جانهی که نوعا در مؤسسات ملی آمار استفاده می شود، به کار رود و رهیافتی برای مطالعه ی این مسئله پیشنهاد می کند. فرمول های ترکیبی دیگری برای مکانیسم های خاص پاسخ و روش های جانهی از نوع بی درنگ تعیین شده اند.
Multiple imputation is a method specifically designed for variance estimation in the presence of missing data. Rubin’s combination formula requires that the imputation method is “proper،” which essentially means that the imputations are random draws from a posterior distribution in a Bayesian framework. In national statistical institutes (NSI’s) like Statistics Norway، the methods used for imputing for nonresponse are typically non-Bayesian، e.g.، some kind of stratified hot-deck. Hence، Rubin’s method of multiple imputation is not valid and cannot be applied in NSI’s. This article deals with the problem of deriving an alternative combination formula that can be applied for imputation methods typically used in NSI’s and suggests an approach for studying this problem. Alternative combination formulas are derived for certain response mechanisms and hot-deck type imputation methods.
Machine summary:
پس ??Y میانگین نمونه بر اساس جانهی برای نمونهی کاملشده است،و برآوردگر ترکیبشده به وسیلهی(به تصویر صفحه مراجعه شود)تعیین میشود.
(به تصویر صفحه مراجعه شود) 3-3-برآورد ضریب رگرسیون در رگرسیون خطی ساده با جانهی ماندهها همانند بخش 1-3 و 2-3 مکانیسم بیپاسخی با )1-?R(P-rP گم شدن کاملا تصادفی در نظر گرفته شده است.
از رابطهی(5)نتیجه میشود که (به تصویر صفحه مراجعه شود) با استفاده از این حقیقت که به شرط ?n ، ?s نمونهای تصادفی ساده است به گونهای که نماگرهای پاسخ آن با )1-n(/)f-1(f--)?R,?R(voc همبستهاند،درمییابیم که ?ss?1-n/?p-1-?p?-)?,?ss(E .
بنابراین یک واریانس برآوردشدهی برآورد ترکیبی؟برای؟ بر اساس جانهی،با استفاده از رابطهی(8)به صورت زیر مشخص میشود (به تصویر صفحه مراجعه شود) که در آن ??V میانگین m تکرار برآورد واریانس جانهیشدهی ??V است که از طریق رابطهی(16)مشخص شده است.
برخی مطالعات شبیهسازی مقدماتی که در این مقاله گنجانده نشدهاند،نشان میدهند که برای رگرسیون خطی ساده با استفاده از روش جانهی ماندهها و )f-1(/1-k ،بازهی اطمینان به صورت(به تصویر صفحه مراجعه شود)(که در آن ?z،2/a نقطهی بالایی توزیع نرمال استاندارد میباشد)است که به طور تقریبی به سطح اسمی )a-1( دست مییابد.
بنابراین (به تصویر صفحه مراجعه شود) 4-رگرسیون لوژستیک با مقادیر گمشده در یک متغیر تبیینی دودویی به منظور تعیین(به تصویر صفحه مراجعه شود)و(به تصویر صفحه مراجعه شود)،نیاز است که؟به روشی متفاوت با روش بخش 2-5 بیان شود تا بتواند مجموع دو عبارت مستقل به شرط دادههای مشاهدهشدهی )?x,y( باشد: (به تصویر صفحه مراجعه شود) (به تصویر صفحه مراجعه شود).