Abstract:
مدل متداول در برازش داده های شمارشی پواسون است که ویژگی مهم آن برابری میانگین و واریانس می باشد. اما در مباحث کاربردی در صورت عدم برقراری این شرط استفاده از مدل پواسون منجر به استنباط نادرستی از پارامترهای مدل خواهد شد. در این مقاله ضمن بررسی موضوع بیش پراکنش و آزمون های مربوط به آن، مدل های دوجمله ای منفی و پواسون تعمیم یافته به عنوان جایگزین هایی برای مدل پواسون معرفی می شوند. در ادامه، به مقایسه ی مدل های مختلف رگرسیونی برای داده های شمارشی با شرط ثابت بودن دو گشتاور مرتبه ی اول می پردازیم. همچنین، روش ماکسیمم درستنمایی را برای براورد پارامترهای مدل های رگرسیونی نام برده منظور می کنیم. در آخر، مدل های متفاوتی را به داده های اثر اجزای سندروم متابولیک در کودکان چاق شهر اصفهان بر فاکتور تعداد گلبول های سفید خون برازش داده و از بین آن ها بهترین را که برازنده ی داده هاست بر اساس معیارهای متداول انتخاب می کنیم.
Familiar model in the analysis of count data is Poisson which imposes the restrictive assumption that the variance equals the mean. This restriction is not usually satisfied in practice and thus model fitting process leads to invalid estimation results of parameters. This paper introduces the concept of over-distribution and its related tests، and presents several count data regression models، such as the negative binomial and the generalized Poisson، as alternatives to the Poisson model. Furthermore، some models for count data are compared under the assumption of having the same two first order moments. Also، we use the maximum likelihood approach to estimate the model parameters. Finally، we consider a real data set taken from the study of the impact of the metabolic syndrome among obese children in Isfahan. We analyze the number of white globules as responses and then select the best fitted model by using of some standard model choice criteria.
Machine summary:
در این مقاله ضمن بررسی موضوع بیش پراکنش و آزمونهای مربوط به آن،مدلهای دو جملهای منفی و پواسون تعمیم یافته به عنوان جایگزینهایی برای مدل پواسون معرفی میشوند.
2-3-2-بیش پراکنش متغیر مدل دو جملهای منفی میتواند به صورت ترکیبی از مدل پواسون با میانگین؟؟و اثر تصادفی واحدها معرفی شود که در آن با فرض تابع پیوند لگاریتم داریم و i u ها دارای توزیع گاما با میانگین یک،به عنوان مثال )v,v(ammaG باشند.
3-مقایسهی مدلهای متداول برای دادههای شمارشی 1-3-مدل دو جملهای منفی و پواسون تعمیم یافته برای مقایسهی مدلها ابتدا فرض میکنیم که گشتاورهای اول و دوم آنها یکسان باشند.
به علت پیچیدگی بررسی ویژگیهای توزیع پواسون تعمیم یافته و به خصوص تابع مولد گشتاور آن،بیشتر مدل دو جملهای منفی در برازش دادههای بیش پراکنش استفاده میشود.
(به تصویر صفحه مراجعه شود) لازم به ذکر است برای بیان روشنتر اختلاف این مدلها با پواسون و به دلیل نزدیک بودن دو نمودار پواسون تعمیم یافته و دو جملهای منفی از میزان پراکنش متفاوت استفاده شده است.
(به تصویر صفحه مراجعه شود) 5-نتیجهگیری با توجه به مشکلانی که برازش مدل پواسون برای دادههای شمارشی با مسئلهی بیش پراکنش دارد،در این مقاله مدلهای جایگزین متفاوتی پیشنهاد شد و با استفاده از نمودارها،ویژگیهای آنها مورد بررسی قرار گرفت.
در ادامه با بیان مثالی کاربردی، مدلهای مختلف به دادهها برازش داده شد و با استفاده از معیارهای CIA و CIB مدل پواسون تعمیم یافته،که دو موضوع بیش پراکنش و کمپراکنش را در تحلیل دادهها منظور میکند،نسبت به بقیه به عنوان مدل مناسب انتخاب شد.