چکیده:
دادههای گمشده در کاربردهای تحلیل پوششی دادهها یک بیماری مزمن محسوب میشوند. خیلی از اوقات، متغیرهای مهم ورودی یا خروجی پوشش ناکامل دارند و یا اینکه واحدهای تصمیمگیری همهی آمارهای لازم را گزارش نمیکنند. بنابراین، مقادیر گمشده در ورودیها و خروجیها را نمیتوان با مدلهای اصلی تحلیل پوششی دادهها مورد بررسی قرار داد. در این مقاله، روشهایی را برای پیدا کردن دادههای گمشده در حالتی که دادهها قطعی هستند، ارائه میکنیم. در این مقاله پس از تشریح مفاهیم ضروری دادههای گمشده، برخی از روشهای جانهی دادههای گمشده که موجب کاهش پیچیدگی تحلیل دادهها میشود تشریح میشود. روشهای مختلفی برای جانهی دادههای بیپاسخ موجود است از جمله روشهای گوناگون جانهی ساده و جانهی چندگانه. این مقاله نخستین کوشش سیستماتیک برای بهرهمندی از دادههای حاوی مقادیر گمشده با بهرهمندی از رویکردهای آماری در DEA است. به طور خاص، بررسی میکنیم که اگر درایههای خالی را در مجموعهی دادهها نگه داریم و یک مقدار عددی خاص به آنها اختصاص دهیم، چه اتفاقی میافتد. برای نشان دادن طرز کار روشهای پیشنهادی، از این روشها برای ارزیابی مجموعهای از مدارس متوسطهی دولتی یونان که برخی دارای مقادیر گمشده در ورودی یا خروجی هستند، بهرهمندی خواهد شد.
Missing data is a chronic disease in applications of data envelopment analysis. Very often, important input or output variables are not completely specified and/or the decision-making units do not report all the required statistics. Therefore, the missing values in the inputs and outputs cannot be studied using the original data envelopment analysis models. This paper introduces methods for finding missing data when the existing data is certain. In this article, after explaining the essential concepts of missing values, we describe some methods of missing value imputation that reduce the complexity of data analysis. There are several methods for imputing missing data, including various methods of simple imputation and multiple imputation. This paper is the first systematic attempt to utilize data containing missing values using statistical approaches in the DEA. In particular, we examine what happens if we keep empty entries in the data set and assign a certain numeric value to them. To show how the proposed methods work, they will be used to evaluate a set of secondary public schools in Greece in some of which there are missing input or output values.