چکیده:
هدف: تصمیم پذیرش در آزمونها بیشتر براساس نمرهای است که در آن آزمون کسب میشود. آزمون میتواند از چند خرده آزمون با محتوای متفاوت تشکیل شده باشد که به آن آزمون مرکب و نمره حاصل، نمره کل نامیده میشود. روشهای متفاوت نمره کل سازی موجب تغییر در تصمیم پذیرش افراد میشود. این پژوهش با هدف رتبهبندی روشهایی که برای ساختن نمره کل استفاده میشود، انجام شده است.
روش پژوهش: از 10000 نمونه تصادفی آزمون سراسری در هفت خرده آزمون برای رتبهبندی شش روش نمره کل سازی بهره گرفته شده است. نمره خام از مجموع پاسخهای صحیح به دست آمده و از روشهای نرمالسازی و آرک سینوس برای تبدیل نمرهها به نمرههای مقیاس بهره برده شده است. از طرحهای وزن دهی اسمی، موثر و شانون برای ساخت نمره کل استفاده گردید. به منظور رتبهبندی روشهای نمره کل سازی بر اساس خطای استاندارد اندازهگیری شرطی آنها از رویکردی مبتنی بر تصمیمگیری چند شاخصه استفاده شد.
یافتهها: نتایج نشان داد که آن دسته از روشهای نمره کل سازی که از مقیاس آرکسینوس و از طرحهای وزن دهی اسمی و یا شانون بهره میبرند، حائز رتبههای بالاتری شدند و در صورت استفاده از آنها در نمره کل سازی ، خطای کمتری مرتکب خواهیم شد.
نتیجهگیری: استفاده از نمره مقیاس آرک سینوس، به دلیل خطای کمتر، تبدیل و راحت تر می تواند به تفسیرپذیری و دقت بیشتر نمره های آزمون های مرکب کمک کند، ضمن اینکه روش های متفاوت وزن دهی تاثیر چندانی بر دقت نمره ها نداشته و مطابق با شرایط آزمون و تصمیم آزمون ساز می توانند مورد استفاده قرار بگیرند.
Objective: Battery Test is usually used for decision-making in education and Admission decisions. There are several methods to construct composite scores so each method makes a different effect on the admission decision. However, which decision makes fewer errors? Methods: present research has been conducted to rank different methods of composite score construction based on their CSEM. 10,000 random sample Data from participants of the Iran university entrance exam were used to rank six composite score construction methods. The participants' raw score arises from summing up correct responses. Normalizing and Arcsine transformation methods were used to Construct scale scores, also we used nominal, effective and Shannon weighting schemes to combine subtest scale scores. In order to rank composite score construction methods, a new approach was employed based on the MADM decision-making approach Results: The results revealed that the methods that use Arcsine to construct scale scores and nominal or Shannon weighting schemes to combine subtest scale scores have taken the higher ranks, and less error will occur at admission decision. Conclusion: Using the Arc Sine scale score, due to less error and easier conversion, can help the interpretation and accuracy of composite test scores, while different weighting methods do not affect the accuracy of scores and in accordance with the test conditions or test builders' decision can be used.
خلاصه ماشینی:
رابطه ٥ وزن مؤثر نسبي را نشان ميدهد که براساس واريانس خرده آزمون و کواريانس آن با ساير خرده آزمون ها تعريف شده است : (به تصویر صفحه رجوع شود) مطالعات اندازه گيري و ارزشيابي آموزشي، سال ١٢، شماره ٣٧، ص .
(به تصویر صفحه رجوع شود) j1 براي محاسبه خطاي استاندارد اندازه گيري شرطي نمره هاي کل از رابطه اي که لاري پرايس و همکارانش پيشنهاد داده اند استفاده ميشود، اين رابطه از ترکيب خطاي استاندارد اندازه گيري شرطي هر کدام از خرده آزمون ها به دست آمده است (پرايس ، ٢٠٠٦) .
شاخص هاي آماري و شاخص هاي اندازه گيري براي نمره خام خرده آزمون ها (به تصویر صفحه رجوع شود) آنگونه که گفته شد شش روش براي ساختن نمره کل طراحي شده است ، تنوع اين روش -ها به خاطر ترکيب روش هاي متفاوت مقياس سازي و طرح هاي وزن دهي است .
برخي شاخص هاي آماري به همراه ضريب پايايي در روش هاي نمره کل سازي (به تصویر صفحه رجوع شود) جدول ٥ مقدار وزن ها را براي هر خرده آزمون و براي هر طرح وزن دهي نمايش داده است .
(1999) Conditional Scale-Score Standard Errors of Measurement under Binomial and Compound Binomial Assumptions, Educational and Psychological Measurement, Vol 59, Issue 1, pp.
W. (2006), Methods in Scaling the Basic Competence Test, Educational and Psychological Measurement, 66(6), 907-929.
(2012), Conditional Standard Errors of Measurement for Composite Scores Using IRT, International Journal of Testing, 12, 1-20.
Conditional standard errors of measurement for composite scores on the Wechsler Preschool and Primary Scale of Intelligence-Third Edition, Psychological Reports,98,237-252 Rudner, L.