چکیده:
نوشته حاضر فرایند ایجاد یا توسعه یک بانک سوال مدرج شده بر اساس تئوری سوال پاسخ با استفاده از داده های 30 سوال کنکور آزمایشی حساب دیفرانسیل است که روی یک نمونه 3409 نفری اجرا شده است. تابع آگاهی کل سوالات برابر با 21/43 است که در فاصله 3 پیوستار توانایی نقطه بیشینه آن روی 95/0 است و در این نقطه، توانایی افراد با حداقل خطا برآورد شده است. یکی از نکات برجسته در راه اندازی چنین بانکی برآورد توانایی افراد بر اساس آزمونهای مداد-کاغذی استاندارد و کم خطا با اهداف ویژه است تا بتوان در هزینه، تلاش و زمان صرفه جویی کرد و امنیت آزمون ها را بالا برد. بعلاوه فرایند آزمون گیری را که به صورت سنتی و مداد کاغذی اجرا می شود با طی مراحل بعدی به صورت سنجش انطباقی کامپیوتری ارتقاء داد. برای ارائه مثال از بین سوالات این بانک یک خرده آزمون کوتاه مدادکاغذی با سوالاتی که قدرت تمیز بالا و ضریب دشواری بیشتری دارند، انتخاب شده است. دامنه دشواری این خرده آزمون کوتاه بین و ضریب تمیز قرار داده شد و در نهایت 5 سوال برگزیده شده است که تابع آگاهی این خرده آزمون برابر با 48/12 و نقطه بیشینه آن روی پیوستار توانایی برابر با 35/1 است. بعلاوه سطح دشواری آزمون4/0 واحد انحراف معیار افزایش یافته و به علت کوتاه شدن دامنه آزمون از 30 سوال به 5 سوال میزان آگاهی دهی از توانایی آزموندهندگان نیز 46/3 برابر کاهش پیدا کرده است. بعلاوه برای اجرای سنجش انطباقی یک شبیه سازی انجام شده است که تنها 8 تا 10سوال نیاز بوده تا با 01/0 احتمال خطا به همان دقت آزمون30 سوالی توانایی افراد را اندازهگیری کرد.
خلاصه ماشینی:
Computerized Adaptive Testing ١-گام های ضروری برای طراحی بانک سؤال برای آزمون های خطی و سنجش انطباقی ١-١-تهیه آزمون اولیه و کنترل کیفی برنامه های سنجشی استاندارد در مقیاس بزرگ چه مدادکاغذی و چه کامپیوتری مستلزم فرایند طراحی سؤالات، تهیه و کنترل کلید پاسخ سؤالات، سرهم کـردن سـؤالات، بـازبینی محتـوای سؤالات برای اطمینان یابی از اینکه مجموعه سؤالات تمام حیطه مورد نظر را تحـت پوشـش قرار می دهد و در واقع آزمون از روایی مناسبی برخوردار اسـت و اجـرای تجربـی سـؤالات روی یک گروه با حجم بهینه از آزمون دهندگان می باشد.
در این روش یک توزیع نرمال که از روی داده ها برآورد شده است برای برآورد بهینه پارامترها و مدرج کردن سؤالات به عنوان توزیع پیشین در معادله ای که تابع درستنمایی توانایی را محاسبه می کند ضرب می شود تا توزیع پسین مورد انتظار بدست آید.
(رجوع شود به تصویر صفحه) البته باید دوباره یادآوری شود که اگر گنجینه سؤالات خیلی بزرگ باشـد بـرای انتخـاب یـک مجموعه سؤال دلخواه، طبیعتا بیش از ٥ سؤال انتخاب خواهد شد و در نتیجه در آزمون هـای مدادکاغذی که سؤالات آن از بانک مدرج شده تهیه شده است می تـوان توانـایی را بـا دقـت بیشتری برآورد کرد.
نمودار سؤال ٩، به عنوان نقطه شروع پاسخ گویی به سؤالات در سنجش انطباقی کامپیوتری (رجوع شود به تصویر صفحه) نتیجه گیری به علت اینکه روش های جدید اندازه گیری هم در تئوری و هم در عمل دارای تـوان بـالایی هستند، در آزمون سازی هایی که بر مبنای این روش ها صورت بگیرد خطای برآورد به نحـو چشم گیری کاهش می یابد و کار آزمون سازی نیز با حداقل هزینه و زمـان صـورت خواهـد گرفت .