چکیده:
شناسایی سبک نویسنده و پردازش زبان طبیعی از اهمیت ویژهای برخوردار است و پژوهش در این زمینه به دو صورت کیفی و کمی انجام میشود. ازآنجاییکه شعر و ادبیات همواره یکی از افتخارات تاریخی زبان فارسی بهشمار میآید، شناسایی سبک نویسندگان و شاعران بهصورت گسترده، بدوناعمال نظرات انسانی و به شیوۀ کمی، امری ضروری است. در این پژوهش کاربرد روشهای آماری برای شناسایی سبک نویسنده مورد بررسی قرار میگیرد؛ بههمیندلیل، ویژگیهای واژگانی، حرفی و نحوی از متنهای منتخب استخراج میشود. هدف اصلی مقاله، استخراج ویژگیهای صوری متن و دستهبندی اشعار مربوط به دو شاعر حوزۀ دفاع مقدس (قیصر امینپور و محمدرضا عبدالملکیان) است. بهاینمنظور، از دو دستهبند K نزدیکترین همسایه و بیز ساده جهت انجام عمل دستهبندی و انتساب دادهها استفاده شد. بررسی هر کدام از دستهبندها با استفاده از معیارهای ارزیابی، انجام شد. نتایج ارزیابیها روی سه نوع ویژگی نشان داد، ویژگیهای واژگانی بدون حذف واژههای دستوری در دستهبند بیز ساده با 92 درصد معیار F از بالاترین دقت در میان انواع ویژگیها برخوردار است. این نتیجه، نشاندهنده کارآیی قابلملاحظۀ این نوع ویژگی در شناسایی سبک نویسنده است.
خلاصه ماشینی:
1 روش های یادگیری ماشین در بررسی ویژگی های زبان شعری در اشعار شاعران دفاع مقدس (مطالعۀ موردی: اشعار دو شاعر دفاع مقدس ؛ قیصر امین پور و محمدرضا عبدالملکیان ) کامیار جوانمردی ٢*؛ منوچهر اکبری 3 شناسایی سبک نویسنده و پردازش زبان طبیعی از اهمیت ویژه ای برخوردار است و پژوهش در این زمینه به دو صورت کیفی و کمی انجام می شود.
در این پژوهش کاربرد روش های آماری برای شناسایی سبک نویسنده مورد بررسی قرار میگیرد؛ به همین دلیل ، ویژگیهای واژگانی، حرفی و نحوی از متن های منتخب استخراج میشود.
نتایج ارزیابیها روی سه نوع ویژگی نشان داد، ویژگیهای واژگانی بدون حذف واژه های دستوری در دسته بند بیز ساده با ٩٢ درصد معیار F از بالاترین دقت در میان انواع ویژگیها برخوردار است .
شناسایی سبک دو شاعر دفاع مقدس قیصر امین پور و محمدرضا عبدالملکیان با استفاده از روش های آماری به عنوان مطالعۀ موردی جهت نشان دادن این مسئله انتخاب شده است .
درنهایت در این پژوهش با استفاده از ویژگیهای واژگانی، نحوی، حرفی و بهره گیری از دو دسته بند K نزدیک ترین همسایه ٣ و بیز ساده ٤ سبک دو شاعر حوزٔە دفاع مقدس ، قیصر امین پور و محمدرضا عبدالمکیان از یکدیگر متمایز خواهد شد.
1. Hidden Markov Model 137 (رجوع شود به تصویر صفحه) سپس ، در مرحلۀ بعد، بردار ویژگیهای نحوی با استفاده از دسته بند بیز ساده انجام شد که نتایج ارزیابی این روش و ماتریس ابهام به ترتیب در جداول شمارٔە ١٨ و ١٩ نمایش داده شده است .