چکیده:
هدف این مقاله تبیین نقش واژگان بسامدی در مطالعهی مهارت واژگانی فارسی آموزان است. این تحقیق ناظر به الگوی توزیع فراوانی واژههای فارسی، ارتباط آن با مهارت واژگانی و شیوهی استخراج واژگان بسامدی از پیکره فارسی است. به این منظور، از روش تحقیق پیکره بنیاد استفاده شده است. بر این اساس، یک پیکرهی فارسی رسمی و محاورهای انتخاب شد و توزیع آماری واژهها در سطوح سه گانهی قانون زیفمندلبرات بهعنوان معیار مطمئنی برای ارزیابی مهارت واژگانی زبان آموزان به دست آمد. بر این اساس، معیار نمایهی فراوانی واژگانی (لاوفر و نیشن، 1995) برای اندازه گیری غنای واژگانی معرفی شده که در آن به میزان بهکارگیری واژه های پربسامد توجه ویژهای شده است. استخراج واژگان پربسامد از پیکرهی رسمی و محاورهای پس از اجرای عملیات بنواژه سازی انجام شده است. چهار آزمون خیدو بر روی 861 کلمهی مشترک، که برحسب چهار مقولهی دستوری تقسیم بندی شدند، نشان داد که پیکرهی رسمی و محاورهای از نظر واژگانی به دو جامعهی آماری متفاوت تعلق دارند. یافته های تحقیق نشان میدهد که میتوان از سطوح بسامدی واژگان رسمی و محاورهایِ فارسی زبانان برای ارزیابی مهارت واژگانی فارسی آموزان استفاده کرد.
The present paper aims to examine the role of frequency lexicon in assessing lexical proficiency of Persian learners. Addressing the frequency distribution pattern of Persian words, the research which is conducted in corpus-based method studies the relationship between words and lexical proficiency as well as derives the frequency lexicon from Persian corpus. To do so, formal and colloquial Persian sub-corpora were selected. To assess lexical proficiency, statistical distribution of the words was computed according to the three-level law of Zipf-Mandelbrodt as a reliable criterion. To measure lexical richness, the lexical frequency profile (Laufer and Nation, 1995) was employed as it pays special attention to the extent the high frequent lexicon are applied. It is to be noted that most frequent lexemes of both corpora were extracted after doing lemmatization. Four Chi-square tests on 861 common words in four parts of speech showed that formal and colloquial corpora belonged to two different statistical populations in terms of lexical diversity. Findings, in addition, revealed that formal and colloquial lexical frequency levels of Persian language learners could be effectively used as a tool to assess their lexical proficiency.
خلاصه ماشینی:
اين تحقيق ناظر به الگوي توزيع فراواني واژه هاي فارسي، ارتباط آن با مهارت واژگاني و شيوه ي استخراج واژگان بسامدي از پيکره فارسي است .
بر اين اساس ، يک پيکره ي فارسي رسمي و محاوره اي انتخاب شد و توزيع آماري واژه ها در سطوح سه گانه ي قانون زيف مندلبرات به عنوان معيار مطمئني براي ارزيابي مهارت واژگاني زبان آموزان به دست آمد.
در اين پژوهش ، سه سؤال بنيادي در خصوص نقش واژگان بسامدي در ارزيابي مهارت واژگاني فارسيآموزان مطرح شده است ؛ (١) توزيع فراواني کلمات فارسي از چه الگويي تبعيت ميکند و اين الگو چه ارتباطي با مهارت واژگاني دارد؟ (٢) در استخراج واژگان بسامدي زبان فارسي چه ملاحظاتي بايد مد نظر داشت ؟ (٣) آيا تفاوت معنيداري بين واژگان مستخرج از پيکره ي متني رسمي و محاوره اي وجود دارد؟ براي پاسخ به اين سؤالات ، از يک پيکره ي رسمي و يک پيکره ي محاوره اي فارسيزبانان استفاده شده است .
html بررسي و استخراج واژگان بسامدي فارسيزبانان به منظور ارزيابي مهارت واژگاني فارسيآموزان ، از پيکره ي زبان فارسي معاصر استفاده شده است (بيجن خان و همکاران ، ٢٠١١).
براي اطمينان از محاوره اي بودن متون ، شيوه ي نگارش کلمات پربسامد فرهنگ بسامدي (بيجن خان و محسني، ١٣٩١: ٣٨٣)، مانند کلمات دستوري «و»، «در»، «بودن »، «را»، «ديگر» و کلمات واژگاني «گفتن »، «توانستن »، «گرفتن » و «دست »، در داخل هر متن منتخب بررسي شده و در صورت مشاهده ي نگارش محاوره اي اين کلمات ، آن متن در زمره ي پيکره ي محاوره اي قرار گرفته است .