خلاصه ماشینی:
فهرست ذیل، ویژگیهای مختلف خروجی این تحلیلگر را نشان میدهد: شماره اسم ویژگی توضیح نوع کلماتی که این ويژگی را دارند 1 Affix نوع وند اسم، فعل و حرف ۲ Root ریشه اسم و فعل 3 Lemma پیراسته اسم، فعل و حرف 4 POS(Part Of Speech) برچسب ادات سخن اسم، فعل و حرف 5 KOL(Kind of Letter) نوع حرف حرف 6 Num مفرد، مثنی، جمع فعل 7 Case اعراب اسم، فعل و حرف 8 Categ باب اسم و فعل 9 Time زمان فعل 10 TOV(Type of Verb) نوع فعل فعل 11 Voice معلوم و مجهول فعل 12 Dervt نوع اسم اسم پژوهش حاضر، یکی از قویترین شیوههای رفع ابهام تحلیلگر صرفی زبان عربی را ارائه کرده که اسم آن NoorMD (Noor Morphological Disambiguation) است.
کلمه با اعراب توکنها POS پیشوند POS میانوند فَحِكَمِ ف حکم حرف اسم فَحَكَمٍ ف حکم حرف اسم فَحْكُمْ فح کم فعل اسم فَحَكَمَ ف حکم حرف فعل شیوه ابداعی این تحقیقات، تاکنون بهترین نتایج را در زمینه رفع ابهام صرف زبان عربی به ثبت رسانیده است.
کارهای مرتبط تحقیقات بسیاری در گذشته برای برچسبگذاری ادات سخن و تحلیل صرفی زبان عربی صورت گرفته است.
متناسب با هریک از این نوعها، پیکرههایی نیز انتشار یافته که سعی شده پوشش خوبی روی آن نوع باشد؛ برای نمونه، پیکره Penn Arabic Tree Bank را میتوان یکی از معروفترین پیکرهها در رده عربی استاندارد مدرن دانست.
در این بخش، ابتدا شبیهترین کلمات موجود در پیکره رفع ابهام نور برای کلمه مورد پرسش فهرست شده، سپس با استفاده از ردهبند نزدیکترین همسایه، بهترین تقطیع انتخاب میگردد.
Rambow, "Arabic Tokenization, Part-of-Speech Tagging and Morphological Disambiguation in One Fell Swoop," ACL ’05 Proc.