خلاصه ماشینی:
1-2) وجود خطاهای ویراستاری در متون عربی: بسیاری از کتابهای عربی موجود که به عنوان محیط جستجوی کاربر قرار میگیرد، در خود متن کتاب به شکل صحیح و دقیقی ویراستاری نشده است و از جهت قوانین ویرایشی زبان عربی و رعایت «ا، ة، ی» دارای اشتباهات فراوانی میباشد.
مثال دیگر: اگر کاربری به دنبال جستجوی «اسماء بنت عمیس» در معجمهای تاریخی باشد، باید این کلمه را هم به صورت «اسما» یا «اسماء» بنویسد تا هم متنهای کتابهای عربی مورد جستجو واقع شود، و هم به صورت «اسما» بنویسد تا متن کتابهای فارسی تاریخی مانند ترجمه تاریخ یعقوبی و ترجمه اخبار الطوال مورد بازیابی قرار گیرد.
در زبان عربی -که بسیاری از کلمات با حرف تعریف «ال » آمده است- این مشکل شدیدتر میباشد.
2- طرح ابتدایی حل مسئله: با در نظر گرفتن مشکلات توضیح داده شده در بخش قبل، راه حل چیست؟ چاره کدام است؟ چگونه میتوان این خشونت را به نرمی تبدیل نمود؟ چه فرآیندی برای انتقال از این عدم انعطاف و دقتبیش از حد به انعطاف در جستجو و عدم دقت کنترل شده وجود دارد؟ برای نخستین بار در سال 1373 در برنامه جستجوی معجم الفاظ قرآن، ایده و تفکر جستجو روی حروف قرآن مطرح گردید.
جزئیات طراحی و پیادهسازی «عدم دقت» در بخش بعد توضیح داده خواهد شد، اما در اینجا به این بسنده میشود که تحلیل نیازمندی حل مشکل در این مرحله به گونهای باید صورت گیرد که کاربر بتواند به صورت انتخابی، «دقت» و «عدم دقت» را بر جستجوی خود حاکم سازد.