Abstract:
متنکاوی فرآیند و تکنیکی برای جستجو، بازیابی و استخراج اطلاعات مفید و هدفمند از اقیانوس دادهها و اطلاعات طبقهبندی نشده است که در قالب متون نوشته شده به زبان طبیعی استفاده میشود؛ این حوزه یک زمینه تحقیقاتی نوظهور است که به آن مهندسی متن، دادهکاوی متن یا تجزیهوتحلیل متن نیز گفته میشود. متن کاوی از تکنیکهای هوش مصنوعی بهره میگیرد از اینرو، این سیستم در مقایسه با تواناییهای انسان از نظر محدودیت زمانی و شمارش کلمات که مستلزم دقت است، بسیار کارآمد است، متنکاوی در زمینه علم اطلاعات و دانش شناسی چشماندازهای زیادی برای ارائه دارد؛ این تکنیک میتواند در مدیریت اطلاعات در حال رشد در هر زمینه دانش بسیار مفید باشد؛ همچنین میتواند برای تحقیقات این حوزه نیز مورد استفاده قرار گیرد؛ پژوهشگران و کتابداران ممکن است تلاش در این زمینه را برای سازگاری بهتر با آینده مفید بدانند، این مقاله که باهدف بیان مفاهیم کلی متنکاوی و کاربردهای آن در حوزه علم اطلاعات و دانش شناسی تدوین شده است، جهت ایجاد انگیزه محققان این رشته در مشارکت در پروژههای متنکاوی باهدف کمک به دانش جدید در بهبود حرفه و خدمات کتابخانهای مفید است، از آنجاییکه متنکاوی یک زمینه نوظهور در تحقیقات است، ادبیات کمتری به ویژه مرتبط با علم اطلاعات و دانش شناسی در دسترس است.
Machine summary:
طبق ن 4 anger"/>anger"/> (2007) "متنکاوی را میتوان بهطورکلی بهعنوان یک فرآیند دانش فشرده که در آن کاربر با یک مجموعه اسناد در طول زمان با استفاده از مجموعهای از ابزارهای تجزیهوتحلیل تعا 5 Text="Jo"/> Text="Jo"/> (2019) متنکاوی را بهعنوان "فرایند استخراج دانش ضمنی از دادههای متنی" تعریف میکن 6 "Kwartler"/>"Kwartler"/> (2017) اشاره میکند که «متنکاوی فرآیند استخراج بینشها 7 xt="Liddy"/>xt="Liddy"/> (2000) میگوید «متنکاوی فرآیند تجزیهوتحلیل متن طبیعی برای کشف و ضبط اطلاعات معنایی بهمنظور درج و ذخیرهسازی در ساختار Feldman & Dagan Hearst Miner, Delen, Elder, Fast, Hill, & Nisbet, Feldman & Sanger Jo Kwartler Liddy (KOS) باهدف نهایی کشف دانش از طریق هر متن یا دسترسی بصری برای استفاده در طیف وسیعی از برنامههای کاربردی مهم است».
اهداف متن > برخی کارشناسان (ماینر و همکاران، 20 6 g"/>g"/>، 2012) متنکاوی را به هفت حوزه عملی زیر تقسیم میک > ذخیرهسازی و بازیابی اطلاعات: این شامل ذخیرهسازی و بازیابی اطلاعات از اسناد، مانند موتورهای جستجو و جستجوی کلمات کلیدی > خوشه بندی اسناد: تکنیک خوشهبندی اسناد برای گروهبندی و دستهبندی اصطلاحات، پاراگرافها و اسناد استفاده می Prof Don Swanson Jusoh & Alfawareh Thomas Hyde Bodleian Library Natural Language Processing Ying طبقهبندی اسناد: روشهای طبقهبندی مبتنی بر مدلهای نمونههای برچسبگذاری شده برای گروهبندی و دستهبندی اصطلاحات، پاراگرافها و اسناد استفاده میشود؛ وب کاوی: با استفاده از اینترنت با تمرکز ویژهبر مقیاس و به همپیوستگی وب انجام میشود؛ استخراج اطلاعات 1 : برای تبدیل متن بدون ساختار و نیمه ساختاریافته به متن ساختاریافته برای شناسایی و استخراج حقایق و روابط مرتبط استفاده میشود؛ پردازش زبان طبیعی: پردازش کامپیوتری سطح پایین برای تعامل با زبان انسان است؛ استخراج مفهوم: فرآیند گروهبندی کلمات و عبارات به گروههای مرتبط معنایی است.