چکیده:
در این مقاله، بهترین دستاوردهای داده های بزرگ را مورد بررسی قرار داده و سپس، مصارف عمومی داده های بزرگ را معرفی کرده، فناوری های مربوطه را بررسی می نماییم؛ مانند: محاسبات ابری، اینترنت اشیا، مراکز داده ای و هادوپ. آنگاه بر چهار فاز زنجیره ارزشی داده های بزرگ تمرکز می کنیم؛ همچون: تولید داده، اکتساب داده، ذخیره داده و تحلیل داده. پس ازاین، چالش های فنی را در این زمینه مورد بحث قرار داده، آخرین پیشرفت ها را بررسی کرده در نهایت نیز به چندین نمونه از برنامه های کاربردی داده های بزرگ اشاره می نماییم؛ از جمله، مدیریت تجاری، اینترنت اشیا، شبکه های اجتماعی آنلاین که همگی می توانند در مباحث علوم انسانی و اسلامی مورد استفاده قرار گیرند و یا دست مایه پژوهش برای دست اندرکاران مهندسان و متخصصان این حوزه قرار گیرد.
منبع اصلی نوشتار حاضر، مقاله «BigData» نوشته: Min Chen، Shiwen Mao و Yunhao Liu می باشد که در وب گاه Springer (ناشر بین المللی منابع علمی، فنی و پزشکی) منتشر گردیده است. گفتنی است، نگارنده علاوه بر ترجمه مقاله مذکور، جهت روشن شدن بحث، نکات و مطالب لازم را نیز به متن افزوده است.
خلاصه ماشینی:
پسازاین، چالشهای فنی را در این زمینه مورد بحث قرار داده، آخرین پیشرفتها را بررسی کرده در نهایت نیز به چندین نمونه از برنامههای کاربردی دادههای بزرگ اشاره مینماییم؛ از جمله، مدیریت تجاری، اینترنت اشیا، شبکههای اجتماعی آنلاین که همگی میتوانند در مباحث علوم انسانی و اسلامی مورد استفاده قرار گیرند و یا دست مایه پژوهش برای دست اندرکاران مهندسان و متخصصان این حوزه قرار گیرد.
ـ همکاری و تعاون: یک معماری شبکه دادههای بزرگ و جامع، باید برای کمک به پژوهشگران و مهندسان در زمینههای مختلف ایجاد شود که بتوانند به انوع مختلفی از دادهها دسترسی پیدا کرده، از اطلاعات و دانش خودشان استفاده کنند؛ بهطوریکه برای تکمیل اهداف تحلیلی با یکدیگر همکاری نمایند.
دادههای بزرگ، هدف عملیات محاسبه فشرده دادههاست و بر ظرفیت ذخیرهسازی یک سیستم ابری تأکید دارد؛ درحالیکه هدف اصلی محاسبات ابری، استفاده از محاسبات بزرگ و ذخیره منابع تحت مدیریت متمرکز میباشد؛ بهطوریکه برنامههای دادههای بزرگ را با ظرفیت محاسباتی جزء، ارائه میکند.
تولید و اکتساب دادههای بزرگ اگر دادهها را به عنوان مواد اوّلیه در نظر بگیریم، تولید و کسب دادهها، یک فرآیند بهرهبردای از این مواد خام هستند و ذخیره دادهها یک فرآیند ذخیرهسازی محسوب شده، تجزیه تحلیل دادهها یک فرآیند تولید میباشد که مواد اوّلیه را برای تولید محصول جدید بهکار میبندد.
به محض تکمیل جمعآوری دادههای خام، دادهها به یک زیرساخت ذخیرهسازی برای پردازش و تجزیه و تحلیل انتقال مییابند که این انتقال میتواند در مرکز داده رخ دهد.