چکیده:
امروزه شبکه های اجتماعی به عنوان یکی از اصلی ترین منابع تولید داده در جهان شناخته می شوند. یکی از مهمترین داده های تولید شده توسط این رسانه ها، کلان داده ها می باشند. تحلیل اینگونه داده ها نیازمند
سیستم های دقیق و الگوریتم های هوشمند برای بازیابی اطلاعات و کشف دانش پنهان از میان آنها است.
با توجه به افزایش و گسترش روزافزون حجم اطلاعات منتقل شده در شبکه های اجتماعی، مدیریت آنها
به مسئله بزرگی برای سازمان های مختلف از جمله کتابخانه ها تبدیل شده است. این اطلاعات مفید برای
سازمان ها با هدف به دست آوردن بینش غنیتر و عمیقتر برای تصمیم گیری های خرد و کلان استفاده
می شود. به همین دلیل پیاده سازی، پردازش و کشف دانش از کلان داده های بزرگ تا جایی که ممکن
است، نیاز به تحلیل و اجرای دقیق دارد. هدف این پژوهش بررسی کلان داده ها و تحلیل این داده های
تولید شده در شبکه های اجتماعی است و سپس نقش این داده ها را در کتابخانه ها بررسی کرده است.
خلاصه ماشینی:
از جمله ويژگيهاي اصلي کلان داده ها، حجم بالا، سرعت غيرقابل پيش بيني جريان داده ها و تنوع داده هاي در دسترس است ؛ بنابراين حجمي از داده ها که اين روزها ميتواند ذخيره و پردازش شده و نتايج تحليل آن مورد استفاده قرار گيرد، در گذشته قابل تصور هم نبود (مولايي، ١٣٩٢).
1- Minelli et al 2- Gantz & Reinsel 3- Center, Inet IT.
بنابراين ميتوان گفت که کلان داده ها، مجموعه از داراييهاي اطلاعات با مشخصه هايي همچون حجم ، سرعت و تنوع زياد است که نميتوان با روش هاي سنتي فناوري اطلاعات و ارتباطات ، نرم افزارها و سخت افزارهاي موجود در زماني معقول به مديريت و تحليل آن ها پرداخت ، بلکه کسب ارزش از آن ها نيازمند صرف هزينه و به کارگيري روش ها و فناوريهاي نوين است (درمنده و همکاران ، ١٣٩٥).
نتايج پردازش اطلاعات جمع آوريشده از طريق Apache Flume با استفاده از InfoSphere BigInsights و ذخيره سازي در Hadoop نشان داد که در اين پلتفرم جديد تحليل کلان داده هاي شبکه هاي اجتماعي بهتر از ساير روش ها انجام ميشود (بيرجالي و همکاران ،٢ ٢٠١٧).
1- Kim et al 2- Birjali et al 3- Mohammadpoor & Torabi 4- McNutt et al 5- Singh et al مطالعه اي در سال ١٣٩٦ توسط حسيني و قلمکاري با هدف تحليل جوامع برند آنلاين بر پايه ي شبکه هاي اجتماعي با روش شبکه نگاري صورت گرفت .