چکیده:
علیرغم وجود تحقیقات فراوان در حوزه کیفیت داده، تاکنون پژوهشی که بتواند دیدگاه جامعی نسبت به متدولوژیهای کیفیت داده فراهم آورد، انجام نشده است. در این مطالعه 3909 مقاله و پژوهش مرتبط در بازهی زمانی ماقبل 2020 از نمایههای استنادی وبآوساینس [1] و اسکوپوس انتخاب شد که با استفاده از روش فراترکیب و معیارهای ورود در نهایت 27 مقاله در راستای هدف پژوهش مورد ارزیابی قرار گرفتند. در این راستا ضمن بهکارگیری دیدگاه سیستمی، با استفاده از روش کدگذاری باز، کدهای مربوط به سه مقولهی اصلی رویکرد سیستمی شامل ورودی، فرایند و خروجی استخراج گردیدند و مفاهیم مشابه در کدهای فرعی و در ادامه کدهای فرعی در کدهای اصلی دستهبندی شدند. ورودیهای اصلی شامل زمینه و وضعیت سازمان، دادهها و منابع اطلاعاتی و ابعاد کیفیت داده هستند. همچنین گامهای متدولوژیهای کیفیت داده در سه مرحله اصلی بازسازی وضعیت، ارزیابی/ اندازهگیری و ارتقاء طبقهبندی شدهاند. علاوه بر این خروجیهای کیفیت داده در شش دسته کلی شامل فهرست فعالیتها و تکنیکهای مرتبط مشخصشده برای ارتقاء کیفیت دادهها، فرایندهای کنترل شده یا بازطراحیشده، جریانها و پایگاههای داده اندازهگیری یا ارتقاء دادهشده، نتایج ارائهشده از وضعیت کیفیت داده، سیاستها یا قوانین کیفیت داده تصحیحشده و هزینهها و منفعتها طبقهبندی شدهاند. نتایج حاصل از این پژوهش میتواند ابزار مناسبی جهت شناخت متدولوژیهای کیفیت داده موجود و همچنین ارزیابی نقاط ضعف و قوت متدولوژیهای کیفیت داده باشد.
Despite abundant research on data quality, no research has so far been conducted which can provide a comprehensive view of data quality methodologies. In the present study, 3909 articles and related researches in the period before 2020 were selected from Web of Science (WOS) and Scopus citation indexes, from among which 27 articles were finally evaluated in line with the research goals, using meta-synthesis method and inclusion criteria. In this regard, while applying the system view and using the open coding method, the related codes to the three main categories of the systemic approach (input, process and output) were extracted. The similar concepts were categorized in sub-codes and then the sub-codes in main codes. The main inputs included the context and status of organization, data and information resources, and data quality dimensions. Steps of data quality methodologies were also classified into three main stages: state reconstruction, measurement/ evaluation, and improvement. In addition, data quality outputs fell into six general categories: list of activities and the related techniques for data quality improvement, controlled or redesigned processes, measured or improved flows and databases, data quality status results, revised data quality policies or rules, and costs and benefits. The results of this study can provide an appropriate instrument for identifying the existing data quality methodologies as well as evaluating the strengths and weaknesses of data quality methodologies.