什么是数据质量?

数据质量表明数据是否适合用于驱动可信的业务决策。的数据管理协会(DAMA)将数据质量管理定义为“活动的计划、实施和控制……以确保数据资产适合消费,并满足数据消费者的需求。”在他的书中在数据方面走在前面Tom Redman说:“如果数据适合(客户)在运营、分析、决策和计划中的预期用途,那么数据就是高质量的。为了适合使用,数据必须“没有缺陷”(即“正确”)和“具有所需的功能”(即成为“正确的数据”)。

数据质量的主要驱动因素是:

  • 业务数据的批量,速度和品种的指数增长
  • 多个系统导致更大、更复杂、更昂贵隐藏数据的工厂
  • 合规压力不断增加——GDPR、BCBS 239、CCAR、HIPAA等法规要求数据审计和报告
  • 数据迁移——在将大量数据迁移到云或新存储时,确定表或系统之间缺失的记录、值和损坏的关系非常重要
  • 高性能的AI举措 -监测数据漂移有助于随着时间的推移检测分析模型的准确性和性能
  • 客户体验 - 为客户创建个性化体验需要有关个别收件人的新鲜和完整的数据

如今,组织的每一个决策都依赖于数据,并将数据视为重要的企业资产。随着业务分析师和数据科学家努力获取可信数据以支持他们的解决方案,数据质量在业务数据策略中占据了更高的优先级。manbetx1.0下载

什么是好的数据质量?

高质量的数据正确地表示业务场景,并有助于更精确地处理手头的问题。您可以使用高质量数据的基础来派生可信的信息,从而驱动可信的业务决策。卓越的业务结果可以在持续改进周期中进一步推动数据质量

对于在整个企业中协作使用数据,对数据的信心至关重要,良好的数据质量是实现数据到价值的速度指标。

为什么数据质量很重要?

不完整、不正确、重复或冗余数据在业务中很常见,这是由于人为错误、竖井工具、多次移交和不适当的数据策略造成的。由于数据质量不佳,企业通常会面临沮丧的客户、更高的运营成本或不准确的报告。《麻省理工学院斯隆管理评论》研究指出,糟糕的数据成本是大多数公司的令人惊讶的15%至25%的收入。

简化操作流程是数据质量的关键用例。

  • 由于把精力浪费在错误的地址或重复的客户上,营销活动往往收效甚微
  • 由于部门间数据不匹配,供应商发送了错误的材料或数量
  • 协调不一致的数据需要更高的手工工作,成本更高,或者延迟流程

数据质量对业务变更的敏捷响应有很大影响。

  • 不准确的或旧的数据无法识别新的机会
  • 基于劣质数据的分析不能表明当前的活动是否有效或是否需要改变
  • 由于数据不完整或过时,财务报告可能不能反映正确的情况,影响及时采取行动

随着企业争相拥抱大数据和人工智能自动化,他们需要更加重视高质量的数据。

如何确定数据质量?

确定数据质量在特定领域或任务的上下文中往往更有相关性和实用性。您可以从获取数据资产的清单开始,并选择一个试点样本数据集。下一步是评估数据集的有效性、准确性、完整性和一致性。您还可以评估冗余、重复和不匹配数据的实例。在一个小的数据集上建立基线可以快速扩展工作。看这个视频要了解数据质量可能对您意味着什么。

基于规则的数据质量管理是一种很好的方法,您可以在其中定义特定要求的规则。您还可以建立数据质量的目标,并将它们与当前级别进行比较。设定目标促进连续测量,发现改进机会,以及良好的数据卫生

Gartner.在美国,数据质量改进工作往往只关注准确性。数据消费者对数据质量的定义比技术专业人员可能意识到的要宽泛得多。例如,除非数据是可访问的、可理解的和相关的,否则数据的准确性是没有意义的。

数据质量的例子是什么?

当有人紧急赶往紧急程序时会发生什么?医疗保健人员可快速恢复数字患者记录,这些记录应始终呈现完整的信息。如果患者数据没有显示过敏或正在服药,后果可能很严重。高质量的患者数据可以确保所有治疗在任何时间正确地满足个人的独特医疗保健需求。

在业务中,良好的数据质量可以确保您的数据适合,以支持对正确方向努力的分析和矛头。

如何提高数据的质量?

识别和承认问题是解决问题的第一步。最近的PWC的全球危机调查调查强调了危机管理期间准确数据的重要性。数据质量受到各种因素的影响,它们都在多个数据源的筒仓中具有它们的根源。您必须采取全面的方法来了解数据并克服管理其质量的挑战。

再次引用Tom Redman的话——在一份数据的生命周期中有两个有趣的时刻:它被创造的时刻和它被使用的时刻。数据质量管理的关键在于及时连接这些时刻——确保创建时刻的设计和管理能够正确创建数据,以便在使用时一切顺利。

  • 元数据管理:元数据管理利用关于定义用于将数据转换为企业资产的信息资产的跨组织协议。
  • 数据治理数据治理是规范组织内数据资产管理的实践和过程的集合。一个健壮的数据治理基金会建立对数据的信任。
  • 数据目录:数据目录Empowers用户可以快速发现和理解重要的数据,帮助选择可信数据以产生有影响力的商业洞察力。
  • 数据匹配数据匹配识别可能的重复或重叠以分解数据芯盘并驱动一致性。
  • 数据情报数据智能是能够以正确的方式理解和使用您的数据。数据智能的综合方法促进并提供高质量数据。

数据质量最佳实践侧重于建立企业范围的主动性,定义测量指标,简化程序和执行定期审核。

预测和连续的数据质量提供自动规则管理,连续数据漂移检测和自动数据分析的独特功能。您可以通过数据治理,数据隐私,数据目录和数据谱系提升这些功能,以具有端到端数据管道控制,将完整的业务环境带入数据质量,并以可扩展的方式提供可信的分析和AI。

高德纳估计,到2022年,60%的组织将利用支持ML的数据质量改进技术。如果您能够自动化数据质量规则管理流程并不断提高业务关键数据源和数据元素的质量,则会为您的组织有多有益?

Arunachal Pradesh,登记为数据公民观看实时数据质量演示**

想要了解有关Collibra数据质量的更多信息吗?新万博移动客户端

请求一个演示

相关资源狗万新闻c

博客

数据质量和数据治理:从哪里开始?

视频/网络研讨会

新万博移动客户端Collibra数据智能云

博客

什么是数据情报?

1mantbex

更多类似的故事

2021年5月7日-5.

医疗保健领域的数据质量:挑战和机遇

阅读更多
箭
2021年4月6日6.

数据质量的6个维度

阅读更多
箭
2020年10月30日至4.

数据质量和数据治理:从哪里开始?

阅读更多
箭