什么是数据沿袭?为什么它很重要?

办公室职员向同事展示电脑屏幕上的东西。

数据沿袭描述数据在整个数据生命周期中从源传输到目的地时如何转换和流动。它可以帮助组织了解数据背后的完整故事,以便他们可以使用数据做出有影响力的业务决策。

为什么数据沿袭很重要?

数据沿袭很重要,因为它确保了组织的数据是准确和可信的。如果没有数据沿袭,业务分析人员就无法了解其数据的正确性,因此可能会根据不准确和不完整的数据做出重要决策。数据沿袭使业务分析人员能够看到他们的数据来自何处,从而确保他们正在使用正确的数据来推动业务决策。它还可以帮助It和数据工程师自动化沿袭提取,这样他们就不再需要在Excel电子表格中手动映射数据沿袭,从而为战略计划腾出It时间。有了完整的数据沿袭,数据工程师可以快速、轻松地确定他们希望进行的任何更改的影响。

在表示数据流的空间中行进的线

更具体地说,数据沿袭很重要,因为它会带来影响整个业务的四个关键好处。数据沿袭在以下方面帮助组织:

    • 遵守法规
    • 自动化数据映射工作
    • 更好地理解和信任您的数据
    • 节省手工影响分析的时间

    更深入地了解数据沿袭优势并了解数据沿袭如何使您的组织成为数据驱动的。

    什么是数据沿袭工具?

    数据沿袭工具可以自动映射数据点之间的关系,以显示数据如何从一个系统移动到另一个系统,以及如何构建、聚合、获取和使用数据集——提供完整的端到端沿袭可视化。企业级数据沿袭工具应该包括以下特性:

    • 自动谱系提取:自动从源系统中发现和提取沿袭,以获得数据的端到端视图,并可以看到完整的数据上下文
    • 简要业务脉络:使用显示从数据源到报表的汇总沿袭的交互式数据图跟踪数据流
    • 详细的技术沿袭:查看转换,向下钻取到表、列和查询级沿袭,并在数据管道中导航
      • 间接的血统:查看跨资产的直接数据流,以及参与影响数据移动的间接关系,例如条件语句和连接
      • 代码的内联上下文:轻松识别并深入到沿袭图中的相关表和列级代码
      • 导出谱系图:以不同的文件格式提取血统状态图,用于报告和监管目的(PDF、PNG、CSV等)

      数据沿袭用例

      数据沿袭可以帮助首席数据官遵守法规。它可以帮助业务分析师做出更准确的决策。它还可以帮助it部门减少手工绘制数据的时间,将更多的时间用于战略计划。特别是,数据沿袭可以在三个不同的用例中帮助大型企业:

      法规遵从性

      数据沿袭通过提供数据的完整视图,帮助企业遵守BCBS 239、GDPR和CCPA等法规。这允许您快速创建关于数据的报告,以便您可以更深入地了解数据,以达到监管目的。通过自动映射,您可以向监管机构显示您的数据在整个组织以及第三方数据源中的位置。这将为遵从性目的创建数据的完整视图。

      自助服务分析

      数据沿袭通过提供数据周围的重要上下文来实现更准确的分析和决策。业务分析人员可以查看上游和下游沿袭,以发现相关的数据上下文,例如源更改和使用情况。有了更多的上下文,业务分析人员可以确定数据资产是如何创建的以及它来自哪里。这确保了您用于做出业务决策的数据是准确、完整和可信的。

      影响分析

      数据沿袭使得在粒度级别上进行影响分析变得更加容易。数据谱系图允许您轻松地识别任何特定更改的上游和下游影响。您可以向下钻取并查看对表、列或业务报告级别的影响。

      其他用例

      除了这三个主要用例之外,数据探索和可行性、合理化和云迁移以及资产管理是数据沿袭可以提供帮助的另外三个用例。

      数据探索和可行性使您能够提高发现能力,以确保更准确的分析和决策。合理化和云迁移是数据沿袭的另一个大用例。它有助于规划和执行数据现代化计划(例如,DWH到云)通过识别和记录云迁移的关键数据元素。最后,数据沿袭可以帮助进行资产管理。它可以帮助您识别整个企业中最少和最可用的(和经过认证的)数据资产

      正如这六个用例所示,数据沿袭确实有助于整个企业。它通过提供必要的上下文来释放组织数据的价值,从而确保数字化转型。

      数据沿袭的类型

      有两种不同类型的数据沿袭——业务沿袭和技术沿袭。基本的数据沿袭解决方案只有业务沿袭;manbetx1.0下载更高级的数据沿袭工具同时具有业务和技术沿袭。业务脉络仅提供摘要视图。它显示了一个交互式地图,可以跟踪从源到报告的数据流。

      对于业务分析人员来说,业务谱系是一个重要的工具,业务分析人员希望查看数据的来源,以确保他们使用的数据来自可靠的来源,但不希望因数据中的每次更改而陷入困境。

      相比之下,详细的技术沿袭允许IT和数据架构师查看转换,向下钻取到表、列和查询级沿袭,并在它们的数据管道中导航。业务脉络和技术脉络一起提供了组织数据的整体视图,以便所有部门和角色中的数据公民都可以使用数据做出准确的业务决策。

      描述数据沿袭与组织各部分之间关系的图。

      如何在业务中使用数据沿袭

      如果没有自动化的数据沿袭,IT必须手动维护Excel电子表格中的沿袭。这意味着IT必须构建映射并使其保持最新状态,这需要花费大量时间,特别是对于具有分散在数据库和系统中的大量数据的企业。这种时间的浪费会导致经济损失并阻碍创新。使用数据沿袭工具,组织可以通过自动映射从源到目标的数据流来避免这个令人头痛的问题。这使整个业务能够了解数据的来源、转换方式及其准确性

      因此,自动化的数据沿袭为IT腾出了时间,使其能够专注于更具战略性的计划,并帮助业务部门做出更明智的决策。由于数据谱系提供了对数据关系的可见性,业务分析师将能够确保在业务分析中使用可信的数据,从而在整个组织中建立信心并从数据中提取价值。

      了解数据沿袭如何帮助组织释放其数据的价值。

      阅读数据谱系电子书

      相关资源狗万新闻c

      博客

      数据谱系图:信息架构师的范式转换

      博客

      业务谱系如何更快地完成工作

      博客

      DBA眼中的数据沿袭

      博客

      数据沿袭的最大好处

      查看所有资源狗万新闻c

      更多这样的故事

      2022年9月8日4最小值

      为什么需要企业数据目录

      阅读更多
      箭头
      2020年11月11日-3.最小值

      通过新的Power BI集成驱动协作和数据驱动决策

      阅读更多
      箭头
      2020年5月7日-7最小值

      数据智能的12个步骤:
      第2部分

      阅读更多
      箭头