业务术语表在BI、分析和大数据中的价值

博客OpenBook

我一年前写过一篇关于TDAN.com的主要指示。简单地说,业务术语表主要指令是“消除整个企业的语义混乱。”消除语义混淆涉及到许多含义;对于数据治理,这意味着每个业务术语都有唯一的名称、单一的定义、值集、业务规则集、权威来源和确定的负责方。对于我们的分析项目,这意味着我们有一个单一的定义、价值集、一套业务和质量规则,以及所有业务维度和事实的权威来源。因此,让数据治理参与管理我们的分析维度和事实对分析项目的成功至关重要。

从我20多年执行分析项目的顾问生涯中,我发现BI分析成功面临挑战的一个重要根本原因与维度和事实的定义缺乏一致直接相关。哦,当然,我们都是认为我们对客户是什么或如何计算客户生命周期价值的看法是一致的,但我们经常.这就是为什么在我们的分析报告中,看似相同的指标却有相互矛盾的数字。然而,我们的不同定义本身都没有错,它们只是来自不同的观点,导致语义混乱。虽然问题可以简单地表述,但解决方案往往非常复杂,这就是为什么我们在没有数据治理的情况下很manbetx1.0下载难通过分析项目取得成功。

您的业务术语表应侧重于使所有分析流程和人员能够轻松地找到、理解和信任他们应该使用的数据,而不是他们不应该使用的数据。有效的治理允许正确的人在正确的时间使用正确的技术,为正确的业务目的使用正确的数据。如果定义、值集、业务规则、权威来源和使用限制不清楚,我们可能会错误地使用数据。我们可能会做出错误的决定,从而增加做生意的风险。如果没有很好地理解数据及其用途,我们可能会创建非常性感、技术上正确但非常不准确的报告。

我发现最有效的方法是从我们已经拥有或想要拥有的数据开始,包括维度和事实,在一组分析报告中。让我们称这些数据为关键数据元素(cde)。我们的业务和分析团队更容易讨论每个报告所需的cde。您可以将此方法用于数据分析师、业务经理和数据科学家。数据来源的类型与方法无关——数据可以来自数据湖、数据集市、应用程序,甚至是电子表格。

我们查看cde以确定工作的范围,实现治理的迭代的范围。此时的cde可以被讨论为报告上的数据、报告的组织和过滤、列、每个列的计算以及报告的摘要。我建议将数据治理过程标记为“根据需要进行治理”。您需要管理将包含在一个或一组报告中的CDE。这是一种非常实用的方法,似乎与业务团队产生了共鸣。使用这种方法,您可以控制治理项目的范围。尽量将范围保持在50-75个cde。这将允许您在两到四个月内完成实现。

你需要相对较短的实现时间框架:

  • 快速产生业务价值
  • 显示数据治理计划的进展
  • 在开发治理流程并对业务和技术人员进行流程和技术培训的同时显示进展
  • 建立易于理解和信任的报告
  • 减少相互矛盾的报道和政治问题
  • 持续改进整个企业语义问题的消除

同样,数据治理的目标是利用业务术语表帮助数据和报表使用者查找、理解和信任受治理的数据。

现在你可以说,太好了,洛厄尔,我有一些cde,但现在呢?我们如何在治理和认证BI/分析报告下获得批准的数据资产?”好吧,这就是你的答案。

cde为分析和数据治理团队提供了一个范围,它们并行工作以完成实现。我将重点讨论数据治理团队的活动,但两个团队必须一起工作。

一旦我们有了cde列表,那么数据治理团队就可以执行类似于下面的自上而下的治理工作:

  1. 与业务管理资源合作,将cde定义为业务资产并编制文档(定义业务资产)。狗万新闻c
      1. 每个CDE都应该在业务术语表中定义为一个业务术语。这既适用于分析维度和事实,也适用于计算或模型组件,即使它们没有持久化到数据库中。
      2. 缩写、业务规则、质量规则和质量阈值应该被记录。
      3. 定义了数据所有者、负责人员和业务管理员等角色。
      4. 任何具有安全性或隐私约束的CDE都应该在业务术语表中进行标记。
      5. 还应该定义标准和相关的策略。
  2. 与CDE源数据库/应用程序的技术管理资源合作,定义并记录物理数据资产和IT资狗万新闻c产(定义数据资产)。
      1. 所有持久化在数据库列中的CDE都将被记录为数据资产。
      2. 所有的物理特征、数据值、规则和域都应该被记录。
      3. 应该定义技术管理员、应用程序所有者等。
  3. 让业务和技术管理员将报表上的数据资产和列的关系映射到业务资产(映射业务和数据资产)。
      1. 需要对业务资产和数据资产进行分析,以确保所有资产都被映射,并且报表上的所有列都被定义为业务术语表中的资产。
      2. 我们可能会发现,我们错过了为每个数据资产定义业务资产。
      3. 我们可能拥有只是模型中的计算或组件的报表列,因此资产被映射到报表列的计算(例如百分比或平均值)。
      4. 应该定义技术管理员和负责任的个人。
  4. 记录数据资产的数据质量度量(确定符合目的的数据质量)。
      1. 应该使用在业务资产级别建立的业务规则来计算数据质量度量。
      2. 当一个业务资产映射到多个数据资产时,必须在每个物理源上计算数据质量。这将有助于管理员确定最权威的报告来源。
      3. 应与分析消费者讨论符合目的的数据质量,以确定信任数据使用所需的符合目的的质量期望。
      4. 数据管理员和所有者应该建立过程来满足适合目的的质量。
  5. 与主题专家或技术数据管理员合作,定义和记录数据资产的数据沿袭和可跟踪性(支持消费者理解信任)。
      1. 导入数据集成元数据以帮助定义沿袭和可跟踪性。
  6. 在报表目录中定义分析报表(在目录中定义关键报表)。
      1. 这就是分析开发团队和数据治理团队必须协调的地方。
      2. 报表目录是报表开发人员的职责,而不是数据治理团队的职责。我经常把这个责任交给业务团队或BI/分析团队。
      3. 自助式报告可以利用报表目录并增强目录。
  7. 记录每个报表中的所有报表元素或列,并将它们映射到数据资产或业务资产(定义报表元素、沿袭和可跟踪性)。这就完成了从业务资产到数据资产再到报告资产的映射。
      1. 请求报表开发人员定义报表元素、规则和任何计算。
      2. 请求报表开发人员让业务管理人员、技术管理人员和报表负责人批准报表元素、报表元素、数据资产、业务资产的谱系。
      3. 确保所有映射、资产、沿袭和可跟踪性都记录在业务术语表中。
      4. 请求管理人员和分析团队验证每个报告。鉴于我们知道数据和所有资产的完整可追溯性,我们可以认为报告是经过认证的。
      5. BI/分析报告的全面测试和验收也必须完成。对已记录资产的任何更改都必须在业务术语表和分析报告应用程序中进行更改。

哇,写在纸上很容易;然而,及时组织、沟通、教育并让资源完成数据治理活动并不是那么容易。狗万新闻c然而,如果您能够在BI/分析项目的协调下完成治理工作,那么您应该提供重要的价值,并且可能被认为更加成功。J别忘了,在你实现首要指令之前,这种成熟的一致性是必需的。并且,请记住:保持冷静,让您的业务术语表繁荣发展。

相关资源狗万新闻c

查看所有资源狗万新闻c

更多像这样的故事

这篇文章没有结果。