数据智能的12个步骤:
第1部分

数据智能的12个步骤

总是有类比来描述数据的价值。英国数据科学家克莱夫·汉比(Clive Humby)将其称为推动现代商业的“新石油”。这个比喻持续了十多年,但有点迂腐,被嘲笑为错误的对等。例如,石油是由少数人储存的,而数据必须是无处不在和共享的。人们还将其与原子能甚至外层空间作了进一步的比较,指出了其无限的可能性和危险性。

我们认为,数据最像水:必不可少的、基本的、肯定生命的。可以肯定的是,它可能是泥泞和危险的。但当它清晰可控时,就变得至关重要。是的,水可能含有毒素,把你带下危险的急流,误导和迷惑你,等等。但毫无疑问,它贯穿于自然界的方方面面——人的和系统的——帮助生物不仅生存,而且茁壮成长。这就是数据的工作原理。它贯穿于所有公司的所有运营,帮助他们建立市场地位,支持创新和成功。这就是我们如何到达数据情报

对于一个公司来说,实现数据智能并没有“简单的按钮”。这需要众多团队的协调,需要领导层的支持,以及从a点到z点的清晰路径。我们制定了一个12步的流程,使这一过程尽可能清晰。在这个由五部分组成的系列文章中,我们将探索数据智能之旅。我们将开发一个真实的、容易理解的场景,以了解数据是如何推动关键决策和可采取行动的计划的,在每个里程碑处停下来整理情报,然后继续前进。

首先,让我们描绘一下场景。想象一下一家好公司的大好时机——销售额上升,新产品广受欢迎,前景一片光明。但在上个季度末,出现了一个黑点:客户流失。新客户不断涌入,这很好,但现有客户正在流失。没有人预料到这一点,如果董事会中还没有出现恐慌,那只是时间问题。投资者在问问题,而管理层还没有答案……

于是我们遇见了克里夫。"他被告知要找出问题所在:为什么客户要离开?他们有什么共同之处?当然,答案可以从数据中找到:有一种模式可以揭示流失的原因,并且可以指导业务计划以防止未来的损失。

这是一项至关重要的任务,但Cliff是一名业务分析师。为了完成他的工作,他需要正确的数据,他需要的是以思维的速度。但与许多公司一样,这是一个冒险的提议。数据由组织中的多个团队管理和保护。这里有一个样本…举几个例子。

  • 信息技术
  • 合规
  • 法律
  • 技术安全
  • 数据管理员/数据科学家
  • 金融

这是最基本的部落知识,为了突破这片沼泽,克利夫需要确定哪些数据是可用的,以及在哪里可以找到最好、最值得信赖的版本。授权访问需要安全,合规需要确保访问不违反行业规定,技术人员需要提取不同的来源和格式,数据科学家需要帮助建立血统和透明度,等等。

这就是为什么我们Collibra如此新万博移动客户端强烈地提倡数据民主,这是数字转型的真正支柱。数据必须属于每一个知识工作者或数据公民,以一种让业务专业人士以个人风格和优先级连接、沟通和协作的方式在系统中流动。它可以是随机的,也可以是自动化的,也可以是扩展的,也可以是重新聚焦的,但它必须是可信的和相关的。业务分析师,悬崖知道该做什么当他很好,值得信赖的数据,但是从哪里开始搜索,如何获得许可,谁能帮助提取和转换数据处理技术和SQL一样,Python, R,等什么时候,由谁来批准授予和担忧。

在某些方面,他和我们其他人一样——一个信息消费者,一个寻找正确数据的在线购物者。他想去浏览货架,比较不同的产品,把一些装进购物车,然后回家制定计划。他在生活中的其他活动中也是这样做的;为什么不能像这个练习一样简单呢?

随着舞台的设置,让我们跟随克里夫开始他的12步数据情报之旅…

步骤1:构建业务术语表

我们需要共同的语言来相互理解。这与国籍、编程工具甚至不同数据源无关。它指的是,在几乎任何一家规模可观的公司,都有多种方式来表达同一件事。企业中不同的用户使用相同的术语来表示不同的东西。例如,什么是Customer?你如何计算独特客户的数量?不管你问的是谁,你都会得到同样的答案吗?没有一个业务术语表,答案很可能是“不”。

这种差异引发了困惑:像Cliff这样的人无法找到他们需要的数据,或无法理解特定的分类,或无法调和不同数据集之间的差异。缺乏共同的理解会侵蚀信任,阻碍组织绩效,并挑战特定业务决策的可信度。

业务术语表成为公司的语义转换器。强迫大型组织中的每个人采用一种新语言不是一个选择;但是,通过语义翻译来帮助组织中的每个人学习如何与其他每个人沟通,将会带来清晰、高效和更大的理解。业务用户可以直觉地找到他们想要的东西,而不需要掌握表、字段、列名和元数据——实际上,他们自己也不需要成为数据科学家。通过提供所有业务术语及其相关数据、元数据和数据沿程的全面视图,它提高了透明度。

从任何角度和理解,Cliff都可以使用自然语言开始他的旅程。Cliff可以从“churn”这样的术语开始,不仅可以查看已批准的定义,还可以查看公司的所有部门、业务单位等如何定义它,哪种类型的数据最适合用来理解它,并使用Collibra的数据情报服务,新万博移动客户端克里夫将会发现哪里可以找到最好的数据来支持他的分析。

步骤2:建立数据域模型

每个公司,不管是上市公司还是私人公司,不管是盈利公司还是非营利公司,都有一个共同的需求,那就是确定他们的使命中最重要的东西。这些“东西”是公司的重点,通常用名词来描述最好,比如顾客、员工、产品和地点。我们称之为域,它们作为驱动您的业务并为您希望考虑的任何分析建立上下文的每个关键名词的逻辑表示。

让我们以Customer域为例。在任何规模的组织中,特别是向其客户提供多种产品或服务的组织中,您可能会发现两个或多个系统或应用程序捕获并存储关于客户的信息。很有可能,虽然它们存储了很多相同的信息,但这些不同的系统不会以相同的方式存储,也不会对相同类型的信息使用相同的名称。例如,假设部门A使用Salesforce实现Salesforce自动化,而部门B使用Netsuite CRM。这两个SFA解决方manbetx1.0下载案都捕获关于客户的信息,但它们的底层数据库并不以相同的方式组织或引用这些信息——通常称为属性或字段。Salesforce可能将出生日期引用为' DOB ',并将其存储在与客户名称相同的表中,而Netsuite CRM可能将其引用为' Birth_Date ',并将其存储在不包含客户名称的表中。

“客户”的逻辑表示有助于您的组织将部署在您的环境中的许多系统和应用程序之间的差异合理化,从而形成一个公共的或共享的描述和结构。就像Business Glossary提供了语义转换器一样,Domain模型也为您提供了对您的公司最重要的东西的一致和通用表示。而且,对于域模型中的每个逻辑属性或字段,您可以将其与Business Glossary术语关联起来,以帮助Cliff立即将自然语言术语(如“churn”)关联到数据智能图的起点。

您可以将许多东西与您的逻辑域关联起来,这些逻辑域将帮助您的组织在如何治理方面实现自动化并确保一致性,确保遵从性并在数据驱动的业务中提高生产率。例如,当您对Customer Domain建模时,您可以标识每个属于个人身份信息的逻辑属性,如全名、SSN、电子邮件地址等。这将有助于形成和确定在整个组织中使用、访问和监视数据的方式。

数据域位于数据智能宇宙的中心,并提供了与任何其他概念,数据,报告,算法,API或其他,在您的数据智能图管理的强大和传递关系。

步骤3:定义策略管理和引用管理

是什么数据治理?关于这一定义,有很多观点、文章和坚定的信念。许多都是自私自利的,大多数也不是完全错误或完全正确,但它们都有一个共同点,即数据治理是建立和实施以数据为中心的策略的实践。我们认为这些是正确的数据使用和管理的指南,有助于确保整个公司的一致性。

角色和职责,数据所有权、数据使用协议,保留和毁灭的政策,以及更多的框架作为执行和遵守规则,两个company-defined regulatory-defined,这样你的公司仍然是兼容的,有效的和值得信赖的,因为它涉及到所有数据实践。

虽然没有直接联系,但推动数据智能之旅的另一个基本概念是创建和管理一个健全的参考数据管理解决方案。参考数据是定义允许其他数据字段使用的值的数据。例如,当您在在线表单中输入地址时,您可能会被限制在国家列表中,而不是自由表单。这个国家清单是参考数据的一个例子。正如我们在域建模中讨论的,不同的系统和应用程序可能有不同的命名和组织数据字段的方法,因此不同的系统和应用程序可能使用不同的代码或值来定义它们的参考数据。将这些不同的代码和值映射到一个公共或共享的代码和值集,可以围绕不同的数据生态系统翻译和解释数据。

数据智能之旅的前三步并不性感,可能感觉有点累赘。也就是说,它们是绝对基础的,如果做得好,你就为长期的、战略性的数据情报项目打下了基础。忽略或草草完成这些基本步骤将会变成一个短命的战术项目,与任何带有“智慧”这个词的项目形成鲜明对比。

我们还有几个步骤要做,请继续关注。

想了解更多关于数据智能的知识吗?

请阅读我们下一篇关于数据情报的博客

相关资源狗万新闻c

电子书

介绍Collibra数据新万博移动客户端智能云

博客

数据智能的12个步骤:第3部分

博客

数据智能的12个步骤:第4部分

博客

数据智能的12个步骤:第5部分

1mantbex

更多像这样的故事

新万博移动客户端在Tableau用户大会上与洛克希德·马丁公司合作
2019年11月22日-3.最小值

概述:洛克希德·马丁公司的数据驱动之旅

阅读更多
箭头
管理业务术语表
2019年7月29日-2最小值

需要受治理的业务术语表的简单原因

阅读更多
箭头
业务术语表和GDPR
2018年1月10日-6最小值

数据保护manbetx1.0下载法规的两种解决方案

阅读更多
箭头