概要(自动)

创建概要文件基于一个表、视图或文件
我们感动!改善客户体验,Collibra数据质量用户指南已经搬到新万博移动客户端 新万博移动客户端Collibra文档中心 作为Collibra数据质量2新万博移动客户端022.11发行版的一部分。为了确保无缝过渡, dq-docs.新万博移动客户端collibra.com 将继续访问,但DQ用户指南现在维护只在文档中心。
用户可以选择扫描整个数据集或用户可以自定义过滤选择深度(行过滤)和宽度(列)。

选择的范围

你可以找到详细的说明 选择的范围 探险家的部分。您可以运行限制,通过时间,如果你有足够的资源或全表扫描。狗万新闻c

选择选项(或离开违约)

保存/运行

配置文件是在默认情况下,新员工培训的数据集的一部分

查看结果

自动配置文件

新万博移动客户端Collibra数据质量自动配置文件数据随着时间的推移,使在详细见解自动化数据质量。一个概要文件只是第一步令人惊叹的自动发现。可视化的数据集,数据集如何如何改变。
新万博移动客户端Collibra DQ提供点击或代码选项运行分析。

数据集概要

新万博移动客户端Collibra数据质量管理下的每个数据集的创建一个详细的概要文件。这个概要文件将随后被用来提供洞察力和自动识别的数据质量问题。

叠加分析

新万博移动客户端Collibra DQ可以计算一个数据集的形象通过火花(默认)或数据仓库(概要叠加)生活的数据引擎。当概要文件计算使用数据源DBMS叠加的用户可以选择两个层次:
  • 完整的配置文件,执行完整的剖面计算TopN除外
  • 数,只有执行行和列的数量
下面的DBMS系统支持“剖面下推”
  • 黑斑羚
  • 蜂巢
  • 雪花
  • 转眼间
  • Teradata
  • SQL Server
  • Postgres
  • 红移
  • Mysql
  • 甲骨文
  • DB2
叠加和并行JDBC不能一起使用。如果您使用的是叠加,不选择平行JDBC选项。

概要的见解

通过收集各种不同的统计,Collibra DQ的资料可以提供大量的了解数据集。新万博移动客户端
看到基线(历史)和当前值的区别,Collibra DQ提供新万博移动客户端三角洲%改变列。三角洲的变化百分比列,用饼图表示数据的快速可视化的变化。
详细说明质量指标:
这个概要文件可以发现属性然后帮助描绘数字诉非数字发现周围的相对指标。
  • 满-[1]整数数据的百分比数值(或非数字)在一个数字(或非数字)发现列。
  • 混合- [String]整数非数字的百分比数据(或数字)在一个数字(或非数字)发现列。
  • 零-[]的比例数据,没有价值。
  • 空-(" ")的比例数据,有一个零长度的字符串实例。
概要文件包括一系列的统计数据
  • 实际数据类型
  • 发现数据类型
  • 零百分比
  • 空的百分比
  • 混合类型百分比
  • 基数
  • 最低
  • 最大
  • 的意思是
  • TopN / BottomN
  • 四分位值
  • 最小长度(字符串)
  • 最大长度(字符串)

敏感数据检测(语义)

新万博移动客户端Collibra共同PII数据质量可以自动识别任何类型的列。
新万博移动客户端Collibra数据质量能够检测PII以下类型的
  • 电子邮件
  • 电话
  • 邮政编码
  • 国家光盘
  • 信用卡
  • 性别
  • SSN
  • IP地址
  • 静脉
一旦发现,Collibra数据新万博移动客户端质量将标签列在这个概要文件自动发现的类型以及应用规则。如果用户可以选择拒绝任何发现标签只需点击确认删除操作。这个动作也可以删除与标记相关的规则。

相关矩阵(关系)

发现隐藏的关系,测量这些关系的力量。

柱状图

通常数据科学项目的第一步是段数据。新万博移动客户端这是否使用直方图自动Collibra数据质量。

数据预览

分析数据后,为这些用户提供适当的权利,Collibra数据质量提供的数据集。新万博移动客户端数据预览选项卡还提供了一些基本的见解,如强调数据的形状问题和异常值(如果启用),和列Filtergram可视化。