源(高级)

我们感动!为了改善客户体验,Collibra数据质量用户指南已移至新万博移动客户端 新万博移动客户端Collibra文档中心 作为Collibra数据质量2新万博移动客户端022.11版本的一部分。为了确保无缝过渡, dq-docs.新万博移动客户端collibra.com 仍然可以访问,但DQ用户指南现在只在文档中心维护。
这是一个高级的可选功能

您的数据湖与上游系统是否一致?

将数据从一个系统复制到另一个系统可能是所有组织中最常见的数据活动。Owl将此称为源到目标。尽管这个活动听起来很简单,但Owl发现大多数时间文件和数据库表都没有被正确复制。为了确保和防止目标系统不同步或与原始源不匹配,请打开vs验证源与目标是否匹配。

行数是不够的……

我们遇到的最常见检查是行计数。但是,行计数不考虑:
  • 模式差异-布尔型到整型,十进制到双精度损失,时间戳和日期
  • 值差异——带空格的Char或Varchars vs字符串、空字符、导致移位的分隔符字段等等。

从向导创建的OwlCheck

Owl Wizard GUI创建下面的OwlCheck,它可以通过单击RUN或粘贴命令行从GUI执行。
自由/home/ec2-user/owl/drivers/valdrivers
司机org.postgresql.Driver
- u用户- p密码
- c" jdbc: postgresql: / / ec2 - 34 - 227 - 151 - 67. -计算- 1.——amazonaws.com: 5432 / postgres”
q"select * from public.dateseries "
- dspsql_dateseries2理查德·道金斯201811-07
-srcq选择Dz, sym as symz, high as highz, low as lowz, close as closez, volume as volumez, changed as changedz, changep as changepz, adjclose as adjclosez,开放来自lake.dateseries的openz
-srcu用户
-srcp密码
-srcdsmysqlSYMZ
-srcdcom.mysql.cj.jdbc.Driver
罢工" jdbc: mysql: / / owldatalake.chzid9w0hpyi.us -东- 1. rds.amazonaws.com: 3306 /湖”-valsrckey“SYMZ”
vs
-valsrcinc“dz, symz openz、highz lowz, closez, volumez, changedz, changepz, adjclosez”

结束一天的股票数据从Oracle到Mysql

在这个例子中,我们在Oracle和Mysql中加载NYSE_EOD数据,然后使用Owl的Source Validation特性。我们看到三种主要的问题。1)行计数被1行关闭,这意味着当数据被复制时,一行被删除或丢失。2)模式不完全匹配。3)在2种情况下,在单元级别的值是不同的。NULL vs NYSE, 137.4 vs 137.42

2.13+中的最新视图