副本(高级)

我们感动!改善客户体验,Collibra数据质量用户指南已经搬到新万博移动客户端 新万博移动客户端Collibra文档中心 作为Collibra数据质量2新万博移动客户端022.11发行版的一部分。为了确保无缝过渡, dq-docs.新万博移动客户端collibra.com 将继续访问,但DQ用户指南现在维护只在文档中心。
这是一个先进的可选特性

总分类帐。会计用例

你是否正在寻找一个模糊匹配百分比或单一客户清理,猫头鹰的重复检测可以帮助你和等级重复数据的可能性。
- f“文件:/ / / home / ec2-user / single_customer.csv”\
- d”、“\
- ds客户\
理查德·道金斯2018年01-08\
易受骗的人\
-dupenocase\
深度4

用户表有重复的用户输入

Carrisa轮辋vs Carrissa扩孔器

ATM客户数据,只有88%的比赛

正如您将在下面看到的,只有不到90%的比赛在大多数情况下是一个假阳性。每个数据集都是有点不同,但在许多情况下,你应该调整你的副本大概90 + %匹配有趣的发现。

简单的DataFrame示例