原生云

我们感动!改善客户体验,Collibra数据质量用户指南已经搬到新万博移动客户端 新万博移动客户端Collibra文档中心 作为Collibra数据质量2新万博移动客户端022.11发行版的一部分。为了确保无缝过渡, dq-docs.新万博移动客户端collibra.com 将继续访问,但DQ用户指南现在维护只在文档中心。

介绍原生云架构

根据原生云计算基础(“CNCF”)租船:
云本地技术授权组织构建和运行在现代可伸缩的应用程序,动态环境如公共,私人和混合云。容器、服务网格microservices、不变的基础设施和声明式api例证了这种方法。
这些技术使松散耦合的系统弹性,可管理和可观察到的。结合强大的自动化,他们让工程师高影响力变化频繁,可以预见的是用最少的辛劳。
新万博移动客户端Collibra数据质量全心全意拥抱这些原则在其设计和部署。下图描述了Collibra DQ的云本地部署架构:新万博移动客户端
在这个“形式”,您可以在任何公共或私有云部署Collibra DQ同时维护一新万博移动客户端个一致的体验,runbook性能和管理。

新万博移动客户端Collibra DQ microservices

实现原生云架构,Collibra DQ分解成几个组件,每个部署为micros新万博移动客户端ervice容器。
  • Owl Web——主要的入口点和Collibra DQ和最终用户之间的相互作用或集成的应用程序。新万博移动客户端Owl Web提供了丰富的、交互式的用户体验和一个健壮的自动化集成组api。
  • 猫头鹰代理——你能想到的代理Collibra DQ的“工头”。新万博移动客户端当用户或应用程序请求数据质量检查通过Owl Web,猫头鹰代理将元帅计算资源来执行工作。狗万新闻c猫头鹰代理不做任何数据质量工作。相反,它将请求提交的Owl Web的技术描述符的工作需要做,然后启动要求 DQ工作
  • 猫头鹰Metastore——这就是Collibra DQ新万博移动客户端商店所有的元数据,统计,和DQ工作的结果。也是重点的Owl Web和猫头鹰代理之间的通信。DQ metastore还包含结果的工作由瞬态容器(工人)计算空间。
  • 历史服务器——新万博移动客户端Collibra DQ依赖Apache火花扫描数据和执行数据质量的大部分活动。促进DQ的故障诊断和性能调优工作,Collibra DQ使用火花历史服务器的一个实例,使容易引发的访问日志。新万博移动客户端
  • 火花——Apache火花是分布式计算框架,权力Collibra DQ数据质量引擎。新万博移动客户端火花使DQ工作上升到数据质量tb级规模的数据集的任务。火花容器完全是短暂的,只有活只要完成一个给定的DQ所需的工作。

集装箱化

描述的二进制文件和指令集的每个Collibra DQ microservices码头工人容器中包含图片。新万博移动客户端每个图片的版本和维护安全云容器中注册中心存储库。启动Collibra DQ原新万博移动客户端生云部署,您必须首先获得凭证直接把容器或者下载到一个私人容器注册表。
支持Collibra D新万博移动客户端Q云本地部署仅限于部署从Collibra容器使用容器提供的注册表。
联系你的客户联系访问Collibra容器。新万博移动客户端

Kubernetes

Kubernetes容器是一种分布式调度程序,已成为原生云架构的同义词。当码头工人容器提供的逻辑在应用程序层和运行时,大多数应用程序仍然需要网络,存储,和编制多个主机之间为了功能。Kubernetes提供所有这些设施而抽象的复杂性,各种技术力量公共或私人云托管应用程序。

新万博移动客户端Collibra DQ执掌图表

目前Kubernetes提供了最清晰的路径来获得一个原生云架构的好处,这也是存在的一个更复杂的技术。这与Kubernetes与成分的复杂性技术本身,更多的是试图抽象。技术和分布式存储和软件定义网络覆盖整个地区的专业化,需要广泛的知识导航。Kubernetes平台实现隐藏所有这些复杂性,使任何人都可以利用这些强大的概念。然而,一个健壮的应用程序(如Collibra DQ需要许多描述符(k8新万博移动客户端体现)部署它的各种组件和所有必需的支持资源(如网络和存储。狗万新闻c
这就是执掌。领导是一个客户端实用工具(v3)以来,自动生成所需的所有描述符部署云本机应用程序。执掌接收指令的形式执掌图表包括模板化和参数化版本的Kubernetes体现。随着掌舵图表,您还可以传递参数,如工件的名称,连接细节,启用和禁用命令,等等。执掌解决了用户定义的参数中体现并提交他们Kubernetes部署。这使您能够部署应用程序不必详细了解网络,存储或计算支撑应用程序。
例如,下面的命令部署Collibra DQ与所有的组件中描述新万博移动客户端 原生云部署架构 图到谷歌Kubernetes引擎与谷歌云存储(GCS)火花日志的存储位置。唯一的特权是图像拉秘密,代表凭证来访问容器注册表,包含一个服务帐户的凭证和秘密访问GCS已经部署到名称空间。
执掌<名称> \升级——安装——名称空间
——设置global.version。猫头鹰= < owl-version > \
——设置global.version。火花= < owl-spark-version > \
——设置global.configMap.data。license_key = < owl-license-key > \
——设置global.spark_history。启用= true \
——设置global.spark_history。logDirectory = g: / /日志/ spark-history / \
——设置global.cloudStorage.gcs。enableGCS = true \
< deployment-name > \
/ / /图表/ owldq路径
完整的宇宙可能的自定义非常广泛,提供了很大的灵活性,以适用于各种各样的平台。然而,当一个已知的平台上部署(部的,GKE),所需的输入的数量是相当有限的。在一般情况下,您运行一个CLI命令包括基本参数如禁用历史服务器,配置日志的存储桶,指定图像库,等等。