虽然这些运营数据质量问题相当常见,但可以通过自动化、主动的监控轻松避免。
每个数据问题都可以分配时间序列指标,称为数据质量指标 ,可以持续计算并主动监控。 实际上是附加到数据层的 。 被视为异常的标准源自业务和数据所有者制定的服务水平目标 和 芬兰手机号码数据 服务水平协议 。
运营数据质量问题和与数据管道运营相关的 是通用的。例如, 可以是表的数据新鲜度(最新行的年龄)。此 的期望是数据管道运行和刷新表的节奏的规范。它可以是每小时、每天或每分钟。与衡量业务健康状况且往往具有主观性的 不同, 衡量数据操作的健康状况,并根据数据管道的规范进行明确评估。此外,前面提到的跟踪运营数据质量问题所需的 集是通用的 这意味着它们适用于数据管道,无论业务的垂直或具体情况如何。
由于 是通用的,因此平台可以提供内置 ,这些 可以在几乎无需配置的情况下在所有数据资产(表、视图和列)的数据管道上启用。它们可以在整个数据环境中快速部署质量检查,提供对数据异常的即时可见性和数据质量情报,以确保最高水平的数据健康。这使得数据团队能够以比传统数据质量解决方案快 倍的速度实现其数据质量覆盖目标。 的自定义配置可以轻松实现指标的微调,这样随着数据规模的扩大,任何不合规的数据或异常都会被 技术检测到并立即进行分析,最终为推动业务向前发展的最佳决策铺平道路。