数据质量框架采用循环设计,包含四个阶段:
评估: 评估数据质量对组织的意义以及如何衡量数据质量。
设计: 通过选择一组数据质量流程和系统架构来设计合适的数据质量管道。
执行: 对现有和传入的数据执行设计的管道。
监控: 监控并分析数据质量问题,并测量数 比利时电话号码数据 据质量指标以确保它们保持在定义的阈值之上。
如何实施数据质量框架
由于数据质量对每个组织的意义不同,因此您不能在不同情况下使用相同的数据质量框架。在这里,我们将学习一个全面但通用的框架,供各种企业自行采用。让我们看看数据质量框架的四个阶段包括什么:
评估
该框架的第一部分涉及定义数据质量的含义(就来源、 元数据、数据质量指标)并评估现有数据的表现如何。
评估阶段执行的一些活动包括:
选择传入 数据源,例如 、营销工具、第三方供应商等。
选择 完成信息所必需的属性 ,例如客户姓名、电话号码、地址等。
定义 所选属性的数据类型、大小、模式和格式 ,例如电话号码应包含 位数字,并遵循以下模式:。
选择定义 可接受性标准的数据质量指标 ,例如客户偏好可以大约有 的准确性和 的完整性,但客户名称必须 的准确性和完整性。
运行 数据配置文件检查 来评估现有数据相对于定义的数据质量的表现如何。