数据治理 · Great Expectations
Great Expectations:开源数据质量框架
基于 Expectation 的校验、文档与管道集成
Great Expectations 是开源数据质量框架,用 Expectation 定义校验规则,生成数据文档,并可集成到 ETL/ELT/编排管道,适合自托管与云端使用。
Expectation 规则
丰富预置与自定义校验,覆盖模式、范围、唯一性等。
数据文档
自动生成数据概况与验证报告,便于沟通。
管道集成
与 Airflow/dbt/Prefect 等编排工具集成。
开源与云
开源自托管,亦有云服务选项。
适用场景 / Use cases
- 批处理质量校验
- 入仓前检查
- 数据文档化
- 管道中的质量门控