优化项目整合内容

This commit is contained in:
2025-08-05 11:23:49 +08:00
parent 701a9a552e
commit 3f78ce7365
15 changed files with 898 additions and 2977 deletions

View File

@@ -1,6 +1,39 @@
"""
数据比较模块
负责两个数据集之间的比较、JSON处理和差异分析
数据比较引擎模块
================
本模块是BigDataTool的智能数据比较引擎提供高级的数据差异分析功能。
核心功能:
1. 数据集比较:生产环境与测试环境数据的精确比对
2. JSON智能比较支持复杂JSON结构的深度比较
3. 数组顺序无关比较:数组元素的智能匹配算法
4. 复合主键支持:多字段主键的精确匹配
5. 差异分析:详细的字段级差异统计和分析
6. 数据质量评估:自动生成数据一致性报告
比较算法特性:
- JSON标准化自动处理JSON格式差异空格、顺序等
- 数组智能比较:忽略数组元素顺序的深度比较
- 类型容错:自动处理字符串与数字的类型差异
- 编码处理完善的UTF-8和二进制数据处理
- 性能优化:大数据集的高效比较算法
支持的数据类型:
- 基础类型字符串、数字、布尔值、null
- JSON对象嵌套对象的递归比较
- JSON数组元素级别的智能匹配
- 二进制数据:字节级别的精确比较
- 复合主键:多字段组合的精确匹配
输出格式:
- 差异记录:详细的字段级差异信息
- 统计报告:数据一致性的量化分析
- 质量评估:数据质量等级和改进建议
- 性能指标:比较过程的性能统计
作者BigDataTool项目组
更新时间2024年8月
"""
import json