这是名为 data-diff 的 Linux 应用程序,其最新版本可以作为 v0.9.7sourcecode.zip 下载。 它可以在免费的工作站托管提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为 data-diff 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
数据差异
商品描述
我们很高兴地宣布推出新的开源产品 data-diff,它可以在任何规模下快速比较跨数据库的数据集。 data-diff 自动执行数据复制和迁移的数据质量检查。 在现代数据平台中,数据不断在系统之间移动,在现代数据量和复杂性下,系统始终不同步。 直到现在,还没有任何工具可以确保数据何时被正确复制。 以低延迟和合理的基础架构成本大规模复制数百个表的数据是一个难题,我们与之交谈过的大多数数据团队都在其复制过程中面临数据质量问题。 残酷的事实是,复制的质量就是数据的质量。 由于在现代数据规模下批量复制整个数据集通常是不可行的,因此企业依赖于使用连续更新流复制数据的变更数据捕获 (CDC) 方法。
特性
- 跨数据库查找不匹配项
- 详细输出行的差异
- 用于创建监控和警报的简单 CLI/API
- 在 25 秒内验证 10M+ 行,在 ~1 分钟内验证 5B+ 行
- 跨许多不同的数据库进行验证
- 适用于具有 10 亿行的表
程式语言
Python
分类
这是一个也可以从 https://sourceforge.net/projects/data-diff.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便以最简单的方式从我们的免费操作系统之一在线运行。