这是命令 bup-margin 可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
bup-margin - 计算您的重复数据删除安全边际
概要
bup 保证金 [选项...]
商品描述
bup margin 遍历 bup 存储库中的所有对象,计算最大的
任意两个条目之间共享的前缀位数。 此数字 n 标识
您可以使用的最长 SHA-1 子集,但仍然会遇到对象之间的碰撞
身份证。
例如,一个经过测试的系统包含 11 万个对象 (70 GB),
并且 bup 保证金返回 45。这意味着 46 位哈希足以避免所有
该组对象之间的碰撞; 该存储库中的每个对象都可以是唯一的
由其前 46 位标识。
所需的位数似乎每增加一倍就增加大约 1 或 2
对象的数量。 由于 SHA-1 散列有 160 位,因此留有 115 位的余量。 的
当然,因为 SHA-1 散列本质上是随机的,理论上可以使用
更多的位和更少的对象。
如果您对 SHA-1 冲突的可能性感到偏执,您可以监控您的
通过偶尔运行 bup margin 来查看存储库是否危险地接近
到 160 位。
配置
- 预测
猜测特定对象将出现的每个索引文件的偏移量,以及
报告正确答案与猜测的最大偏差。 这是
可能对调整插值搜索算法有用。
--忽略-midx
不要使用 .midx 文件,只使用 .idx 文件。 这只有在使用时才真正有用
与--预测。
示例
$ bup 保证金
阅读索引:100.00% (1612581/1612581),完成。
40
40 个匹配前缀位
每倍增 1.94 位
剩余 120 位(61.86 倍)
4.19338e+18 倍是可能的
地球上每个人都可以拥有 625878182 个数据集
就像你的一样,都在一个存储库中,我们会
预计 1 个物体碰撞。
$ bup 保证金 --predict
PackIdxList:使用 1 个索引。
阅读索引:100.00% (1612581/1612581),完成。
915的1612581(0.057%)
使用 onworks.net 服务在线使用 bup-margin