GoGPT Best VPN GoSearch

Значок OnWorks

simhash - онлайн в хмарі

Запустіть simhash у постачальника безкоштовного хостингу OnWorks через Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

Це командний simhash, який можна запустити в постачальнику безкоштовного хостингу OnWorks за допомогою однієї з наших численних безкоштовних робочих станцій, таких як Ubuntu Online, Fedora Online, онлайн-емулятор Windows або онлайн-емулятор MAC OS

ПРОГРАМА:

ІМ'Я


simhash - хеш-інструмент подібності файлів

СИНТАКСИС


симхаш [ -s черепиця ] [ -f nособливості ] [ файл ]
симхаш [ -s черепиця ] [ -f nособливості ] -w файл ...
симхаш [ -s черепиця ] [ -f nособливості ] -m файл ...
симхаш -c хеш-файл хеш-файл

ОПИС


Ця програма використовується для обчислення та порівняння хешів схожості файлів. Хеш подібності
є фрагментом даних, який має властивість, що деяка метрика відстані між файлами
пропорційно деякій метриці відстані між хешами. Зазвичай хеш подібності
буде набагато меншим, ніж сам файл.

Алгоритм, який використовується симхаш є алгоритмом Манассаса «драйкування черепиці» (див. БІБЛІОГРАФІЮ
нижче): візьміть хеш кожного m- підпослідовність байтів файлу і зберігати n з них
хеші, які є чисельно найменшими. Розмір перетину хеш-наборів
два файли дають статистично хорошу оцінку подібності файлів в цілому.

У режимі за замовчуванням, симхаш обчислить хеш подібності свого аргументу файлу (або
stdin) і записати цей хеш у його стандартний висновок. При виклику з -w аргумент (див
нижче), симхаш обчислюватиме хеші схожості всіх своїх аргументів файлу в "batch
режим". При виклику за допомогою -m аргумент (див. нижче), симхаш порівняє все наведене
файли, що використовують хеші схожості в «режимі відповідності». Нарешті, при виклику з -c аргумент
(Дивись нижче), симхаш повідомить про ступінь подібності двох хешів.

ВАРІАНТИ


-f кількість функцій
Під час обчислення хешу подібності зберігайте щонайбільше кількість функцій значні хеші
з цільового файлу. За замовчуванням 128 функцій. Більша кількість функцій буде
надати більшу роздільну здатність у відмінності між файлами, збільшить розмір файлу
хеш схожості пропорційно кількості функцій і збільшить схожість
час обчислення хешування трохи.

-s розміром галька
Під час обчислення хешу схожості використовуйте хеші зразків, що складаються з розміром галька
послідовні байти, отримані з цільового файлу. За замовчуванням 8 байт, мінімум
становить 4 байти. Більші розміри черепиці більше підкреслять відмінності між файлами
і сповільнить обчислення хешу схожості пропорційно розміру шингл.

-c хеш-файл 1 хеш-файл 2
Відображення відстані (нормованої до діапазону 0..1) між хешем подібності
зберігається в хеш-файл 1 і хеш подібності, що зберігається в хеш-файл 2.

-w файл ...
Запишіть хеш подібності кожного з файл аргументи до file.sim.

-m файл ...
Обчисліть хеш подібності кожного з файл аргументи та вивести подібність
матриця для цих файлів.

Використовуйте simhash онлайн за допомогою служб onworks.net


Безкоштовні сервери та робочі станції

Завантажте програми для Windows і Linux

Команди Linux

Ad




×
реклама
❤️Робіть покупки, бронюйте або купуйте тут — безкоштовно, це допомагає зберегти послуги безкоштовними.