AnglaisFrançaisEspagnol

Ad


Icône de favori OnWorks

simhash - En ligne dans le Cloud

Exécutez simhash dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit de la commande simhash qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

PROGRAMME:

Nom


simhash - outil de hachage de similarité de fichier

SYNOPSIS


simuler [ -s bardeaux ] [ -f ncaractéristiques ] [ filet ]
simuler [ -s bardeaux ] [ -f ncaractéristiques ] -w filet
simuler [ -s bardeaux ] [ -f ncaractéristiques ] -m filet
simuler -c fichier de hachage fichier de hachage

DESCRIPTION


Ce programme est utilisé pour calculer et comparer les hachages de similarité des fichiers. Un hachage de similarité
est un bloc de données qui a la propriété qu'une métrique de distance entre les fichiers est
proportionnel à une certaine distance métrique entre les hachages. Typiquement le hachage de similarité
sera beaucoup plus petit que le fichier lui-même.

L'algorithme utilisé par simuler est l'algorithme de « shingleprinting » de Manassas (voir BIBLIOGRAPHIE
ci-dessous) : prenez un hachage de chaque m-byte sous-séquence du fichier, et conserver le n de ceux-ci
hachages qui sont numériquement les plus petits. La taille de l'intersection des ensembles de hachage de
deux fichiers donne une bonne estimation statistique de la similarité des fichiers dans leur ensemble.

Dans son mode par défaut, simuler calculera le hachage de similarité de son argument de fichier (ou
stdin) et écrivez ce hachage sur sa sortie standard. Lorsqu'il est invoqué avec le -w argumentation (voir
au dessous de), simuler calculera les hachages de similarité de tous ses arguments de fichier dans "batch
mode". Lorsqu'il est invoqué avec le -m argumentaire (voir ci-dessous), simuler comparera tous les donnés
fichiers utilisant des hachages de similarité en « mode de correspondance ». Enfin, lorsqu'il est invoqué avec le -c argument
(voir ci-dessous), simuler rapportera le degré de similitude entre deux hachages.

OPTIONS


-f nombre de fonctionnalités
Lors du calcul d'un hachage de similarité, conservez au plus nombre de fonctionnalités hachages significatifs
du fichier cible. La valeur par défaut est 128 fonctionnalités. Un plus grand nombre de fonctionnalités sera
donner une résolution plus élevée dans les différences entre les fichiers, augmentera la taille du
hachage de similarité proportionnellement au nombre de caractéristiques, et augmentera la similarité
hacher légèrement le temps de calcul.

-s taille de bardeau
Lors du calcul d'un hachage de similarité, utilisez des hachages d'échantillons constitués de taille de bardeau
octets consécutifs tirés du fichier cible. La valeur par défaut est de 8 octets, le minimum
est de 4 octets. Des tailles de bardeaux plus grandes mettront davantage l'accent sur les différences entre les fichiers
et ralentira le calcul du hachage de similarité proportionnellement à la taille du bardeau.

-c fichier de hachage1 fichier de hachage2
Afficher la distance (normalisée à la plage 0..1) entre le hachage de similarité
stocké dans fichier de hachage1 et le hachage de similarité stocké dans fichier de hachage2.

-w filet
Écrivez le hachage de similarité de chacun des filet arguments à fichier.sim.

-m filet
Calculer le hachage de similarité de chacun des filet arguments et afficher une similarité
matrice pour ces fichiers.

Utilisez simhash en ligne en utilisant les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad