EngelsFransSpaans

Ad


OnWorks-favicon

simhash - Online in de cloud

Voer simhash uit in de gratis hostingprovider van OnWorks via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht simhash die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


simhash - hash-tool voor bestandsovereenkomst

KORTE INHOUD


simhash [ -s gordelroos ] [ -f kenmerken ] [ filet ]
simhash [ -s gordelroos ] [ -f kenmerken ] -w filet ...
simhash [ -s gordelroos ] [ -f kenmerken ] -m filet ...
simhash -c hashbestand hashbestand

PRODUCTBESCHRIJVING


Dit programma wordt gebruikt om gelijkenis-hashes van bestanden te berekenen en te vergelijken. Een gelijkenis-hash
is een stuk gegevens dat de eigenschap heeft dat er een afstandsmetriek tussen bestanden is
evenredig met enige afstandsmetriek tussen de hashes. Typisch de gelijkenis-hash
zal veel kleiner zijn dan het bestand zelf.

Het algoritme dat wordt gebruikt door simhash is het "shingleprinting"-algoritme van Manassas (zie BIBLIOGRAFIE
hieronder): neem een ​​hasj van elke m-byte subreeks van het bestand, en bewaar de n van deze
hashes die numeriek het kleinst zijn. De grootte van het snijpunt van de hash-sets van
twee dossiers geeft een statistisch goede schatting van de gelijkenis van de dossiers als geheel.

In de standaardmodus, simhash berekent de gelijkenis-hash van zijn bestandsargument (of
stdin) en schrijf deze hash naar de standaarduitvoer. Wanneer aangeroepen met de -w betoog (zie
onderstaand), simhash zal gelijkenis-hashes berekenen van al zijn bestandsargumenten in "batch
mode". Wanneer aangeroepen met de -m argumentatie (zie hieronder), simhash zal alle gegeven vergelijken
bestanden die gelijkenis-hashes gebruiken in "match-modus". Ten slotte, wanneer aangeroepen met de -c argument
(zie hieronder), simhash rapporteert de mate van overeenkomst tussen twee hashes.

OPTIES


-f aantal functies
Bewaar bij het berekenen van een gelijkenis-hash maximaal aantal functies significante hashes
uit het doelbestand. De standaardwaarde is 128 functies. Grotere functieaantallen zullen dat wel doen
geeft een hogere resolutie in verschillen tussen bestanden, vergroot de grootte van de
gelijkenis hash proportioneel aan het aantal functies, en zal de gelijkenis vergroten
hash-berekeningstijd enigszins.

-s grind-formaat
Gebruik bij het berekenen van een gelijkenis-hash hashes van samples bestaande uit grind-formaat
opeenvolgende bytes getrokken uit het doelbestand. De standaard is 8 bytes, het minimum
is 4 bytes. Grotere shingle-afmetingen zullen de verschillen tussen vijlen meer benadrukken
en zal de gelijkenis-hash-berekening evenredig vertragen met de grootte van de kiezelsteen.

-c hashbestand1 hashbestand2
Geef de afstand weer (genormaliseerd naar het bereik 0..1) tussen de gelijkenishash
opgeslagen in hashbestand1 en de gelijkenis-hash die erin is opgeslagen hashbestand2.

-w filet ...
Schrijf de gelijkenis-hash van elk van de filet argumenten om bestand.sim.

-m filet ...
Bereken de gelijkenis-hash van elk van de filet argumenten en voer een overeenkomst uit
matrix voor die bestanden.

Gebruik simhash online met behulp van onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

Linux-commando's

Ad