simhash - Online w chmurze

Jest to komenda simhash, którą można uruchomić w darmowym dostawcy usług hostingowych OnWorks przy użyciu jednej z wielu naszych bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online MAC OS

PROGRAM:

IMIĘ


simhash - narzędzie do mieszania podobieństw plików

STRESZCZENIE


simhasz [ -s półpasiec ] [ -f nfunkcje ] [ filet ]
simhasz [ -s półpasiec ] [ -f nfunkcje ] -w filet ...
simhasz [ -s półpasiec ] [ -f nfunkcje ] -m filet ...
simhasz -c plik haszowy plik haszowy

OPIS


Ten program służy do obliczania i porównywania skrótów podobieństw plików. Hash podobieństwa
to porcja danych, która ma taką właściwość, jak pewna metryka odległości między plikami
proporcjonalna do pewnej metryki odległości między skrótami. Zwykle skrót podobieństwa
będzie znacznie mniejszy niż sam plik.

Algorytm używany przez simhasz jest algorytmem Manassasa „shingleprinting” (patrz BIBLIOGRAFIA
poniżej): weź skrót z każdego m-bajtowy podsekwencja pliku i zachowaj n tych
hasze, które są liczbowo najmniejsze. Rozmiar przecięcia zestawów skrótów
dwóch plików daje statystycznie dobre oszacowanie podobieństwa plików jako całości.

W trybie domyślnym, simhasz obliczy skrót podobieństwa swojego argumentu pliku (lub
stdin) i zapisz ten skrót na jego standardowe wyjście. Przy wywołaniu z -w argument (patrz
poniżej), simhasz obliczy skróty podobieństwa wszystkich argumentów pliku w „batch
tryb”. Po wywołaniu z -m argument (patrz poniżej), simhasz porówna wszystkie podane
pliki używające skrótów podobieństwa w „trybie dopasowania”. Wreszcie, po wywołaniu z -c argument
(patrz poniżej), simhasz zgłosi stopień podobieństwa między dwoma skrótami.

OPCJE


-f liczba funkcji
Podczas obliczania skrótu podobieństwa zachowaj co najwyżej liczba funkcji znaczące skróty
z pliku docelowego. Wartość domyślna to 128 funkcji. Większa liczba funkcji będzie
dać wyższą rozdzielczość w różnicach między plikami, zwiększy rozmiar pliku
hash podobieństwa proporcjonalnie do liczby cech i zwiększy podobieństwo
nieco skrócić czas obliczania skrótu.

-s rozmiar gontu
Podczas obliczania skrótu podobieństwa użyj skrótów próbek składających się z rozmiar gontu
kolejne bajty pobierane z pliku docelowego. Domyślnie jest to 8 bajtów, minimum
wynosi 4 bajty. Większe rozmiary gontów bardziej podkreślą różnice między pilnikami
i spowolni obliczanie skrótu podobieństwa proporcjonalnie do rozmiaru gontu.

-c plik hash1 plik hash2
Wyświetl odległość (znormalizowaną do zakresu 0..1) między skrótem podobieństwa
przechowywane w plik hash1 i przechowywany w nim skrót podobieństwa plik hash2.

-w filet ...
Napisz hash podobieństwa każdego z nich filet argumenty do plik.sim.

-m filet ...
Oblicz hash podobieństwa każdego z nich filet argumenty i wyprowadź podobieństwo
macierz dla tych plików.

Korzystaj z simhash online za pomocą usług onworks.net



Najnowsze programy online dla systemów Linux i Windows