To jest polecenie gocr, które można uruchomić w darmowym dostawcy usług hostingowych OnWorks przy użyciu jednej z wielu naszych bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online MAC OS
PROGRAM:
IMIĘ
gocr - narzędzie do rozpoznawania tekstu wiersza poleceń
STRESZCZENIE
gokr [OPCJA] [-i] plik-pnm
OPIS
gocr to program do optycznego rozpoznawania znaków, którego można używać z wiersza poleceń.
Pobiera dane wejściowe w formacie PNM, PGM, PBM, PPM lub PCX i zapisuje rozpoznany tekst do stdout.
Jeśli PNM filet jest pojedynczą kreską, z której odczytywane są dane PNM stdin. Jeśli gzip, bzip2 i netpbm-
progs są zainstalowane, a twój system obsługuje popować(3) także pnm.gz, pnm.bz2, png, jpg,
jpeg, tiff, gif, bmp, ps (tylko pojedyncze strony) i eps są obsługiwane jako pliki wejściowe (nie jako
strumień wejściowy), gdzie pnm można zastąpić jednym z ppm, pgm i pbm.
OPCJE
-h pokaż informacje o użytkowaniu
-i filet
przeczytaj wejście z filet (lub stdin if filet jest pojedynczą kreską)
-o filet
wyślij wyjście do filet zamiast stdout
-e filet
wyślij błędy do filet zamiast stderr lub stdout if filet jest kreską
-x filet
wyjście postępu do filet (filet może być nazwą pliku, nazwą fifo lub deskryptorem pliku
1...255), jest to przydatne dla programistów GUI, aby pokazać postęp OCR, plik
argument deskryptora jest dostępny tylko wtedy, gdy jest skompilowany ze zdefiniowanym __USE_POSIX
-p ścieżka
ścieżka bazy danych, należy dołączyć końcowy ukośnik, domyślnie jest to ./db/, ta ścieżka będzie
wypełniony obrazami wyuczonych postaci
-f format
wydajność format rozpoznanego tekstu (ISO8859_1 TeX HTML XML UTF8 ASCII), XML będzie
również dane wyjściowe dotyczące pozycji i prawdopodobieństwa
-l poziom
ustaw poziom szarości na poziom (0<160<=255, domyślnie: 0 dla automatycznego wykrywania), ciemniejsze piksele
należą do znaków, jaśniejsze piksele są interpretowane jako tło wejścia
obraz
-d rozmiar
ustaw rozmiar kurzu w pikselach (skupiska mniejsze od tego są usuwane), 0 oznacza nie
klastry są usuwane, domyślną wartością jest -1 dla automatycznego wykrywania
-s num ustaw odstęp między słowami w jednostkach kropek (domyślnie: 0 dla automatycznego wykrywania), szerszy
szerokości są interpretowane jako spacje słów, mniejsze jako spacje znaków
-v gadatliwość
być gadatliwym dla stderr; gadatliwość jest polem bitowym
-c ciąg
tylko pełne wyjście znaków z ciąg na stderr, generowane jest więcej danych wyjściowych
dla wszystkich znaków w łańcuchu znak podkreślenia oznacza nieznane znaki, to
Funkcja jest przydatna do ograniczenia informacji debugowania do niezbędnej
-C ciąg
rozpoznawać tylko znaki z ciąg, jest to funkcja filtrująca w przypadkach, gdy
zainteresowanie dotyczy tylko części alfabetu znaków, możesz użyć 0-9 lub az do
określ zakresy, użyj --, aby wykryć znak minus
-a pewność
ustaw wartość pewności rozpoznania (0..100; domyślnie: 95), znaki z a
większe pewności są akceptowane, postacie o niższej pewności są traktowane jako
nieznany (nierozpoznany); ustaw wyższe wartości, jeśli chcesz mieć tylko większą pewność
rozpoznane postacie
-u ciąg
wypisz ten ciąg dla każdego nierozpoznanego znaku (domyślnie to „_”)
-m tryb
ustawić tryb pracy; tryb to pole bitowe (domyślnie: 0)
-n bool
if bool jest różny od zera, rozpoznaje tylko liczby (jest to już przestarzałe, użyj -C
„0123456789”)
Szczegółowość jest określona jako pole bitowe:
1 wydrukuj więcej informacji
2 wyświetla kształty pól (patrz -c) na stderr
4 lista wzorców pól (patrz -c) na stderr
8 wydrukuj wzór po rozpoznaniu do debugowania
16 wypisz informacje debugowania o rozpoznawaniu linii na stderr
32 utwórz outXX.png z polami i liniami zaznaczonymi na każdym ogólnym kroku OCR
Tryby pracy to:
2 użyj bazy danych do rozpoznawania znaków, które nie są rozpoznawane przez inne
algorytmy, (wczesny rozwój)
4 włączenie analizy układu lub podziału na strefy (rozwój)
8 nie porównuj nierozpoznanych znaków z rozpoznanymi
16 nie próbuj dzielić nakładających się znaków na dwa lub trzy pojedyncze znaki
32 nie rób korekty kontekstu
64 pakowania znaków, przed rozpoczęciem rozpoznawania wyszukiwane są podobne znaki
i tylko jeden z tych znaków zostanie wysłany do mechanizmu rozpoznawania
(rozwój)
130 rozszerza bazę danych, pyta użytkownika o niezidentyfikowane znaki i rozszerza bazę danych
baza danych z odpowiedziami użytkowników (128+2, wczesny rozwój)
256 wyłącz silnik rozpoznawania (ma sens razem z -m 2)
Korzystaj z gocr online za pomocą usług onworks.net