Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

hocr2djvused - Trực tuyến trên Đám mây

Chạy hocr2djvused trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh hocr2djvused có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


hocr2djvused - hOCR tới djvuse công cụ chuyển đổi tập lệnh

SYNOPSIS


hocr2djvuse [tùy chọn...] [tập tin hocr...]

MÔ TẢ


hocr2djvused đọc một hoặc nhiều hOCR[1] tệp (do bạch tuộc[2] hoặc Chữ hình nêm[3] hoặc
Tesseract[4]) và chuyển đổi chúng thành djvuse kịch bản.

Trừ khi tên tệp được cung cấp rõ ràng trên dòng lệnh, hOCR được đọc từ
đầu vào chuẩn.

LỰA CHỌN


bản văn phân khúc lựa chọn
-t dòng, --thông tin chi tiết dòng
Ghi lại vị trí của mọi dòng. Không ghi lại vị trí của các từ cụ thể hoặc
ký tự.

-t từ, --details = từ
Ghi lại vị trí của mọi dòng và mọi từ. Không ghi lại các vị trí cụ thể
ký tự.

Đây là mặc định.

-t xe tăng, --details = ký tự
Ghi lại vị trí của mọi dòng, mọi từ và mọi ký tự.

--word-segmentation = simple
Hãy coi mỗi dãy ký tự không có khoảng trắng là một từ duy nhất.

Đây là mặc định, mặc dù không chính xác về mặt ngôn ngữ.

--word-segmentation = uax29
Sử dụng Unicode bản văn PHÂN LOẠI[5] thuật toán ngắt dòng thành từ.

Tùy chọn này phá vỡ các giả định của một số công cụ DjVu rằng các từ được phân tách bằng dấu cách,
và do đó nó không được khuyến khích.

Nền tảng khác lựa chọn
--rotation =n
Giả sử rằng các trang DjVu được xoay vòng bởi n độ.

--page-size =chiều rộngxcao
Chỉ định rằng kích thước trang là chiều rộng pixel × cao pixel.

Tùy chọn này là bắt buộc đối với hOCR được tạo bởi Cuneiform (<0.8) và không cần thiết
nếu không thì.

--html5
Sử dụng HTML5 phân tích cú pháp[6], mạnh hơn nhưng chậm hơn trình phân tích cú pháp mặc định.

--fix-utf8
Cố gắng khắc phục sự cố mã hóa UTF-8 và loại bỏ các ký tự điều khiển không mong muốn.

Tùy chọn này có thể cần thiết cho hOCR được tạo bởi Cuneiform [7] hoặc Tesseract [8].

--phiên bản
Thông tin phiên bản đầu ra và thoát.

-h, --Cứu giúp
Hiển thị trợ giúp và thoát.

Sử dụng hocr2djvused trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad