Đây là lệnh pdftotext có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
pdftotext - Định dạng tài liệu di động (PDF) sang trình chuyển đổi văn bản (phiên bản 3.03)
SYNOPSIS
pdftotext [tùy chọn] [File PDF [tập tin văn bản]]
MÔ TẢ
văn bản pdf chuyển đổi các tệp Định dạng Tài liệu Di động (PDF) thành văn bản thuần túy.
Pdftotext đọc tệp PDF, File PDFvà viết một tệp văn bản, tập tin văn bản. Nếu tập tin văn bản
không được chỉ định, pdftotext chuyển đổi tập tin.pdf đến tập tin.txt. Nếu tập tin văn bản là ´- ', văn bản
được gửi đến stdout.
LỰA CHỌN
-f con số
Chỉ định trang đầu tiên để chuyển đổi.
-l con số
Chỉ định trang cuối cùng để chuyển đổi.
-r con số
Chỉ định độ phân giải, trong DPI. Mặc định là 72 DPI.
-x con số
Chỉ định tọa độ x của góc trên cùng bên trái của vùng cắt
-y con số
Chỉ định tọa độ y của góc trên cùng bên trái của vùng cắt
-W con số
Chỉ định chiều rộng của vùng cắt bằng pixel (mặc định là 0)
-H con số
Chỉ định chiều cao của vùng cắt theo pixel (mặc định là 0)
-bố trí
Duy trì (tốt nhất có thể) bố cục vật lý ban đầu của văn bản. Các
mặc định là bố cục vật lý ´undo '(cột, gạch nối, v.v.) và xuất
văn bản theo thứ tự đọc.
-đã sửa con số
Giả sử văn bản có cao độ cố định (hoặc dạng bảng), với chiều rộng ký tự được chỉ định (trong
điểm). Điều này buộc chế độ bố trí vật lý.
-nguyên Giữ văn bản theo thứ tự dòng nội dung. Đây là một bản hack thường "hoàn tác" cột
định dạng, v.v. Việc sử dụng chế độ thô không còn được khuyến khích.
-htmlmeta
Tạo một tệp HTML đơn giản, bao gồm thông tin meta. Điều này chỉ đơn giản là kết thúc
văn bản trong và và thêm các tiêu đề meta.
-bbox Tạo tệp XHTML chứa thông tin hộp giới hạn cho mỗi từ trong
tập tin.
-bbox-bố cục
Tạo tệp XHTML chứa thông tin hộp giới hạn cho từng khối, dòng,
và từ trong tệp.
-enc tên mã hóa
Đặt mã hóa để sử dụng cho đầu ra văn bản. Điều này mặc định là "UTF-8".
-nghec
Cho phép các bảng mã có sẵn
-eol unix | dos | mac
Đặt quy ước cuối dòng để sử dụng cho đầu ra văn bản.
-nopgbrk
Không chèn ngắt trang (ký tự nguồn cấp dữ liệu biểu mẫu) giữa các trang.
-ôi mật khẩu
Chỉ định mật khẩu chủ sở hữu cho tệp PDF. Cung cấp điều này sẽ bỏ qua tất cả
các hạn chế về bảo mật.
-upw mật khẩu
Chỉ định mật khẩu người dùng cho tệp PDF.
-q Không in bất kỳ tin nhắn hoặc lỗi nào.
-v In thông tin bản quyền và phiên bản.
-h In thông tin sử dụng. (-Cứu giúp và --Cứu giúp là tương đương.)
Sử dụng pdftotext trực tuyến bằng các dịch vụ onworks.net