Đây là lệnh dumppdf có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi, chẳng hạn như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
dumppdf - kết xuất nội dung bên trong của tệp PDF
SYNOPSIS
kết xuất pdf [tùy chọn...] hồ sơhữu ích. Cảm ơn !
MÔ TẢ
kết xuất pdf kết xuất nội dung bên trong của tệp PDF ở định dạng giả XML. Chương trình này là
chủ yếu cho mục đích gỡ lỗi, nhưng cũng có thể trích xuất một số
nội dung
LỰA CHỌN
-a
Bán phá giá tất cả các đối tượng. Theo mặc định, chỉ có đoạn giới thiệu tài liệu được in.
-i objno [, objno, ...]
Chỉ định ID đối tượng PDF để hiển thị. ID được phân tách bằng dấu phẩy hoặc nhiều ID -i lựa chọn là
được chấp nhận.
-p pageno [, pageno, ...]
Chỉ định danh sách số trang được phân tách bằng dấu phẩy. Số trang
bắt đầu từ một. Theo mặc định, nó trích xuất văn bản từ tất cả các trang.
-r, -b, -t
Chỉ định định dạng đầu ra của nội dung luồng. Bởi vì nội dung của các đối tượng luồng
có thể rất lớn, chúng bị bỏ qua khi không có tùy chọn nào ở trên được chỉ định.
Với -r tùy chọn, nội dung luồng "thô" được kết xuất mà không cần giải nén. Với -b
tùy chọn, nội dung được giải nén được kết xuất dưới dạng một đốm màu nhị phân. Với -t tùy chọn,
nội dung giải nén được kết xuất ở định dạng văn bản, tương tự như repr () cách thức. Khi nào -r
or -b tùy chọn được đưa ra, không có tiêu đề luồng nào được hiển thị để dễ dàng lưu nó vào
tập tin.
-T
Hiển thị mục lục.
-P mật khẩu
Cung cấp mật khẩu người dùng để truy cập nội dung PDF.
-d
Tăng mức gỡ lỗi.
VÍ DỤ
Kết xuất tất cả các tiêu đề và nội dung, ngoại trừ các đối tượng luồng:
$ kết xuất pdf -a thi.pdf
Đổ mục lục:
$ kết xuất pdf -T kiểm tra.pdf
Trích xuất hình ảnh JPEG:
$ kết xuất pdf -r -i6 test.pdf> image.jpeg
Sử dụng dumppdf trực tuyến bằng các dịch vụ onworks.net