Это команда pdftotext, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
pdftotext - конвертер переносимого документа (PDF) в текст (версия 3.03)
СИНТАКСИС
pdftotext [параметры] [PDF-файл [текстовый файл]]
ОПИСАНИЕ
PDFtotext конвертирует файлы Portable Document Format (PDF) в простой текст.
Pdftotext читает файл PDF, PDF-файл, и записывает текстовый файл, текстовый файл. Если текстовый файл
не указан, pdftotext преобразует file.pdf в file.txt. Если текстовый файл это «- », текст
отправляется на стандартный вывод.
ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ
-f номер
Задает первую страницу для преобразования.
-l номер
Задает последнюю страницу для преобразования.
-r номер
Задает разрешение в точках на дюйм. По умолчанию 72 DPI.
-x номер
Задает координату x верхнего левого угла области обрезки.
-y номер
Задает координату Y верхнего левого угла области обрезки.
-W номер
Задает ширину области кадрирования в пикселях (по умолчанию 0)
-H номер
Задает высоту области кадрирования в пикселях (по умолчанию 0)
-разметка
Сохраняйте (насколько это возможно) исходное физическое расположение текста. В
по умолчанию используется физический макет «отменить» (столбцы, расстановка переносов и т. д.) и выводить
текст в порядке чтения.
-фиксированный номер
Предположим, что текст с фиксированным шагом (или табличным) с указанной шириной символа (в
точки). Это вызывает режим физического макета.
-сырой Сохраняйте текст в порядке потока контента. Это уловка, которая часто "отменяет" столбец
форматирование и т. д. Использование необработанного режима больше не рекомендуется.
-htmlмета
Создайте простой HTML-файл, включая метаинформацию. Это просто обертывает
текст в а также и добавляет мета-заголовки.
-ббокс Создайте файл XHTML, содержащий информацию об ограничивающей рамке для каждого слова в
.
-bbox-макет
Создайте файл XHTML, содержащий информацию об ограничивающей рамке для каждого блока, строки,
и слово в файле.
-enc имя-кодировки
Устанавливает кодировку для вывода текста. По умолчанию используется "UTF-8".
-слушай
Подсвечивает доступные кодировки
-эол Юникс | внутри | макинтош
Устанавливает соглашение о конце строки для использования при выводе текста.
-нопгбрк
Не вставляйте разрывы страниц (символы канала формы) между страницами.
-опв password
Укажите пароль владельца для файла PDF. Это позволит обойти все
ограничения безопасности.
-вверх password
Укажите пароль пользователя для файла PDF.
-q Не печатайте никаких сообщений или ошибок.
-v Распечатать информацию об авторских правах и версии.
-h Распечатайте информацию об использовании. (-Помощь и --Помогите эквивалентны.)
Используйте pdftotext в Интернете с помощью сервисов onworks.net