АнглийскийФранцузскийИспанский

Ad


Значок OnWorks

html2text - Интернет в облаке

Запустите html2text в бесплатном хостинг-провайдере OnWorks через Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS

Это команда html2text, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.

ПРОГРАММА:

ИМЯ


html2text - расширенный преобразователь HTML в текст

СИНТАКСИС


html2текст -Помощь
html2текст -версия
html2текст [ - нечеткий | -чек ] [ -отладка-сканер ] [ -отладка-парсер ] [ -rcfile путь ] [
Стиль ( компактный | довольно )] [ -ширина ширина ] [ -o выходной файл ] [ ручки ] [ -ascii |
-utf8 ] [ -номета ] [ входной файл ...]

ОПИСАНИЕ


html2текст читает HTML-документы из входной файлs, форматирует каждый из них в поток
обычные текстовые символы, и записывает результат в стандартный вывод (или в выходной файл, Если
домен -o используется опция командной строки).

Если нет входной файлs указаны в командной строке, html2текст читает со стандартного ввода.
Тире как входной файл - альтернативный способ указать стандартный ввод.

html2текст понимает все конструкции HTML 3.2, но может отображать только их часть из-за
ограничения формата вывода текста. Однако программа пытается обеспечить хорошее
заменяет элементы, которые он не может отобразить. html2текст тоже анализирует ввод HTML 4, но
не всегда так успешно, как другие обработчики HTML. Он также принимает синтаксически неверный
ввод, и пытается интерпретировать его «разумно».

Путь html2текст форматы HTML-документов контролируются свойствами форматирования read
из файла RC. html2текст попытки читать $ HOME / .html2textrc (или файл, указанный
домен -rcfile параметр командной строки); если этот файл не может быть прочитан, html2текст попытки читать
/ и т.д. / html2textrc. Если файл RC не может быть прочитан (или если файл RC не отменяет все
свойства форматирования), то предполагаются "разумные" значения по умолчанию. Формат файла RC:
Описанных в html2textrc(5) страница руководства.

Версия Debian html2текст также может выполнять перекодирование ввода и вывода (см.
/usr/share/doc/html2text/README.Debian для получения дополнительной информации). html2текст пытается получить кодировку
из HTML-документа. Если кодировка не указана, вы можете использовать -ascii и -utf8 настройки.
Вывод преобразуется в кодировку языка пользователя (LC_CTYPE).

ДОПОЛНИТЕЛЬНЫЕ УСЛУГИ, НЕ ВКЛЮЧЕННЫЕ В ПАКЕТ


-номета
По умолчанию версия Debian html2текст используйте мета-тег http-Equiv для ввода
перекодирование. Эта опция отменяет такое поведение.

-ascii По умолчанию, когда -номета в комплект поставки, html2текст использования UTF-8 для вывода.
Указав этот параметр, просто ASCII вместо этого используется. Чтобы узнать, как не-ASCII
отображаются символы, обратитесь к файлу "ascii.substitutes".

-utf8 По умолчанию, когда -номета в комплект поставки, html2текст использования ISO 8859-1 для входа.
Указав этот параметр, UTF-8 вместо этого используется (как для ввода, так и для вывода). Этот
вариант подразумевает ручки.

-чек Эта опция предназначена для диагностических целей: HTML-документ только анализируется, а не
обрабатывается иначе. В этом режиме работы html2текст сообщит о разборе
ошибок и ошибок сканирования, чего нет в других режимах работы. Обратите внимание, что
ошибки синтаксического анализа и сканирования не являются фатальными для html2текст, но может привести к неправильной интерпретации
HTML-кода и / или проглатываемых частей документа.

-отладка-парсер
Позволять html2текст сообщать о перемещаемых токенах, применяемых правилах и т. д., в то время как
сканирование HTML-документа. Эта опция предназначена для диагностических целей.

-отладка-сканер
Позволять html2текст отчет по каждому отсканированному лексическому токену при сканировании HTML
документ. Эта опция предназначена для диагностических целей.

-Помощь Распечатайте сводку командной строки и выйдите.

ручки По умолчанию оригинал html2текст отображает подчеркнутые буквы с такими последовательностями, как
"подчеркивание-символ-обратное-пробел" и жирные буквы, например "символ-обратный-пробел-
символ ". Из-за проблем с UTF-8 версия Debian html2текст не
производят обратные пробелы, поэтому эта опция действительно ничего не делает.

-o выходной файл
Запишите вывод в выходной файл вместо стандартного вывода. Тире как
выходной файл - альтернативный способ указать стандартный вывод.

-rcfile путь
Попытка прочитать файл, указанный в путь как файл RC.

Стиль ( компактный | довольно )
Стиль довольно изменяет некоторые значения параметров форматирования по умолчанию
задокументировано в html2textrc(5). Чтобы узнать, какой и как параметр форматирования
значения по умолчанию изменены, проверьте файл "pretty.style". Если этот параметр не указан,
стиль компактный предполагается по умолчанию.

- нечеткий
Эта опция предназначена для диагностических целей: вместо форматирования проанализированного документа
генерировать HTML-код, который гарантированно будет синтаксически правильным. Если html2текст
есть проблемы с синтаксическим анализом синтаксически неверного HTML-документа, этот параметр может помочь
ты понимаешь что html2текст думает, что означает исходный код HTML.

-версия
Распечатать версию программы и выйти.

-ширина ширина
По умолчанию html2текст форматирует HTML-документы для ширины экрана 79
символы. Если вы перенаправляете вывод в файл или если ваш терминал имеет ширину
кроме 80 символов, или если вы просто хотите понять, как html2текст сделки
с большими таблицами и разной шириной терминала вы можете указать
различный ширина.

Используйте html2text в Интернете с помощью сервисов onworks.net


Бесплатные серверы и рабочие станции

Скачать приложения для Windows и Linux

Команды Linux

Ad