Это команда hxpipe, которую можно запустить в бесплатном хостинг-провайдере OnWorks, используя одну из наших многочисленных бесплатных онлайн-рабочих станций, таких как Ubuntu Online, Fedora Online, онлайн-эмулятор Windows или онлайн-эмулятор MAC OS.
ПРОГРАММА:
ИМЯ
hxpipe - конвертировать XML-файл в формат, который легче анализировать с помощью Perl или AWK
СИНТАКСИС
hxpipe [ -l ] [ -- ] [ файл или URL ]
ОПИСАНИЕ
hxpipe анализирует файл HTML или XML и выводит его строчно-ориентированное представление, которое
хорошо подходит для дальнейшей обработки с помощью AWK или аналогичных инструментов. Формат похож на
ESIS (набор информации о структуре элементов), который выводится nsgmls / onsgmls.
Обратная операция - обратное преобразование в наценку - выполняется Hxunpipe программу.
Формат вывода следующий:
Комментарии выводятся как
*комментарий
Т.е. единственная строка, начинающаяся с "*", за которой следует текст комментария. Линия
каналы, символы возврата каретки и табуляции в тексте записываются как "\ n", "\ r" и "\ t",
соответственно. Текст, который выглядит как числовой символ, записывается с помощью
"&" заменено на "\". Строка заканчивается переводом строки.
Обратите внимание, что onsgmls выводит комментарии, начинающиеся с "_" вместо "*" и
не заменяет "&" числовых символов на "\" (и по умолчанию
он полностью опускает комментарии).
Инструкции по обработке выводятся как
инструкция по обработке
Т.е. единственная строка, начинающаяся с "?" за которым следует текст обработки
инструкция. Текст экранирован, как для комментариев (см. Выше).
<!DOCTYPE root PUBLIC "-//foo//DTD bar//EN" "http://example.org/dtd">
DOCTYPE выводятся как одно из следующих:
! root "- // foo // DTD bar // EN" http://example.org/dtd
! root "- // foo // DTD bar // EN"
!корень "" http://example.org/dtd
!корень ""
для соответственно: DOCTYPE с (1) как общедоступным, так и системным идентификатором, (2)
только публичный идентификатор, (3) только системный идентификатор или (4) ни один из
два. То есть, одна строка, начинающаяся с "!", За которой следует пробел и, возможно,
пустая строка в кавычках, за которой, возможно, следует пробел и произвольный текст. Обратите внимание
котировки для публичного идентификатора и отсутствие котировок для системы
идентификатор.
Начальный тег выводится как
Aatt1 Значение CDATA1
Aatt2 Значение CDATA2
(элт
Т.е. как ноль или более строк для атрибутов и одна строка для элемента
тип. Каждая строка атрибута начинается с буквы «А», за которой следует имя
атрибут, пробел, буквальная строка "CDATA", еще один пробел и атрибут
ценить. Текст значения атрибута экранирован, как и в комментариях (см. Выше).
Строка для типа элемента начинается с символа «(», за которым следует тип элемента.
hxpipe не читает DTD и предполагает, что атрибуты всегда являются CDATA. Это никогда
генерирует другие типы (ПОДРАЗУМЕВАЕМЫЕ, ТОКЕН, ID и т. д.), в отличие от onsgmls.
Конечные теги выводятся как
) elt
Т.е. в виде строки, начинающейся с ")", за которой следует тип элемента.
Пустые элементы (в XML) выводятся как
Aatt1 CDATA значение1
Aatt2 CDATA значение2
| пусто
Т.е. как ноль или более строк для атрибутов и одна строка, начинающаяся с "|"
за которым следует тип элемента.
Обратите внимание, что онсгмлс никогда не выводит "|". (Однако при желании он может выводить строку
состоящий из одной буквы "e" непосредственно перед строкой "(", чтобы указать, что
элемент пуст.)
текст Текст выводится как
-текст
Т.е. как одинарная строка, начинающаяся с "-". Текст экранирован как для комментариев
(см. выше).
номера строк
Когда -l опция действует, hxpipe будет перемежать вывод строками
формы
L12
где "12" заменяется номером строки в источнике, где следующий вывод
пришли из.
hxpipe не нормализует ввод и не добавляет ошибочные теги. Таким образом, возможно, что
есть неравное количество строк "(" и ")". Если важно, чтобы каждый начальный тег был
соответствует конечному тегу, перенаправить ввод через нормировать -x первый.
ДОПОЛНИТЕЛЬНЫЕ ОПЦИИ
Поддерживаются следующие варианты:
-l Добавьте «L» строк к выходным данным, чтобы указать номера строк в источнике.
ОПЕРАНДЫ
Поддерживается следующий операнд:
файл или URL
Имя или URL-адрес HTML-файла. Если он отсутствует, вместо него читается стандартный ввод.
ВЫХОД статус
Возвращаются следующие значения выхода:
0 Успешное завершение.
> 0 Произошла ошибка при синтаксическом анализе HTML-файла. hxpipe постараюсь исправить
ошибка и все равно выводить.
ОКРУЖАЮЩАЯ СРЕДА
Чтобы использовать прокси для получения удаленных файлов, установите переменные среды http_proxy и
ftp_proxy. Например, http_proxy = "http://localhost: 8080 / "
Используйте hxpipe онлайн с помощью сервисов onworks.net