angielskufrancuskihiszpański

Uruchom serwery | Ubuntu > | Fedora > |


Ulubiona usługa OnWorks

herold - Online w chmurze

Uruchom herolda u dostawcy bezpłatnego hostingu OnWorks przez Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS

To jest komenda, którą można uruchomić u dostawcy darmowego hostingu OnWorks przy użyciu jednej z naszych wielu darmowych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS

PROGRAM:

IMIĘ


herold - konwerter HTML na DocBook

STRESZCZENIE


herold [OPCJE]

OPIS


Częstym problemem jest ponowne wykorzystanie treści HTML w formie neutralnej dla prezentacji. Jeden możliwy
rozwiązaniem jest konwersja HTML do DocBook XML, ponieważ DocBook jest semantycznym językiem znaczników
do dokumentacji, która umożliwia użytkownikom tworzenie treści dokumentów, które przechwytują
logiczna struktura treści. Narzędzie wiersza poleceń herold może być użyte do konwersji HTML
do DocBooka. Ponieważ elementy HTML są często używane niezgodnie z przeznaczeniem, możliwości
taka transformacja jest nieco ograniczona. herold jest częścią pakietu narzędzi dbdoclet.
po więcej informacji odwiedź http://www.dbdoclet.org.

OPCJE


--docbook-dodaj-indeks, -x
Automatycznie dodaj element indeksu na końcu dokumentu.

--docbook-decompose-tables, -T
Rozkłada tabele z kodu HTML na pojedyncze akapity. To może być przydatne,
jeśli dokument zawiera wiele tabel ze względu na formatowanie.

--kodowanie-docbook, -d
Określa kodowanie wygenerowanych plików DocBook XML.

--docbook-element-główny, -r
Główny element dokumentu. Możliwe wartości to: książka, artykuł, odniesienie, część,
rozdział lub sekcja. Domyślna wartość tej opcji to „artykuł”

--docbook-tytuł, -t
Tytuł wynikowego dokumentu.

--w, -i
Określa plik wejściowy HTML.

--pomoc, -h
Drukuje stronę pomocy na konsoli.

--kodowanie-html, -s
Określa kodowanie plików źródłowych HTML, np. ISO-8859-1.

--out, -o
Określa plik docelowy XML DocBook.

--profil, -p
Plik profilu z predefiniowanymi ustawieniami.

--gadatliwy, v
Włącza szczegółowość danych wyjściowych konsoli.

--wersja, -V
Wyświetla wersję herolda.

KONFIGURACJA


Szczegóły transformacji są kontrolowane przez plik profilu. Plik profilu oferuje
więcej możliwości wpływania na transformację niż argumenty wiersza poleceń. ten
Poniższy przykład pokazuje typowy plik profilu.

transformacja html2docbook;

sekcja-wykrywanie sekcji {
klasa-atrybutu = ["^MsoHeading(\d+)$"];
section-numbering-pattern = "((\d+\.)+)?\d*\.?\p{Z}*";
}

wykrywanie listy sekcji {
itemized-attribute-class = ["^MsoListBullet(\w*)$", "Aufzhlung(\w+)$];
itemized-strip-prefix = [ "-", "o", "\u00b7" ];
order-attribute-class = ["^MsoListNumbered(\w*)$"];
zamówiony-strip-prefix = [ "\d+\.\s+" ];
}

sekcja HTML {
kodowanie = "windows-1252";
wyklucz = [ "//p[starts-with(@class, 'MsoToc')]", "" ];
}

sekcja DocBook {
streszczenie = """ Lorem ipsum
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed
do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut
enim ad minim veniam, quis nostrud exercitation ullamco laboris
nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in
reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla
pariatur. Excepteur sint occaecat cupidatat non proident, sunt in
culpa qui officia deserunt mollit anim id est laborum.sed, dolor
spotkałem. """;
indeks-dodatku = prawda;
e-mail autora = "ja@gdzieś.de";
imię-autora = "Michael";
nazwisko-autora = "Fuchs";
Zwiń chronione spację = "prawda";
właściciel praw autorskich = "Ingenieurbüro Michael Fuchs";
rok-prawa autorskiego = "2012";
korporacja = "";
atrybut-warunku-utworzenia = fałsz;
tworzenie-prologu = prawda;
create-remap-attribute = false;
utwórz etykietę-odnośnika = fałsz;
decompose-tables = false;
wykryj-uwięziony-br = prawda;
identyfikator-dokumentacji = "doc01";
element-dokumentu = "książka";
kodowanie = "UTF-8";
dzielnik-znak = "łącznik miękki";
formaty danych obrazu = [ "gif", "base64" ];
ścieżka-obrazu = "./figury";
język = "de";
informacje o wydaniu = "Wersja 3.1";
styl tabeli = "wszystkie";
tytuł = "Samouczek";
tytuł-normalizacja-spacja = prawda;
użyj absolutnej ścieżki obrazu = fałsz;
}

Składnia
Plik profilu składa się głównie z sekcji. Sekcje służą do grupowania parametrów, które:
mają ten sam kontekst. Każda sekcja musi zaczynać się od słowa kluczowego Sekcja a następnie
nazwa sekcji. Po nazwie pojawia się blok parametrów, który jest otoczony przez
nawiasy klamrowe. Parametry mogą być typu String, Number, Boolean lub Array. Ciągi muszą być
obramowane podwójnymi cudzysłowami. Jeśli ciąg zawiera znaki nowej linii, użyj trzech podwójnych cudzysłowów
zamiast jednego. Tablice są otoczone nawiasami kwadratowymi. Wewnątrz tablicy elementy muszą:
być oddzielone przecinkami. Każde zadanie musi być zakończone średnikiem. Komentarze wielowierszowe
mieć formę /* my komentarz */ , komentarze jednowierszowe wyglądają jak // my komentarz\n.

Obowiązkowy Elementy
Profil dla herolda musi zaczynać się od transformacji linii html2docbook;.

Sekcja wykrywanie sekcji
Sekcja wykrywanie sekcji służy do wykrywania elementów sekcji w kodzie HTML i do stripowania
wyłączyć wszelkie przedrostki numeracji z tytułów.

Wiele narzędzi autorskich pozwala na głęboko zagnieżdżone sekcje. Podczas eksportu HTML zdarza się, że
zagnieżdżenie staje się głębsze niż sześć poziomów. HTML zapewnia elementy nagłówka dla maksymalnie sześciu
poziomy, h1-h6, ale nie h7 ani nawet więcej. W tym momencie formatowanie odbywa się zwykle za pomocą
za pomocą CSS i elementów div lub p. herold jest w stanie wykryć element nagłówka
HTML, ale nie może wiedzieć o formacie eksportu określonego narzędzia. Aby rozwiązać ten problem
problem nawet w niektórych przypadkach można określić parametr klasa-atrybutów. Składa się ona z
lista wyrażeń regularnych, które są dopasowywane do atrybutu class każdego HTML
element. Jeśli zostanie znalezione dopasowanie, element jest traktowany jako element sekcji. Regularny
wyrażenie może mieć grupę, która jest interpretowana jako wskaźnik poziomu. Grupa musi być
pierwszą grupę i musi odpowiadać liczbie, np. ^heading(\d+)$. Jeśli poziom nie może
zostanie wykryty, zakłada się poziom siedmiu.

Ponieważ arkusze stylów DocBook XSL dbają o numerację sekcji podczas przekształcania
DocBook XML do określonego wyjścia, często konieczne jest już usunięcie numeracji
zdefiniowane na stronie HTML. W przeciwnym razie skończysz z dwoma tekstami numeracyjnymi przed twoim
tytuły. Aby pomóc heroldowi w wykrywaniu wzorców numeracji, użyj parametru
wzór numeracji sekcji.

klasa-atrybutów
Wyrażenie regularne, które jest stosowane do każdego elementu p i div. Jeśli wyrażenie
dopasowania, bieżący element jest traktowany jako element sekcji. Jeśli regularny
wyrażenie ma grupy, pierwsza grupa będzie używana jako poziom zagnieżdżenia, w przeciwnym razie level
zakłada się siedem.

wzór numeracji sekcji
Zwykle chcesz pozbyć się numeracji sekcji, która pochodzi z danych HTML,
ponieważ staje się częścią tekstu tytułu w DocBook. Numery sekcji będą
pojawiają się dwukrotnie w mediach docelowych. Jeden z HTML i jeden z DocBook XSL
przetwarzanie. Parametr section-numbering-pattern definiuje wyrażenie regularne,
który jest dopasowywany do początku każdego tytułu sekcji. Jeśli pasuje,
pasująca część jest usuwana.

Sekcja wykrywanie listy
Czasami listy nie są reprezentowane przez znaczniki ul, ol lub dl, ale są reprezentowane jako p
tagi z dodatkowym formatowaniem css. Jeśli używasz narzędzia, które tworzy lub eksportuje HTML za pomocą
takiej konstrukcji, konwersja zakończy się z elementami para, zamiast
odpowiednie elementy listy w DocBook. Aby odtworzyć listy w niektórych przypadkach, możesz użyć
Sekcja wykrywanie listy. Parametry wyszczególniona-klasa-atrybutu i
zamówiona-klasa-atrybutów pozwala zdefiniować listy wyrażeń regularnych, które pasują do
elementy listy w kodzie HTML. herold próbuje z tego odbudować właściwą strukturę list
informacje, nawet dla list zagnieżdżonych.

Sekcja HTML
Sekcja HTML definiuje parametry, które kontrolują ładowanie i parsowanie HTML
dane wejściowe.

kodowanie
Zestaw znaków używany do odczytywania strumienia wejściowego.

wykluczać
Definiuje tablicę wyrażeń xpath. Wszystkie dopasowania są usuwane z drzewa HTML DOM
przed transformacją.

Sekcja DocBook
abstrakcyjny
Tekst abstrakcyjnego elementu sekcji informacyjnej. Jeśli tekst ma strukturę z
znaki nowej linii, użyj trzech podwójnych cudzysłowów jako ograniczników. Jeśli tekst zaczyna się od „<”
znak, jest osadzony w abstrakcyjnym elemencie, w przeciwnym razie tekst jest osadzony
do elementu para wewnątrz elementu abstrakcyjnego. Tekst zostanie przeanalizowany i może
zawierają elementy DocBook.

indeks dodatku
Jeśli ustawione na true, element indeksu jest wstawiany na końcu DocBook XML.

utwórz etykietę-odnośnika
jeśli ustawiono na false, elementy zakotwiczenia nie otrzymają atrybutu etykiety odnośnika.

rozkład-tabele
Jeśli ustawione na true, struktury tabel będą ignorowane. Zawartość komórek tabeli będzie
być wstawiony do DocBook XML jako sekwencja akapitów. Ten parametr może być
przydatne, jeśli Twój kod HTML zawiera tabele do celów formatowania. Normalnie chcesz dostać
pozbyć się ich, ponieważ naruszają one strukturę logiczną.

element-dokumentu
Element dokumentu, którego chcesz użyć. Musi być artykułem, książką, częścią lub odniesieniem.

kodowanie
Zestaw znaków, który zostanie użyty do zapisania pliku wyjściowego.

formaty-danych-obrazów
Tablica formatów obrazów. Te formaty zostaną wstawione jako elementy imageobject,
dodatkowo do formatu znajdującego się w atrybucie src odpowiedniego img
element. Oryginalny format jest wstawiany dwukrotnie z rolami „html” i „fo”. ten
inne formaty są wstawiane jako „html- ” i „dla- ”.

tytuł
Tytuł powstałego dokumentu. Jeśli ten parametr jest niezdefiniowany, herold próbuje:
odnaleziono tytuł z sekcji nagłówka danych HTML.

użyj-bezwzględnej-ścieżki-obrazu
Jeśli chcesz bezwzględne ścieżki obrazów w atrybucie fileref elementu imagedata,
ustaw ten parametr na true.

PRAWA AUTORSKIE


Prawa autorskie 2001-2013 Michael Fuchs. Licencja GPLv3+: GNU GPL w wersji 3 lub nowszej
http://gnu.org/licenses/gpl.html. To jest darmowe oprogramowanie: możesz zmieniać i
redystrybuować go. NIE MA GWARANCJI, w zakresie dozwolonym przez prawo.

Korzystaj z herold online za pomocą usług onworks.net


Ad


Ad