InglesPransesEspanyol

Ad


OnWorks favicon

html2text - Online sa Cloud

Patakbuhin ang html2text sa OnWorks na libreng hosting provider sa Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

Ito ang command na html2text na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator

PROGRAMA:

NAME


html2text - isang advanced na HTML-to-text converter

SINOPSIS


html2text -tulong
html2text -version
html2text [ -unparse | -suriin ] [ -debug-scanner ] [ -debug-parser ] [ -rcfile landas ] [
-Style ( siksik | medyo ) ] [ -bandwidth lapad ] [ -o output-file ] [ -nobs ] [ -ascii |
-utf8 ] [ -nometa ] [ input-file ... ]

DESCRIPTION


html2text nagbabasa ng mga HTML na dokumento mula sa input-files, i-format ang bawat isa sa kanila sa isang stream ng
plain text na mga character, at isinusulat ang resulta sa karaniwang output (o sa output-file, Kung
ang -o ginagamit ang opsyon sa command line).

Kung hindi input-files ay tinukoy sa command line, html2text nagbabasa mula sa karaniwang input.
Isang gitling bilang ang input-file ay isang alternatibong paraan upang tukuyin ang karaniwang input.

html2text naiintindihan ang lahat ng HTML 3.2 constructs, ngunit maaari lamang mag-render ng bahagi ng mga ito dahil sa
mga limitasyon ng format ng output ng text. Gayunpaman, sinusubukan ng programa na magbigay ng mabuti
mga pamalit sa mga elementong hindi nito maibibigay. html2text nag-parse din ng HTML 4 input, ngunit
hindi palaging kasing matagumpay ng iba pang mga HTML processor. Tumatanggap din ito ng syntactically mali
input, at sinusubukang bigyang-kahulugan ito ng "makatwirang".

Ang daan html2text mga format na ang mga HTML na dokumento ay kinokontrol ng pag-format ng mga property na nabasa
mula sa isang RC file. html2text pagtatangka na basahin $HOME/.html2textrc (o ang file na tinukoy ni
ang -rcfile opsyon sa command line); kung hindi mabasa ang file na iyon, html2text pagtatangka na basahin
/etc/html2textrc. Kung walang RC file na mababasa (o kung hindi na-override ng RC file ang lahat
pag-format ng mga katangian), pagkatapos ay ang mga "makatwirang" mga default ay ipinapalagay. Ang format ng RC file ay
inilarawan sa html2textrc(5) manu-manong pahina.

Debian na bersyon ng html2text maaari ring gumawa ng input at output recoding (tingnan
/usr/share/doc/html2text/README.Debian para sa higit pang impormasyon). html2text sinusubukang kunin ang pag-encode
mula sa HTML na dokumento. Kung hindi tinukoy ang pag-encode, maaari mong gamitin -ascii at -utf8 mga pagpipilian.
Ang output ay na-convert sa lokal na charset ng user (LC_CTYPE).

Opsyon


-nometa
Bilang default, ang bersyon ng Debian ng html2text gumamit ng 'meta http-equiv' na tag para sa input
recoding. Kinakansela ng opsyong ito ang gawi na ito.

-ascii Bilang default, kailan -nometa ay ibinibigay, html2text Gumagamit UTF-8 para sa output.
Tinutukoy ang pagpipiliang ito, payak ASCII ay ginagamit sa halip. Upang malaman kung paano hindi ASCII
ang mga character ay nai-render, sumangguni sa file na "ascii.substitutes".

-utf8 Bilang default, kailan -nometa ay ibinibigay, html2text Gumagamit ISO 8859-1 para sa input.
Tinutukoy ang pagpipiliang ito, UTF-8 ay ginagamit sa halip (parehong para sa input at output). Ito
ipinahihiwatig ng opsyon -nobs.

-suriin Ang opsyong ito ay para sa mga layuning diagnostic: Ang HTML na dokumento ay na-parse lang at hindi
naproseso kung hindi man. Sa ganitong mode ng operasyon, html2text ay mag-uulat sa parse
mga error at mga error sa pag-scan, na hindi nito ginagawa sa ibang mga mode ng operasyon. Tandaan na
Ang mga error sa pag-parse at pag-scan ay hindi nakamamatay html2text, ngunit maaaring magdulot ng maling interpretasyon
ng HTML code at/o mga bahagi ng dokumentong nilalamon.

-debug-parser
Pabayaan html2text mag-ulat tungkol sa mga token na inililipat, mga panuntunang inilalapat, atbp., habang
pag-scan sa HTML na dokumento. Ang pagpipiliang ito ay para sa mga layuning diagnostic.

-debug-scanner
Pabayaan html2text mag-ulat sa bawat lexical token na na-scan, habang ini-scan ang HTML
dokumento. Ang pagpipiliang ito ay para sa mga layuning diagnostic.

-tulong I-print ang buod ng command line at lumabas.

-nobs Bilang default, orihinal html2text nag-render ng mga may salungguhit na titik na may mga pagkakasunod-sunod tulad ng
"underscore-backspace-character" at boldface na mga titik tulad ng "character-backspace-
character". Dahil sa mga isyu sa UTF-8, Debian na bersyon ng html2text hindi
gumawa ng mga backspace, kaya wala talagang ginagawa ang opsyong ito.

-o output-file
Isulat ang output sa output-file sa halip na karaniwang output. Isang gitling bilang ang
output-file ay isang alternatibong paraan upang tukuyin ang karaniwang output.

-rcfile landas
Subukang basahin ang file na tinukoy sa landas bilang RC file.

-Style ( siksik | medyo )
estilo medyo binabago ang ilan sa mga default na halaga ng mga parameter sa pag-format
dokumentado sa html2textrc(5). Upang malaman kung alin at paano ang parameter ng pag-format
ang mga default ay binago, suriin ang file na "pretty.style". Kung ang pagpipiliang ito ay tinanggal,
estilo siksik ay ipinapalagay bilang default.

-unparse
Ang opsyong ito ay para sa mga layuning diagnostic: Sa halip na i-format ang na-parse na dokumento,
bumuo ng HTML code, na garantisadong syntactically tama. Kung html2text
ay may mga problema sa pag-parse ng isang syntactically hindi tamang HTML na dokumento, maaaring makatulong ang opsyong ito
para maintindihan mo kung ano html2text iniisip na ang ibig sabihin ng orihinal na HTML code.

-version
I-print ang bersyon ng programa at lumabas.

-bandwidth lapad
Sa pamamagitan ng default, html2text format ang mga HTML na dokumento para sa lapad ng screen na 79
mga karakter. Kung nire-redirect ang output sa isang file, o kung may lapad ang iyong terminal
maliban sa 80 character, o kung gusto mo lang makakuha ng ideya kung paano html2text deal
na may malalaking talahanayan at iba't ibang lapad ng terminal, maaaring gusto mong tukuyin ang a
iba lapad.

Gumamit ng html2text online gamit ang mga serbisyo ng onworks.net


Mga Libreng Server at Workstation

Mag-download ng Windows at Linux apps

Linux command

Ad