Amazon Best VPN GoSearch

OnWorks favicon

html2text - ອອນລາຍໃນຄລາວ

ແລ່ນ html2text ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນຄໍາສັ່ງ html2text ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


html2text - ຕົວປ່ຽນ HTML ເປັນຂໍ້ຄວາມຂັ້ນສູງ

ສະຫຼຸບສັງລວມ


html2text -ຊ່ວຍ
html2text -ການປ່ຽນແປງ
html2text [ - ແຍກຕົວຢ່າງ | - ກວດ​ສອບ​ ] [ -ເຄື່ອງສະແກນດີບັກ ] [ -debug-parser ] [ -rcfile ເສັ້ນທາງ ] [
-ແບບ ( ຫນາແຫນ້ນ | pretty ) ] [ - ກວ້າງ width ] [ -o output-file ] [ -nobs ] [ -ascii |
-utf8 ] [ - ຊື່ ] [ ໄຟລ໌ປ້ອນຂໍ້ມູນ ... ]

ລາຍລະອຽດ


html2text ອ່ານເອກະສານ HTML ຈາກ ໄຟລ໌ປ້ອນຂໍ້ມູນs, ຮູບແບບແຕ່ລະຄົນເຂົ້າໄປໃນນ້ໍາຂອງ
ຕົວອັກສອນຕົວໜັງສືທຳມະດາ, ແລະຂຽນຜົນອອກມາເປັນມາດຕະຖານ (ຫຼື output-file, ຖ້າ
ໄດ້ -o ທາງເລືອກແຖວຄໍາສັ່ງຖືກນໍາໃຊ້).

ຖ້າບໍ່ ໄຟລ໌ປ້ອນຂໍ້ມູນs ຖືກລະບຸໄວ້ໃນເສັ້ນຄໍາສັ່ງ, html2text ອ່ານຈາກວັດສະດຸປ້ອນມາດຕະຖານ.
A dash ເປັນ ໄຟລ໌ປ້ອນຂໍ້ມູນ ເປັນວິທີສຳຮອງເພື່ອລະບຸການປ້ອນຂໍ້ມູນມາດຕະຖານ.

html2text ເຂົ້າໃຈໂຄງສ້າງ HTML 3.2 ທັງຫມົດ, ແຕ່ສາມາດສະແດງພຽງແຕ່ສ່ວນຫນຶ່ງຂອງພວກມັນເນື່ອງຈາກ
ຂໍ້ຈໍາກັດຂອງຮູບແບບຜົນຜະລິດຂໍ້ຄວາມ. ຢ່າງໃດກໍຕາມ, ໂຄງການພະຍາຍາມທີ່ຈະສະຫນອງທີ່ດີ
ທົດແທນສໍາລັບອົງປະກອບທີ່ມັນບໍ່ສາມາດສະແດງໄດ້. html2text parses HTML 4 input, ເຊັ່ນດຽວກັນ, ແຕ່
ບໍ່ສະເຫມີປະສົບຜົນສໍາເລັດຄືກັບໂປເຊດເຊີ HTML ອື່ນໆ. ມັນຍັງຍອມຮັບ syntactically ບໍ່ຖືກຕ້ອງ
input, ແລະພະຍາຍາມຕີຄວາມມັນ "ສົມເຫດສົມຜົນ".

ວິທີການ html2text ການຈັດຮູບແບບເອກະສານ HTML ຖືກຄວບຄຸມໂດຍຄຸນສົມບັດການຈັດຮູບແບບທີ່ອ່ານ
ຈາກໄຟລ໌ RC. html2text ຄວາມ​ພະ​ຍາ​ຍາມ​ທີ່​ຈະ​ອ່ານ​ $HOME/.html2textrc (ຫຼືໄຟລ໌ທີ່ລະບຸໄວ້ໂດຍ
ໄດ້ -rcfile ທາງເລືອກແຖວຄໍາສັ່ງ); ຖ້າໄຟລ໌ນັ້ນບໍ່ສາມາດອ່ານໄດ້, html2text ຄວາມ​ພະ​ຍາ​ຍາມ​ທີ່​ຈະ​ອ່ານ​
/etc/html2textrc. ຖ້າບໍ່ມີໄຟລ໌ RC ສາມາດອ່ານໄດ້ (ຫຼືຖ້າໄຟລ໌ RC ບໍ່ override ທັງຫມົດ
ຄຸນສົມບັດການຈັດຮູບແບບ), ຫຼັງຈາກນັ້ນ "ສົມເຫດສົມຜົນ" ຄ່າເລີ່ມຕົ້ນແມ່ນສົມມຸດ. ຮູບແບບໄຟລ໌ RC ແມ່ນ
ອະທິບາຍໃນ html2textrc(5) ຫນ້າຄູ່ມື.

ສະບັບ Debian ຂອງ html2text ຍັງສາມາດເຮັດໄດ້ input ແລະ output recoding (ເບິ່ງ
/usr/share/doc/html2text/README.Debian ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ). html2text ພະຍາຍາມດຶງເອົາການເຂົ້າລະຫັດ
ຈາກເອກະສານ HTML. ຖ້າການເຂົ້າລະຫັດບໍ່ໄດ້ລະບຸ, ທ່ານສາມາດນໍາໃຊ້ -ascii ແລະ -utf8 ຕົວເລືອກ
ຜົນອອກມາຈະຖືກປ່ຽນເປັນຊຸດຕົວໜັງສືທ້ອງຖິ່ນຂອງຜູ້ໃຊ້ (LC_CTYPE).

OPTIONS


- ຊື່
ໂດຍຄ່າເລີ່ມຕົ້ນ, ສະບັບ Debian ຂອງ html2text ໃຊ້ແທັກ 'meta http-equiv' ສໍາລັບການປ້ອນຂໍ້ມູນ
ການຖອດລະຫັດ. ທາງເລືອກນີ້ຍົກເລີກພຶດຕິກໍານີ້.

-ascii ໂດຍຄ່າເລີ່ມຕົ້ນ, ເມື່ອ - ຊື່ ແມ່ນ​ສະ​ຫນອງ​ໃຫ້​, html2text ການນໍາໃຊ້ UTF-8 ສໍາລັບຜົນຜະລິດ.
ການລະບຸທາງເລືອກນີ້, ທໍາມະດາ ASCII ຖືກນໍາໃຊ້ແທນ. ເພື່ອຊອກຫາວິທີການທີ່ບໍ່ແມ່ນ ASCII
ຕົວອັກສອນຖືກສະແດງ, ອ້າງອີງໃສ່ໄຟລ໌ "ascii.substitutes".

-utf8 ໂດຍຄ່າເລີ່ມຕົ້ນ, ເມື່ອ - ຊື່ ແມ່ນ​ສະ​ຫນອງ​ໃຫ້​, html2text ການນໍາໃຊ້ ISO 8859​-1 ສໍາລັບການປ້ອນຂໍ້ມູນ.
ການ​ລະ​ບຸ​ທາງ​ເລືອກ​ນີ້​, UTF-8 ຖືກນໍາໃຊ້ແທນ (ທັງສອງສໍາລັບການປ້ອນຂໍ້ມູນແລະຜົນຜະລິດ). ນີ້
ທາງເລືອກຫມາຍເຖິງ -nobs.

- ກວດ​ສອບ​ ຕົວເລືອກນີ້ແມ່ນເພື່ອຈຸດປະສົງການວິນິດໄສ: ເອກະສານ HTML ແມ່ນຖືກວິເຄາະເທົ່ານັ້ນ ແລະບໍ່ແມ່ນ
ປຸງແຕ່ງຖ້າບໍ່ດັ່ງນັ້ນ. ໃນ​ຮູບ​ແບບ​ການ​ດໍາ​ເນີນ​ງານ​ນີ້​, html2text ຈະລາຍງານກ່ຽວກັບ parse
ຄວາມ​ຜິດ​ພາດ​ແລະ​ຄວາມ​ຜິດ​ພາດ scan​, ທີ່​ມັນ​ບໍ່​ໄດ້​ຢູ່​ໃນ​ຮູບ​ແບບ​ອື່ນໆ​ຂອງ​ການ​ດໍາ​ເນີນ​ງານ​. ໃຫ້ສັງເກດວ່າ
parse ແລະ scan ຄວາມຜິດພາດແມ່ນບໍ່ເປັນອັນຕະລາຍສໍາລັບ html2text, ແຕ່ອາດຈະເຮັດໃຫ້ເກີດການຕີຄວາມຜິດ
ຂອງລະຫັດ HTML ແລະ/ຫຼືບາງສ່ວນຂອງເອກະສານທີ່ຖືກກືນກິນ.

-debug-parser
ໃຫ້ html2text ລາຍ​ງານ​ກ່ຽວ​ກັບ tokens ທີ່​ຖືກ​ປ່ຽນ, ກົດ​ລະ​ບຽບ​ທີ່​ຖືກ​ນໍາ​ໃຊ້, ແລະ​ອື່ນໆ, ໃນ​ຂະ​ນະ​ທີ່
ການສະແກນເອກະສານ HTML. ຕົວເລືອກນີ້ແມ່ນເພື່ອຈຸດປະສົງການວິນິດໄສ.

-ເຄື່ອງສະແກນດີບັກ
ໃຫ້ html2text ລາຍງານກ່ຽວກັບແຕ່ລະ token lexical scanned, ໃນຂະນະທີ່ສະແກນ HTML
ເອກະສານ. ຕົວເລືອກນີ້ແມ່ນເພື່ອຈຸດປະສົງການວິນິດໄສ.

-ຊ່ວຍ ພິມບົດສະຫຼຸບເສັ້ນຄໍາສັ່ງແລະອອກ.

-nobs ໂດຍຄ່າເລີ່ມຕົ້ນ, ຕົ້ນສະບັບ html2text renders underlined ຕົວອັກສອນທີ່ມີລໍາດັບເຊັ່ນ:
"underscore-backspace-character" ແລະຕົວອັກສອນ boldface ເຊັ່ນ "character-backspace-
ລັກສະນະ" ເນື່ອງຈາກບັນຫາກັບ UTF-8, ສະບັບ Debian ຂອງ html2text ບໍ່
ຜະລິດ backspaces, ດັ່ງນັ້ນທາງເລືອກນີ້ກໍ່ບໍ່ມີຫຍັງເລີຍ.

-o output-file
ຂຽນຜົນໄດ້ຮັບໃສ່ output-file ແທນທີ່ຈະເປັນຜົນຜະລິດມາດຕະຖານ. A dash ເປັນ
output-file ເປັນ​ວິ​ທີ​ການ​ສະ​ຫຼັບ​ເພື່ອ​ລະ​ບຸ​ຜົນ​ຜະ​ລິດ​ມາດ​ຕະ​ຖານ​.

-rcfile ເສັ້ນທາງ
ພະຍາຍາມອ່ານໄຟລ໌ທີ່ລະບຸໄວ້ໃນ ເສັ້ນທາງ ເປັນໄຟລ໌ RC.

-ແບບ ( ຫນາແຫນ້ນ | pretty )
ແບບ pretty ປ່ຽນແປງບາງຄ່າເລີ່ມຕົ້ນຂອງພາລາມິເຕີການຈັດຮູບແບບ
ເອກະສານໃນ html2textrc(5). ເພື່ອຊອກຫາທີ່ແລະວິທີການກໍານົດຮູບແບບ
ຄ່າເລີ່ມຕົ້ນຖືກປ່ຽນແປງ, ກວດເບິ່ງໄຟລ໌ "pretty.style". ຖ້າຕົວເລືອກນີ້ຖືກລະເວັ້ນ,
ແບບ ຫນາແຫນ້ນ ຖືວ່າເປັນຄ່າເລີ່ມຕົ້ນ.

- ແຍກຕົວຢ່າງ
ທາງ​ເລືອກ​ນີ້​ແມ່ນ​ເພື່ອ​ຈຸດ​ປະ​ສົງ​ການ​ວິ​ນິດ​ໄສ​: ແທນ​ທີ່​ຈະ​ຈັດ​ຮູບ​ແບບ​ເອ​ກະ​ສານ​ການ​ວິ​ເຄາະ​,
ສ້າງລະຫັດ HTML, ທີ່ຮັບປະກັນວ່າຖືກຕ້ອງ syntactically. ຖ້າ html2text
ມີບັນຫາໃນການວິເຄາະເອກະສານ HTML ທີ່ບໍ່ຖືກຕ້ອງ, ທາງເລືອກນີ້ອາດຈະຊ່ວຍໄດ້
ເຈົ້າເຂົ້າໃຈສິ່ງທີ່ html2text ຄິດວ່າລະຫັດ HTML ຕົ້ນສະບັບຫມາຍຄວາມວ່າ.

-ການປ່ຽນແປງ
ພິມສະບັບໂຄງການແລະອອກ.

- ກວ້າງ width
ໂດຍຕົວຢ່າງ, html2text ຈັດຮູບແບບເອກະສານ HTML ສໍາລັບຄວາມກວ້າງຂອງຫນ້າຈໍ 79
ຕົວລະຄອນ. ຖ້າ redirecting ຜົນຜະລິດເຂົ້າໄປໃນໄຟລ໌, ຫຼືຖ້າ terminal ຂອງທ່ານມີຄວາມກວ້າງ
ນອກ​ຈາກ 80 ຕົວ​ອັກ​ສອນ​, ຫຼື​ຖ້າ​ຫາກ​ວ່າ​ທ່ານ​ພຽງ​ແຕ່​ຕ້ອງ​ການ​ທີ່​ຈະ​ໄດ້​ຮັບ​ຄວາມ​ຄິດ​ວິ​ທີ​ການ​ html2text ຂໍ້ສະເຫນີ
ດ້ວຍຕາຕະລາງຂະຫນາດໃຫຍ່ແລະຄວາມກວ້າງຂອງປາຍທີ່ແຕກຕ່າງກັນ, ທ່ານອາດຈະຕ້ອງການກໍານົດ a
ທີ່ແຕກຕ່າງກັນ width.

ໃຊ້ html2text ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net


ເຊີບເວີ ແລະສະຖານີເຮັດວຽກຟຣີ

ດາວໂຫຼດແອັບ Windows ແລະ Linux

Linux ຄຳ ສັ່ງ

Ad




×
ການ​ໂຄ​ສະ​ນາ
?ຊື້ເຄື່ອງ, ຈອງ, ຫຼືຊື້ທີ່ນີ້ — ບໍ່ມີຄ່າໃຊ້ຈ່າຍ, ຊ່ວຍໃຫ້ການບໍລິການຟຣີ.