ນີ້ແມ່ນຄໍາສັ່ງ html2text ທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
html2text - ຕົວປ່ຽນ HTML ເປັນຂໍ້ຄວາມຂັ້ນສູງ
ສະຫຼຸບສັງລວມ
html2text -ຊ່ວຍ
html2text -ການປ່ຽນແປງ
html2text [ - ແຍກຕົວຢ່າງ | - ກວດສອບ ] [ -ເຄື່ອງສະແກນດີບັກ ] [ -debug-parser ] [ -rcfile ເສັ້ນທາງ ] [
-ແບບ ( ຫນາແຫນ້ນ | pretty ) ] [ - ກວ້າງ width ] [ -o output-file ] [ -nobs ] [ -ascii |
-utf8 ] [ - ຊື່ ] [ ໄຟລ໌ປ້ອນຂໍ້ມູນ ... ]
ລາຍລະອຽດ
html2text ອ່ານເອກະສານ HTML ຈາກ ໄຟລ໌ປ້ອນຂໍ້ມູນs, ຮູບແບບແຕ່ລະຄົນເຂົ້າໄປໃນນ້ໍາຂອງ
ຕົວອັກສອນຕົວໜັງສືທຳມະດາ, ແລະຂຽນຜົນອອກມາເປັນມາດຕະຖານ (ຫຼື output-file, ຖ້າ
ໄດ້ -o ທາງເລືອກແຖວຄໍາສັ່ງຖືກນໍາໃຊ້).
ຖ້າບໍ່ ໄຟລ໌ປ້ອນຂໍ້ມູນs ຖືກລະບຸໄວ້ໃນເສັ້ນຄໍາສັ່ງ, html2text ອ່ານຈາກວັດສະດຸປ້ອນມາດຕະຖານ.
A dash ເປັນ ໄຟລ໌ປ້ອນຂໍ້ມູນ ເປັນວິທີສຳຮອງເພື່ອລະບຸການປ້ອນຂໍ້ມູນມາດຕະຖານ.
html2text ເຂົ້າໃຈໂຄງສ້າງ HTML 3.2 ທັງຫມົດ, ແຕ່ສາມາດສະແດງພຽງແຕ່ສ່ວນຫນຶ່ງຂອງພວກມັນເນື່ອງຈາກ
ຂໍ້ຈໍາກັດຂອງຮູບແບບຜົນຜະລິດຂໍ້ຄວາມ. ຢ່າງໃດກໍຕາມ, ໂຄງການພະຍາຍາມທີ່ຈະສະຫນອງທີ່ດີ
ທົດແທນສໍາລັບອົງປະກອບທີ່ມັນບໍ່ສາມາດສະແດງໄດ້. html2text parses HTML 4 input, ເຊັ່ນດຽວກັນ, ແຕ່
ບໍ່ສະເຫມີປະສົບຜົນສໍາເລັດຄືກັບໂປເຊດເຊີ HTML ອື່ນໆ. ມັນຍັງຍອມຮັບ syntactically ບໍ່ຖືກຕ້ອງ
input, ແລະພະຍາຍາມຕີຄວາມມັນ "ສົມເຫດສົມຜົນ".
ວິທີການ html2text ການຈັດຮູບແບບເອກະສານ HTML ຖືກຄວບຄຸມໂດຍຄຸນສົມບັດການຈັດຮູບແບບທີ່ອ່ານ
ຈາກໄຟລ໌ RC. html2text ຄວາມພະຍາຍາມທີ່ຈະອ່ານ $HOME/.html2textrc (ຫຼືໄຟລ໌ທີ່ລະບຸໄວ້ໂດຍ
ໄດ້ -rcfile ທາງເລືອກແຖວຄໍາສັ່ງ); ຖ້າໄຟລ໌ນັ້ນບໍ່ສາມາດອ່ານໄດ້, html2text ຄວາມພະຍາຍາມທີ່ຈະອ່ານ
/etc/html2textrc. ຖ້າບໍ່ມີໄຟລ໌ RC ສາມາດອ່ານໄດ້ (ຫຼືຖ້າໄຟລ໌ RC ບໍ່ override ທັງຫມົດ
ຄຸນສົມບັດການຈັດຮູບແບບ), ຫຼັງຈາກນັ້ນ "ສົມເຫດສົມຜົນ" ຄ່າເລີ່ມຕົ້ນແມ່ນສົມມຸດ. ຮູບແບບໄຟລ໌ RC ແມ່ນ
ອະທິບາຍໃນ html2textrc(5) ຫນ້າຄູ່ມື.
ສະບັບ Debian ຂອງ html2text ຍັງສາມາດເຮັດໄດ້ input ແລະ output recoding (ເບິ່ງ
/usr/share/doc/html2text/README.Debian ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ). html2text ພະຍາຍາມດຶງເອົາການເຂົ້າລະຫັດ
ຈາກເອກະສານ HTML. ຖ້າການເຂົ້າລະຫັດບໍ່ໄດ້ລະບຸ, ທ່ານສາມາດນໍາໃຊ້ -ascii ແລະ -utf8 ຕົວເລືອກ
ຜົນອອກມາຈະຖືກປ່ຽນເປັນຊຸດຕົວໜັງສືທ້ອງຖິ່ນຂອງຜູ້ໃຊ້ (LC_CTYPE).
OPTIONS
- ຊື່
ໂດຍຄ່າເລີ່ມຕົ້ນ, ສະບັບ Debian ຂອງ html2text ໃຊ້ແທັກ 'meta http-equiv' ສໍາລັບການປ້ອນຂໍ້ມູນ
ການຖອດລະຫັດ. ທາງເລືອກນີ້ຍົກເລີກພຶດຕິກໍານີ້.
-ascii ໂດຍຄ່າເລີ່ມຕົ້ນ, ເມື່ອ - ຊື່ ແມ່ນສະຫນອງໃຫ້, html2text ການນໍາໃຊ້ UTF-8 ສໍາລັບຜົນຜະລິດ.
ການລະບຸທາງເລືອກນີ້, ທໍາມະດາ ASCII ຖືກນໍາໃຊ້ແທນ. ເພື່ອຊອກຫາວິທີການທີ່ບໍ່ແມ່ນ ASCII
ຕົວອັກສອນຖືກສະແດງ, ອ້າງອີງໃສ່ໄຟລ໌ "ascii.substitutes".
-utf8 ໂດຍຄ່າເລີ່ມຕົ້ນ, ເມື່ອ - ຊື່ ແມ່ນສະຫນອງໃຫ້, html2text ການນໍາໃຊ້ ISO 8859-1 ສໍາລັບການປ້ອນຂໍ້ມູນ.
ການລະບຸທາງເລືອກນີ້, UTF-8 ຖືກນໍາໃຊ້ແທນ (ທັງສອງສໍາລັບການປ້ອນຂໍ້ມູນແລະຜົນຜະລິດ). ນີ້
ທາງເລືອກຫມາຍເຖິງ -nobs.
- ກວດສອບ ຕົວເລືອກນີ້ແມ່ນເພື່ອຈຸດປະສົງການວິນິດໄສ: ເອກະສານ HTML ແມ່ນຖືກວິເຄາະເທົ່ານັ້ນ ແລະບໍ່ແມ່ນ
ປຸງແຕ່ງຖ້າບໍ່ດັ່ງນັ້ນ. ໃນຮູບແບບການດໍາເນີນງານນີ້, html2text ຈະລາຍງານກ່ຽວກັບ parse
ຄວາມຜິດພາດແລະຄວາມຜິດພາດ scan, ທີ່ມັນບໍ່ໄດ້ຢູ່ໃນຮູບແບບອື່ນໆຂອງການດໍາເນີນງານ. ໃຫ້ສັງເກດວ່າ
parse ແລະ scan ຄວາມຜິດພາດແມ່ນບໍ່ເປັນອັນຕະລາຍສໍາລັບ html2text, ແຕ່ອາດຈະເຮັດໃຫ້ເກີດການຕີຄວາມຜິດ
ຂອງລະຫັດ HTML ແລະ/ຫຼືບາງສ່ວນຂອງເອກະສານທີ່ຖືກກືນກິນ.
-debug-parser
ໃຫ້ html2text ລາຍງານກ່ຽວກັບ tokens ທີ່ຖືກປ່ຽນ, ກົດລະບຽບທີ່ຖືກນໍາໃຊ້, ແລະອື່ນໆ, ໃນຂະນະທີ່
ການສະແກນເອກະສານ HTML. ຕົວເລືອກນີ້ແມ່ນເພື່ອຈຸດປະສົງການວິນິດໄສ.
-ເຄື່ອງສະແກນດີບັກ
ໃຫ້ html2text ລາຍງານກ່ຽວກັບແຕ່ລະ token lexical scanned, ໃນຂະນະທີ່ສະແກນ HTML
ເອກະສານ. ຕົວເລືອກນີ້ແມ່ນເພື່ອຈຸດປະສົງການວິນິດໄສ.
-ຊ່ວຍ ພິມບົດສະຫຼຸບເສັ້ນຄໍາສັ່ງແລະອອກ.
-nobs ໂດຍຄ່າເລີ່ມຕົ້ນ, ຕົ້ນສະບັບ html2text renders underlined ຕົວອັກສອນທີ່ມີລໍາດັບເຊັ່ນ:
"underscore-backspace-character" ແລະຕົວອັກສອນ boldface ເຊັ່ນ "character-backspace-
ລັກສະນະ" ເນື່ອງຈາກບັນຫາກັບ UTF-8, ສະບັບ Debian ຂອງ html2text ບໍ່
ຜະລິດ backspaces, ດັ່ງນັ້ນທາງເລືອກນີ້ກໍ່ບໍ່ມີຫຍັງເລີຍ.
-o output-file
ຂຽນຜົນໄດ້ຮັບໃສ່ output-file ແທນທີ່ຈະເປັນຜົນຜະລິດມາດຕະຖານ. A dash ເປັນ
output-file ເປັນວິທີການສະຫຼັບເພື່ອລະບຸຜົນຜະລິດມາດຕະຖານ.
-rcfile ເສັ້ນທາງ
ພະຍາຍາມອ່ານໄຟລ໌ທີ່ລະບຸໄວ້ໃນ ເສັ້ນທາງ ເປັນໄຟລ໌ RC.
-ແບບ ( ຫນາແຫນ້ນ | pretty )
ແບບ pretty ປ່ຽນແປງບາງຄ່າເລີ່ມຕົ້ນຂອງພາລາມິເຕີການຈັດຮູບແບບ
ເອກະສານໃນ html2textrc(5). ເພື່ອຊອກຫາທີ່ແລະວິທີການກໍານົດຮູບແບບ
ຄ່າເລີ່ມຕົ້ນຖືກປ່ຽນແປງ, ກວດເບິ່ງໄຟລ໌ "pretty.style". ຖ້າຕົວເລືອກນີ້ຖືກລະເວັ້ນ,
ແບບ ຫນາແຫນ້ນ ຖືວ່າເປັນຄ່າເລີ່ມຕົ້ນ.
- ແຍກຕົວຢ່າງ
ທາງເລືອກນີ້ແມ່ນເພື່ອຈຸດປະສົງການວິນິດໄສ: ແທນທີ່ຈະຈັດຮູບແບບເອກະສານການວິເຄາະ,
ສ້າງລະຫັດ HTML, ທີ່ຮັບປະກັນວ່າຖືກຕ້ອງ syntactically. ຖ້າ html2text
ມີບັນຫາໃນການວິເຄາະເອກະສານ HTML ທີ່ບໍ່ຖືກຕ້ອງ, ທາງເລືອກນີ້ອາດຈະຊ່ວຍໄດ້
ເຈົ້າເຂົ້າໃຈສິ່ງທີ່ html2text ຄິດວ່າລະຫັດ HTML ຕົ້ນສະບັບຫມາຍຄວາມວ່າ.
-ການປ່ຽນແປງ
ພິມສະບັບໂຄງການແລະອອກ.
- ກວ້າງ width
ໂດຍຕົວຢ່າງ, html2text ຈັດຮູບແບບເອກະສານ HTML ສໍາລັບຄວາມກວ້າງຂອງຫນ້າຈໍ 79
ຕົວລະຄອນ. ຖ້າ redirecting ຜົນຜະລິດເຂົ້າໄປໃນໄຟລ໌, ຫຼືຖ້າ terminal ຂອງທ່ານມີຄວາມກວ້າງ
ນອກຈາກ 80 ຕົວອັກສອນ, ຫຼືຖ້າຫາກວ່າທ່ານພຽງແຕ່ຕ້ອງການທີ່ຈະໄດ້ຮັບຄວາມຄິດວິທີການ html2text ຂໍ້ສະເຫນີ
ດ້ວຍຕາຕະລາງຂະຫນາດໃຫຍ່ແລະຄວາມກວ້າງຂອງປາຍທີ່ແຕກຕ່າງກັນ, ທ່ານອາດຈະຕ້ອງການກໍານົດ a
ທີ່ແຕກຕ່າງກັນ width.
ໃຊ້ html2text ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net