ນີ້ແມ່ນຕົວເຊື່ອມຕໍ່ຄໍາສັ່ງທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
linkchecker - ລູກຄ້າເສັ້ນຄໍາສັ່ງເພື່ອກວດເບິ່ງເອກະສານ HTML ແລະເວັບໄຊທ໌ສໍາລັບການເຊື່ອມຕໍ່ທີ່ແຕກຫັກ
ສະຫຼຸບສັງລວມ
ຕົວກວດເຊື່ອມຕໍ່ [ທາງເລືອກໃນການ] [file-or-url] ...
ລາຍລະອຽດ
ຄຸນນະສົມບັດ LinkChecker
· ການກວດສອບ recursive ແລະ multithreaded,
·ຜົນຜະລິດໃນຂໍ້ຄວາມສີຫຼືປົກກະຕິ, HTML, SQL, CSV, XML ຫຼືກາຟແຜນຜັງເວັບໄຊທ໌ໃນ
ຮູບແບບທີ່ແຕກຕ່າງກັນ,
· ຮອງຮັບ HTTP/1.1, HTTPS, FTP, mailto:, news:, nnp:, Telnet ແລະໄຟລ໌ທ້ອງຖິ່ນ
ລິ້ງຄ໌,
· ຂໍ້ຈໍາກັດຂອງການກວດສອບການເຊື່ອມຕໍ່ກັບຕົວກັ່ນຕອງ URL,
· ສະຫນັບສະຫນູນຕົວແທນ,
· ການອະນຸຍາດຊື່ຜູ້ໃຊ້ / ລະຫັດຜ່ານສໍາລັບ HTTP, FTP ແລະ Telnet,
·ສະຫນັບສະຫນູນສໍາລັບ protocol ການຍົກເວັ້ນ robots.txt,
·ສະຫນັບສະຫນູນສໍາລັບ Cookies
·ສະຫນັບສະຫນູນສໍາລັບ HTML5
· HTML ແລະ CSS ກວດສອບ syntax
· ການກວດສອບ Antivirus
·ເສັ້ນຄໍາສັ່ງ, GUI ແລະການໂຕ້ຕອບເວັບໄຊຕ໌
ຕົວຢ່າງ
ການນໍາໃຊ້ທົ່ວໄປທີ່ສຸດກວດເບິ່ງໂດເມນທີ່ໃຫ້ recursively:
ຕົວກວດເຊື່ອມຕໍ່ http://www.example.com/
ຈົ່ງລະວັງວ່ານີ້ຈະກວດເບິ່ງເວັບໄຊທ໌ທັງຫມົດທີ່ສາມາດມີຫລາຍພັນ URLs. ໃຊ້ -r
ທາງເລືອກທີ່ຈະຈໍາກັດຄວາມເລິກ recursion.
ຢ່າກວດເບິ່ງ URL ດ້ວຍ /ລັບ ໃນຊື່ຂອງຕົນ. ລິ້ງອື່ນໆທັງໝົດຖືກກວດສອບຕາມປົກກະຕິ:
ຕົວກວດເຊື່ອມຕໍ່ --ignore-url=/ລັບ mysite.example.com
ການກວດສອບໄຟລ໌ HTML ທ້ອງຖິ່ນໃນ Unix:
ຕົວກວດເຊື່ອມຕໍ່ ../bla.html
ການກວດສອບໄຟລ໌ HTML ທ້ອງຖິ່ນໃນ Windows:
ຕົວກວດເຊື່ອມຕໍ່ c:\temp\test.html
ທ່ານສາມາດຂ້າມ http:// ສ່ວນ url ຖ້າໂດເມນເລີ່ມຕົ້ນດ້ວຍ www.:
ຕົວກວດເຊື່ອມຕໍ່ wwwexamplecom
ທ່ານສາມາດຂ້າມ ftp: // ສ່ວນ url ຖ້າໂດເມນເລີ່ມຕົ້ນດ້ວຍ ftp:
ຕົວກວດເຊື່ອມຕໍ່ -r0 ftp.example.com
ສ້າງກຣາຟແຜນຜັງເວັບໄຊທ໌ ແລະປ່ຽນມັນດ້ວຍ graphviz dot utility:
ຕົວກວດເຊື່ອມຕໍ່ -ໂອດອດ -v wwwexamplecom | ຈຸດ -Tps > sitemap.ps
OPTIONS
ໂດຍທົ່ວໄປ ທາງເລືອກໃນການ
-fຊື່ເອກະສານ, --config=ຊື່ເອກະສານ
ການນໍາໃຊ້ ຊື່ເອກະສານ ເປັນໄຟລ໌ການຕັ້ງຄ່າ. ດັ່ງທີ່ LinkChecker ເລີ່ມຕົ້ນໃຊ້
~/.linkchecker/linkcheckerrc.
-h, - ຊ່ວຍ
ຊ່ວຍຂ້ອຍແດ່! ພິມຂໍ້ມູນການນໍາໃຊ້ສໍາລັບໂຄງການນີ້.
--stdin
ອ່ານລາຍຊື່ຂອງຊ່ອງຫວ່າງທີ່ແຍກອອກຈາກ URL ເພື່ອກວດສອບຈາກ stdin.
-tNUMBER, --ກະທູ້=NUMBER
ສ້າງບໍ່ເກີນຈຳນວນກະທູ້ທີ່ກຳນົດ. ຈໍານວນເລີ່ມຕົ້ນຂອງຫົວຂໍ້ແມ່ນ
100. ເພື່ອປິດການໃຊ້ງານ threading ໃຫ້ລະບຸຕົວເລກທີ່ບໍ່ແມ່ນບວກ.
-V, - ການປ່ຽນແປງ
ພິມສະບັບແລະອອກ.
--list-plugins
ພິມປລັກອິນກວດສອບທີ່ມີໃຫ້ແລ້ວອອກ.
ຜົນຜະລິດ ທາງເລືອກໃນການ
-Dຄັກ, --debug=ຄັກ
ພິມຜົນການດີບັ໊ກອອກສຳລັບຕົວຕັດໄມ້ທີ່ໃຫ້ມາ. ຜູ້ຕັດໄມ້ທີ່ມີຢູ່ແມ່ນ cmdline,
ການກວດສອບ, ຖານຄວາມຈໍາ, gui, dns ແລະ ທັງຫມົດ. ການລະບຸ ທັງຫມົດ ເປັນນາມແຝງສໍາລັບການລະບຸທັງໝົດ
ຜູ້ຕັດໄມ້ທີ່ມີຢູ່. ທາງເລືອກທີ່ສາມາດໄດ້ຮັບຫຼາຍຄັ້ງເພື່ອ debug ມີຫຼາຍກ່ວາ
ຄົນຕັດໄມ້ຄົນໜຶ່ງ. ສໍາລັບຜົນໄດ້ຮັບທີ່ຖືກຕ້ອງ, threading ຈະຖືກປິດໃຊ້ງານໃນລະຫວ່າງການແລ່ນດີບັກ.
-FTYPE[/ກຳລັງເຂົ້າລະຫັດ][/ຊື່ເອກະສານ], --file-output=TYPE[/ກຳລັງເຂົ້າລະຫັດ][/ຊື່ເອກະສານ]
ສົ່ງອອກໄປຍັງໄຟລ໌ linkchecker-out.TYPE, $HOME/.linkchecker/ບັນຊີດຳ ສໍາລັບການ blacklist
ຜົນຜະລິດ, ຫຼື ຊື່ເອກະສານ ຖ້າລະບຸ. ໄດ້ ກຳລັງເຂົ້າລະຫັດ ກໍານົດການເຂົ້າລະຫັດຜົນຜະລິດ, ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນຂອງທ້ອງຖິ່ນຂອງທ່ານ. ການເຂົ້າລະຫັດທີ່ຖືກຕ້ອງແມ່ນລະບຸໄວ້ຢູ່
http://docs.python.org/library/codecs.html# ການເຂົ້າລະຫັດມາດຕະຖານ.
ໄດ້ ຊື່ເອກະສານ ແລະ ກຳລັງເຂົ້າລະຫັດ ພາກສ່ວນຂອງ none ປະເພດຜົນຜະລິດຈະຖືກລະເລີຍ, ຖ້າ
ໄຟລ໌ມີຢູ່ແລ້ວ, ມັນຈະຖືກຂຽນທັບ. ທ່ານສາມາດລະບຸທາງເລືອກນີ້ເພີ່ມເຕີມ
ຫຼາຍກວ່າຫນຶ່ງຄັ້ງ. ປະເພດຜົນຜະລິດໄຟລ໌ທີ່ຖືກຕ້ອງແມ່ນ ຂໍ້ຄວາມ, html, sql, csv, gml, ຈຸດ, xml,
ບານ, none or blacklist. ຄ່າເລີ່ມຕົ້ນແມ່ນບໍ່ມີການສົ່ງອອກໄຟລ໌. ປະເພດຜົນຜະລິດຕ່າງໆ
ແມ່ນເອກະສານຂ້າງລຸ່ມນີ້. ໃຫ້ສັງເກດວ່າທ່ານສາມາດສະກັດກັ້ນຜົນຜະລິດ console ທັງຫມົດດ້ວຍທາງເລືອກ
-o none.
--ບໍ່ມີສະຖານະ
ຢ່າພິມຂໍ້ຄວາມກວດສອບສະຖານະ.
-- ບໍ່ມີການເຕືອນ
ຢ່າບັນທຶກການແຈ້ງເຕືອນ. ຄ່າເລີ່ມຕົ້ນແມ່ນເພື່ອບັນທຶກການເຕືອນ.
-oTYPE[/ກຳລັງເຂົ້າລະຫັດ], --output=TYPE[/ກຳລັງເຂົ້າລະຫັດ]
ລະບຸປະເພດຜົນຜະລິດເປັນ ຂໍ້ຄວາມ, html, sql, csv, gml, ຈຸດ, xml, ບານ, none or
blacklist. ປະເພດເລີ່ມຕົ້ນແມ່ນ ຂໍ້ຄວາມ. ປະເພດຜົນຜະລິດຕ່າງໆແມ່ນບັນທຶກໄວ້ຂ້າງລຸ່ມນີ້.
ໄດ້ ກຳລັງເຂົ້າລະຫັດ ລະບຸການເຂົ້າລະຫັດຜົນຜະລິດ, ຄ່າເລີ່ມຕົ້ນແມ່ນຂອງທ້ອງຖິ່ນຂອງທ່ານ.
ການເຂົ້າລະຫັດທີ່ຖືກຕ້ອງແມ່ນລະບຸໄວ້ຢູ່ http://docs.python.org/library/codecs.html#ມາດຕະຖານ-
ການເຂົ້າລະຫັດ.
-q, --ງຽບ
ການດໍາເນີນງານງຽບ, ນາມແຝງສໍາລັບ -o none. ນີ້ແມ່ນພຽງແຕ່ເປັນປະໂຫຍດກັບ -F.
-v, -- verbose
ບັນທຶກທຸກ URL ທີ່ກວດແລ້ວ. ຄ່າເລີ່ມຕົ້ນແມ່ນເພື່ອບັນທຶກຄວາມຜິດພາດແລະຄໍາເຕືອນເທົ່ານັ້ນ.
-WREGEX, --warning-regex=REGEX
ກໍານົດການສະແດງອອກປົກກະຕິທີ່ພິມຄໍາເຕືອນຖ້າຫາກວ່າມັນກົງກັບເນື້ອໃນໃດໆຂອງ
ລິ້ງທີ່ກວດສອບແລ້ວ. ນີ້ໃຊ້ກັບຫນ້າທີ່ຖືກຕ້ອງເທົ່ານັ້ນ, ດັ່ງນັ້ນພວກເຮົາສາມາດໄດ້ຮັບເນື້ອຫາຂອງພວກເຂົາ.
ໃຊ້ນີ້ເພື່ອກວດເບິ່ງຫນ້າທີ່ມີບາງຮູບແບບຂອງຄວາມຜິດພາດ, ຕົວຢ່າງ "ຫນ້ານີ້
ໄດ້ຍ້າຍ" ຫຼື "ຄວາມຜິດພາດຄໍາຮ້ອງສະຫມັກ Oracle".
ໃຫ້ສັງເກດວ່າຫຼາຍຄ່າສາມາດຖືກລວມເຂົ້າກັນໃນການສະແດງຜົນປົກກະຕິ, ຕົວຢ່າງ
"(ໜ້ານີ້ຖືກຍ້າຍ|Oracle Application error)".
ເບິ່ງພາກ REGULAR ການສະແດງອອກ ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.
ການກວດສອບ ທາງເລືອກໃນການ
--cookiefile=ຊື່ເອກະສານ
ອ່ານໄຟລ໌ທີ່ມີຂໍ້ມູນຄຸກກີເບື້ອງຕົ້ນ. ຮູບແບບຂໍ້ມູນຄຸກກີໄດ້ຖືກອະທິບາຍຂ້າງລຸ່ມນີ້.
--check-extern
ກວດເບິ່ງ URL ພາຍນອກ.
--ignore-url=REGEX
URL ທີ່ກົງກັບການສະແດງຜົນປົກກະຕິທີ່ໃຫ້ນັ້ນຈະຖືກລະເລີຍ ແລະຈະບໍ່ຖືກກວດສອບ.
ທາງເລືອກນີ້ສາມາດຖືກມອບໃຫ້ຫຼາຍຄັ້ງ.
ເບິ່ງພາກ REGULAR ການສະແດງອອກ ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.
-Nຄັກ, --nntp-server=ຄັກ
ລະບຸເຊີບເວີ NNTP ສໍາລັບ ຂ່າວ: ການເຊື່ອມຕໍ່. ຄ່າເລີ່ມຕົ້ນແມ່ນຕົວແປສະພາບແວດລ້ອມ
NNTP_SERVER. ຖ້າບໍ່ມີໂຮດຖືກມອບໃຫ້, ພຽງແຕ່ syntax ຂອງການເຊື່ອມຕໍ່ຖືກກວດສອບ.
--no-follow-url=REGEX
ກວດເບິ່ງແຕ່ບໍ່ recurse ເຂົ້າໄປໃນ URLs ທີ່ກົງກັບການສະແດງປົກກະຕິທີ່ໃຫ້.
ທາງເລືອກນີ້ສາມາດຖືກມອບໃຫ້ຫຼາຍຄັ້ງ.
ເບິ່ງພາກ REGULAR ການສະແດງອອກ ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.
-p, -ລະຫັດຜ່ານ
ອ່ານລະຫັດຜ່ານຈາກ console ແລະໃຊ້ມັນສໍາລັບການອະນຸຍາດ HTTP ແລະ FTP. ສໍາລັບ FTP
ລະຫັດຜ່ານເລີ່ມຕົ້ນແມ່ນ ບໍ່ເປີດເຜີຍຊື່@. ສໍາລັບ HTTP ບໍ່ມີລະຫັດຜ່ານເລີ່ມຕົ້ນ. ເບິ່ງນຳ
-u.
-rNUMBER, --recursion-level=NUMBER
ກວດເບິ່ງຄືນທຸກການເຊື່ອມຕໍ່ເຖິງຄວາມເລິກທີ່ໃຫ້ໄວ້. ຄວາມເລິກທາງລົບຈະເປີດໃຊ້ງານ
recursion infinite. ຄວາມເລິກເລີ່ມຕົ້ນແມ່ນບໍ່ມີຂອບເຂດ.
--ໝົດເວລາ=NUMBER
ກໍານົດເວລາຫມົດເວລາສໍາລັບຄວາມພະຍາຍາມເຊື່ອມຕໍ່ເປັນວິນາທີ. ເວລາໝົດເວລາເລີ່ມຕົ້ນແມ່ນ 60
ວິນາທີ.
-uຄັກ, --user=ຄັກ
ລອງໃຊ້ຊື່ຜູ້ໃຊ້ທີ່ໃຫ້ສໍາລັບການອະນຸຍາດ HTTP ແລະ FTP. ສໍາລັບ FTP ເປັນຄ່າເລີ່ມຕົ້ນ
ຊື່ຜູ້ໃຊ້ແມ່ນ anonymous. ສໍາລັບ HTTP ບໍ່ມີຊື່ຜູ້ໃຊ້ເລີ່ມຕົ້ນ. ເບິ່ງນຳ -p.
--user-agent=ຄັກ
ລະບຸສະຕຣິງ User-Agent ເພື່ອສົ່ງໄປຫາເຊີບເວີ HTTP, ຕົວຢ່າງ
"Mozilla/4.0". ຄ່າເລີ່ມຕົ້ນແມ່ນ "LinkChecker/XY" ທີ່ XY ເປັນເວີຊັນປັດຈຸບັນຂອງ
LinkChecker.
CONFIGURATION ເອກະສານ
ໄຟລ໌ການຕັ້ງຄ່າສາມາດລະບຸຕົວເລືອກທັງໝົດຂ້າງເທິງ. ພວກເຂົາເຈົ້າຍັງສາມາດກໍານົດບາງທາງເລືອກທີ່
ບໍ່ສາມາດຕັ້ງຢູ່ໃນເສັ້ນຄໍາສັ່ງ. ເບິ່ງ linkcheckerrc(5) ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.
OUTPUT TYPES
ໃຫ້ສັງເກດວ່າໂດຍຄ່າເລີ່ມຕົ້ນພຽງແຕ່ຄວາມຜິດພາດແລະຄໍາເຕືອນທີ່ຖືກບັນທຶກ. ທ່ານຄວນໃຊ້ -- verbose
ທາງເລືອກທີ່ຈະໄດ້ຮັບບັນຊີລາຍການ URL ທີ່ສົມບູນ, ໂດຍສະເພາະແມ່ນໃນເວລາທີ່ອອກຮູບແບບກຣາຟແຜນທີ່ເວັບໄຊຕ໌.
ຂໍ້ຄວາມ ຕົວບັນທຶກຂໍ້ຄວາມມາດຕະຖານ, ບັນທຶກ URL ໃນຄໍາສໍາຄັນ: ຄົນອັບເດດ: ການໂຕ້ຖຽງ.
html ບັນທຶກ URL ໃນຄໍາສໍາຄັນ: ຄົນອັບເດດ: argument, ຮູບແບບເປັນ HTML. ນອກຈາກນີ້ຍັງມີການເຊື່ອມຕໍ່
ໄປຫາຫນ້າທີ່ອ້າງອີງ. URL ທີ່ບໍ່ຖືກຕ້ອງມີການເຊື່ອມໂຍງການກວດສອບ syntax HTML ແລະ CSS
ຕໍ່ທ້າຍ.
csv ບັນທຶກຜົນການກວດສອບໃນຮູບແບບ CSV ທີ່ມີຫນຶ່ງ URL ຕໍ່ແຖວ.
gml ບັນທຶກຄວາມສໍາພັນຂອງພໍ່ແມ່ກັບລູກລະຫວ່າງ URL ທີ່ເຊື່ອມໂຍງເປັນກຣາຟແຜນຜັງເວັບໄຊທ໌ GML.
ຈຸດ ບັນທຶກຄວາມສໍາພັນຂອງພໍ່ແມ່ກັບລູກລະຫວ່າງ URL ທີ່ເຊື່ອມຕໍ່ເປັນກາຟແຜນຜັງເວັບໄຊທ໌ DOT.
gxml ບັນທຶກຜົນການກວດສອບເປັນກຣາຟແຜນຜັງເວັບໄຊທ໌ GraphXML.
xml ບັນທຶກຜົນການກວດສອບເປັນ XML ທີ່ເຄື່ອງອ່ານໄດ້.
ບານ
ບັນທຶກຜົນການກວດສອບເປັນແຜນຜັງເວັບໄຊທ໌ XML ທີ່ໂປຣໂຕຄໍຖືກບັນທຶກຢູ່
http://www.sitemaps.org/protocol.html.
sql ບັນທຶກຜົນການກວດສອບເປັນສະຄິບ SQL ດ້ວຍຄໍາສັ່ງ INSERT. ຕົວຢ່າງ script ເພື່ອສ້າງ
ຕາຕະລາງ SQL ເບື້ອງຕົ້ນແມ່ນລວມເປັນ create.sql.
blacklist
ເຫມາະສໍາລັບວຽກ cron. ບັນທຶກຜົນການກວດສອບເຂົ້າໄປໃນໄຟລ໌ ~/.linkchecker/ບັນຊີດຳ
ເຊິ່ງມີພຽງແຕ່ລາຍການທີ່ມີ URL ທີ່ບໍ່ຖືກຕ້ອງແລະຈໍານວນເວລາທີ່ເຂົາເຈົ້າມີ
ລົ້ມເຫຼວ.
none ບັນທຶກບໍ່ມີຫຍັງ. ເຫມາະສໍາລັບ debugging ຫຼືການກວດສອບລະຫັດອອກ.
REGULAR ການສະແດງອອກ
LinkChecker ຍອມຮັບການສະແດງອອກປົກກະຕິ Python. ເບິ່ງ http://docs.python.org/
howto/regex.html ສໍາລັບການແນະນໍາ.
ນອກຈາກນັ້ນ, ເຄື່ອງຫມາຍ exclamation ນໍາພາປະຕິເສດການສະແດງອອກປົກກະຕິ.
ຄຸກກີ ເອກະສານ
ໄຟລ໌ຄຸກກີມີຂໍ້ມູນສ່ວນຫົວ HTTP ມາດຕະຖານ (RFC 2616) ທີ່ເປັນໄປໄດ້ຕໍ່ໄປນີ້
ຊື່:
ເຈົ້າພາບ (ຕ້ອງການ)
ກໍານົດໂດເມນທີ່ cookies ຖືກຕ້ອງສໍາລັບ.
ເສັ້ນທາງ (ທາງເລືອກ)
ໃຫ້ເສັ້ນທາງທີ່ cookies ມີມູນຄ່າສໍາລັບ; ເສັ້ນທາງເລີ່ມຕົ້ນແມ່ນ /.
ຕັ້ງຄຸກກີ້ (ຕ້ອງການ)
ຕັ້ງຊື່/ຄ່າຄຸກກີ. ສາມາດໃຫ້ຫຼາຍກວ່າຫນຶ່ງຄັ້ງ.
ຫຼາຍລາຍການຖືກແຍກອອກດ້ວຍແຖວຫວ່າງເປົ່າ. ຕົວຢ່າງຂ້າງລຸ່ມນີ້ຈະສົ່ງສອງ cookies
ໄປຫາທຸກ URL ເລີ່ມຕົ້ນດ້ວຍ http://example.com/hello/ ແລະຫນຶ່ງໄປຫາທຸກ URL ເລີ່ມຕົ້ນດ້ວຍ
https://example.org/:
ເຈົ້າພາບ: example.com
ເສັ້ນທາງ: /ສະບາຍດີ
ຊຸດຄຸກກີ້: ID="smee"
Set-cookie: spam="egg"
ເຈົ້າພາບ: example.org
Set-cookie: baggage="elitist"; ຄໍາເຫັນ = "hologram"
ຕົວແທນ ສະຫນັບສະຫນູນ
ເພື່ອໃຊ້ພຣັອກຊີໃນ Unix ຫຼື Windows ຕັ້ງ $http_proxy, $https_proxy ຫຼື $ftp_proxy
ຕົວແປສະພາບແວດລ້ອມຕໍ່ກັບ URL ຕົວແທນ. URL ຄວນເປັນຮູບແບບ
http://[ຜູ້ໃຊ້:ຜ່ານ@]ເຈົ້າພາບ[:port]. LinkChecker ຍັງກວດພົບການຕັ້ງຄ່າພຣັອກຊີຄູ່ມືຂອງ
Internet Explorer ພາຍໃຕ້ລະບົບ Windows, ແລະ gconf ຫຼື KDE ໃນລະບົບ Linux. ໃນການນໍາໃຊ້ Mac
Internet Config ເພື່ອເລືອກຕົວແທນ. ນອກນັ້ນທ່ານຍັງສາມາດກໍານົດບັນຊີລາຍຊື່ໂດເມນທີ່ແຍກດ້ວຍເຄື່ອງໝາຍຈຸດໃນ
ຕົວແປສະພາບແວດລ້ອມ $no_proxy ທີ່ຈະບໍ່ສົນໃຈການຕັ້ງຄ່າຕົວແທນໃດໆສໍາລັບໂດເມນເຫຼົ່ານີ້.
ການຕັ້ງຄ່າ HTTP proxy ໃນ Unix ຕົວຢ່າງເບິ່ງຄືວ່ານີ້:
ສົ່ງອອກ http_proxy="http://proxy.example.com: 8080 "
ການຮັບຮອງຄວາມຖືກຕ້ອງຂອງພຣັອກຊີຍັງຮອງຮັບ:
ສົ່ງອອກ http_proxy="http://user1:[email protected]: 8081 "
ການຕັ້ງຄ່າຕົວແທນຢູ່ໃນຄໍາສັ່ງຂອງ Windows:
ຕັ້ງ http_proxy=http://proxy.example.com: 8080
ປະຕິບັດ ກວດເບິ່ງ
URL ທັງໝົດຕ້ອງຜ່ານການທົດສອບ syntax ເບື້ອງຕົ້ນ. ຄວາມຜິດພາດການອ້າງອີງເລັກນ້ອຍຈະອອກເປັນ
ການເຕືອນໄພ, ບັນຫາ syntax ທີ່ບໍ່ຖືກຕ້ອງທັງຫມົດແມ່ນຄວາມຜິດພາດ. ຫຼັງຈາກການກວດສອບ syntax ຜ່ານ, ໄດ້
URL ແມ່ນຢູ່ໃນຄິວສໍາລັບການກວດສອບການເຊື່ອມຕໍ່. ປະເພດຂອງການກວດສອບການເຊື່ອມຕໍ່ທັງຫມົດແມ່ນໄດ້ອະທິບາຍຂ້າງລຸ່ມນີ້.
ລິ້ງ HTTP (http:, https:)
ຫຼັງຈາກເຊື່ອມຕໍ່ກັບເຄື່ອງແມ່ຂ່າຍ HTTP ທີ່ໃຫ້, ເສັ້ນທາງຫຼືການສອບຖາມແມ່ນຮ້ອງຂໍ. ທັງໝົດ
ການປ່ຽນເສັ້ນທາງແມ່ນປະຕິບັດຕາມ, ແລະຖ້າຜູ້ໃຊ້ / ລະຫັດຜ່ານຖືກມອບໃຫ້, ມັນຈະຖືກນໍາໃຊ້ເປັນ
ການອະນຸຍາດເມື່ອມີຄວາມຈໍາເປັນ. ລະຫັດສະຖານະ HTTP ສຸດທ້າຍທັງໝົດນອກຈາກ 2xx ແມ່ນ
ຄວາມຜິດພາດ. ເນື້ອໃນຂອງຫນ້າ HTML ຖືກກວດສອບການເອີ້ນຄືນ.
ໄຟລ໌ທ້ອງຖິ່ນ (file:)
ໄຟລ໌ປົກກະຕິທີ່ສາມາດອ່ານໄດ້ທີ່ສາມາດເປີດໄດ້ແມ່ນຖືກຕ້ອງ. ໄດເລກະທໍລີທີ່ສາມາດອ່ານໄດ້ເຊັ່ນກັນ
ຖືກຕ້ອງ. ໄຟລ໌ອື່ນໆທັງໝົດ, ຕົວຢ່າງໄຟລ໌ອຸປະກອນ, ໄຟລ໌ທີ່ບໍ່ສາມາດອ່ານໄດ້ ຫຼືບໍ່ມີຢູ່ແລ້ວ
ມີຄວາມຜິດພາດ. HTML ຫຼືເນື້ອຫາໄຟລ໌ທີ່ວິເຄາະໄດ້ອື່ນໆແມ່ນຖືກກວດສອບການເອີ້ນຄືນ.
ລິ້ງທາງໄປສະນີ (mailto:)
A mailto: ໃນທີ່ສຸດການເຊື່ອມຕໍ່ແກ້ໄຂບັນຊີລາຍຊື່ຂອງທີ່ຢູ່ອີເມວ. ຖ້າທີ່ຢູ່ຫນຶ່ງ
ລົ້ມເຫລວ, ບັນຊີລາຍຊື່ທັງຫມົດຈະລົ້ມເຫລວ. ສໍາລັບແຕ່ລະທີ່ຢູ່ອີເມວພວກເຮົາກວດເບິ່ງຕໍ່ໄປນີ້
ສິ່ງຂອງ:
1) ກວດເບິ່ງ syntax ທີ່ຢູ່, ທັງສອງສ່ວນກ່ອນແລະຫຼັງ
ສັນຍາລັກ @.
2) ຊອກຫາບັນທຶກ MX DNS. ຖ້າພວກເຮົາບໍ່ພົບບັນທຶກ MX,
ພິມຄວາມຜິດພາດ.
3) ກວດເບິ່ງວ່າຫນຶ່ງໃນແມ່ຂ່າຍເມລຍອມຮັບການເຊື່ອມຕໍ່ SMTP.
ກວດເບິ່ງເຈົ້າພາບທີ່ມີບູລິມະສິດສູງກວ່າກ່ອນ.
ຖ້າບໍ່ມີເຈົ້າພາບຍອມຮັບ SMTP, ພວກເຮົາພິມຄໍາເຕືອນ.
4) ພະຍາຍາມກວດສອບທີ່ຢູ່ດ້ວຍຄໍາສັ່ງ VRFY. ຖ້າພວກເຮົາໄດ້ຮັບ
ຄໍາຕອບ, ພິມທີ່ຢູ່ຢືນຢັນເປັນຂໍ້ມູນ.
ລິ້ງ FTP (ftp:)
ສໍາລັບການເຊື່ອມຕໍ່ FTP ພວກເຮົາເຮັດ:
1) ເຊື່ອມຕໍ່ກັບເຈົ້າພາບທີ່ກໍານົດໄວ້
2) ພະຍາຍາມເຂົ້າສູ່ລະບົບດ້ວຍຜູ້ໃຊ້ແລະລະຫັດຜ່ານທີ່ໃຫ້. ຄ່າເລີ່ມຕົ້ນ
ຜູ້ໃຊ້ແມ່ນ ``anonymous``, ລະຫັດຜ່ານເລີ່ມຕົ້ນແມ່ນ ``anonymous@``.
3) ພະຍາຍາມປ່ຽນໄປຫາໄດເລກະທໍລີທີ່ໃຫ້
4) ລາຍຊື່ໄຟລ໌ດ້ວຍຄໍາສັ່ງ NLST
ການເຊື່ອມຕໍ່ Telnet (``telnet:``)
ພວກເຮົາພະຍາຍາມເຊື່ອມຕໍ່ແລະຖ້າຜູ້ໃຊ້ / ລະຫັດຜ່ານຖືກມອບໃຫ້, ເຂົ້າສູ່ລະບົບ
ເຊີບເວີ telnet ທີ່ມອບໃຫ້.
ລິ້ງ NNTP (``ຂ່າວ:``, ``ຂ່າວ:``, ``nntp``)
ພວກເຮົາພະຍາຍາມເຊື່ອມຕໍ່ກັບເຄື່ອງແມ່ຂ່າຍ NNTP ທີ່ໃຫ້. ຖ້າກຸ່ມຂ່າວ ຫຼື
ບົດຄວາມຖືກລະບຸ, ພະຍາຍາມຮ້ອງຂໍມັນຈາກເຄື່ອງແມ່ຂ່າຍ.
ລິ້ງທີ່ບໍ່ຮອງຮັບ (``javascript:``, ແລະອື່ນໆ.
ລິ້ງທີ່ບໍ່ຮອງຮັບຈະພິມຄຳເຕືອນເທົ່ານັ້ນ. ບໍ່ມີການກວດສອບເພີ່ມເຕີມ
ຈະຖືກເຮັດ.
ບັນຊີລາຍຊື່ຄົບຖ້ວນຂອງການຮັບຮູ້, ແຕ່ການເຊື່ອມຕໍ່ທີ່ບໍ່ສະຫນັບສະຫນູນສາມາດພົບໄດ້
ໃນ linkcheck/checker/unknownurl.py ແຫຼ່ງໄຟລ໌.
ທີ່ໂດດເດັ່ນທີ່ສຸດຂອງພວກເຂົາຄວນຈະເປັນການເຊື່ອມໂຍງ JavaScript.
PLUGINS
ມີສອງປະເພດ plugins: ການເຊື່ອມຕໍ່ແລະ plugins ເນື້ອຫາ. plugins ການເຊື່ອມຕໍ່ແມ່ນດໍາເນີນການ
ຫຼັງຈາກການເຊື່ອມຕໍ່ສົບຜົນສໍາເລັດກັບເຈົ້າພາບ URL. plugins ເນື້ອຫາແມ່ນດໍາເນີນການຖ້າຫາກວ່າປະເພດ URL
ມີເນື້ອຫາ (mailto: URLs ບໍ່ມີເນື້ອຫາສໍາລັບຕົວຢ່າງ) ແລະຖ້າການກວດສອບບໍ່ໄດ້ຖືກຫ້າມ
(ເຊັ່ນ: ໂດຍ HTTP robots.txt). ເບິ່ງ ຕົວກວດເຊື່ອມຕໍ່ --list-plugins ສໍາລັບບັນຊີລາຍຊື່ຂອງ plugins ແລະຂອງເຂົາເຈົ້າ
ເອກະສານ. plugins ທັງຫມົດແມ່ນເປີດນໍາໃຊ້ໂດຍຜ່ານການ linkcheckerrc(5) ໄຟລ໌ການຕັ້ງຄ່າ.
ກັບຄືນ
ກ່ອນທີ່ຈະຫຼຸດລົງ recursively ເຂົ້າໄປໃນ URL, ມັນຕ້ອງປະຕິບັດຕາມເງື່ອນໄຂຈໍານວນຫນຶ່ງ. ພວກເຂົາແມ່ນ
ກວດສອບໃນຄໍາສັ່ງນີ້:
1. URL ຕ້ອງຖືກຕ້ອງ.
2. URL ຕ້ອງສາມາດວິເຄາະໄດ້. ໃນປັດຈຸບັນນີ້ປະກອບມີໄຟລ໌ HTML,
Opera bookmarks ໄຟລ໌, ແລະໄດເລກະທໍລີ. ຖ້າປະເພດໄຟລ໌ບໍ່ສາມາດ
ຖືກກໍານົດ (ຕົວຢ່າງມັນບໍ່ມີໄຟລ໌ HTML ທົ່ວໄປ
ການຂະຫຍາຍ, ແລະເນື້ອຫາບໍ່ຄືກັບ HTML), ມັນສົມມຸດວ່າ
ທີ່ຈະບໍ່ສາມາດວິເຄາະໄດ້.
3. ເນື້ອຫາ URL ຕ້ອງສາມາດດຶງຂໍ້ມູນໄດ້. ນີ້ແມ່ນປົກກະຕິແລ້ວກໍລະນີ
ຍົກເວັ້ນຕົວຢ່າງ mailto: ຫຼືປະເພດ URL ທີ່ບໍ່ຮູ້ຈັກ.
4. ລະດັບ recursion ສູງສຸດຈະຕ້ອງບໍ່ເກີນ. ມັນຖືກຕັ້ງຄ່າ
ກັບ --recursion ລະດັບ ທາງເລືອກແລະບໍ່ຈໍາກັດຕໍ່ຄ່າເລີ່ມຕົ້ນ.
5. ມັນຕ້ອງບໍ່ກົງກັບລາຍຊື່ URL ທີ່ລະເລີຍ. ອັນນີ້ຖືກຄວບຄຸມດ້ວຍ
ໄດ້ --ignore-url ທາງເລືອກ.
6. Robots Exclusion Protocol ຕ້ອງອະນຸຍາດໃຫ້ເຊື່ອມຕໍ່ໃນ URL ເປັນ
ປະຕິບັດຕາມ recursively. ນີ້ແມ່ນການກວດສອບໂດຍການຊອກຫາ a
ຄໍາສັ່ງ "nofollow" ໃນຂໍ້ມູນສ່ວນຫົວ HTML.
ຈົ່ງຈື່ໄວ້ວ່າ recursion ໄດເລກະທໍລີອ່ານໄຟລ໌ທັງຫມົດໃນໄດເລກະທໍລີນັ້ນ, ບໍ່ພຽງແຕ່ຊຸດຍ່ອຍເທົ່ານັ້ນ
ຄື index.htm*.
ຫມາຍເຫດ
URLs ໃນຄໍາສັ່ງເລີ່ມຕົ້ນດ້ວຍ ftp ຖືກປະຕິບັດຄື ftp://ftp., URL ເລີ່ມຕົ້ນດ້ວຍ
www. ຖືກປະຕິບັດຄື http://www.. ນອກນັ້ນທ່ານຍັງສາມາດໃຫ້ໄຟລ໌ທ້ອງຖິ່ນເປັນການໂຕ້ຖຽງ.
ຖ້າຫາກທ່ານມີການຕັ້ງຄ່າລະບົບຂອງທ່ານເພື່ອສ້າງຕັ້ງການເຊື່ອມຕໍ່ອິນເຕີເນັດອັດຕະໂນມັດ
(ເຊັ່ນ: ມີ diald), ມັນຈະເຊື່ອມຕໍ່ໃນເວລາທີ່ການກວດສອບການເຊື່ອມຕໍ່ບໍ່ຊີ້ໄປຫາເຈົ້າພາບທ້ອງຖິ່ນຂອງທ່ານ.
ການນໍາໃຊ້ --ignore-url ທາງເລືອກເພື່ອປ້ອງກັນການນີ້.
ບໍ່ຮອງຮັບການເຊື່ອມຕໍ່ Javascript.
ຖ້າເວທີຂອງທ່ານບໍ່ສະຫນັບສະຫນູນ threading, LinkChecker ປິດມັນອັດຕະໂນມັດ.
ທ່ານສາມາດສະຫນອງຫຼາຍຄູ່ຜູ້ໃຊ້ / ລະຫັດຜ່ານໃນໄຟລ໌ການຕັ້ງຄ່າ.
ເມື່ອກວດສອບ ຂ່າວ: ເຊື່ອມຕໍ່ໂຮດ NNTP ທີ່ໃຫ້ມາບໍ່ຈໍາເປັນຕ້ອງເປັນເຈົ້າພາບຂອງ
ຜູ້ໃຊ້ຊອກຫາຫນ້າເວັບຂອງທ່ານ.
ENVIRONMENT
NNTP_SERVER - ກໍານົດເຄື່ອງແມ່ຂ່າຍ NNTP ເລີ່ມຕົ້ນ
http_proxy - ລະບຸເຄື່ອງແມ່ຂ່າຍພຣັອກຊີ HTTP ເລີ່ມຕົ້ນ
ftp_proxy - ກໍານົດເຄື່ອງແມ່ຂ່າຍພຣັອກຊີ FTP ເລີ່ມຕົ້ນ
no_proxy - ລາຍຊື່ໂດເມນທີ່ແຍກກັນດ້ວຍເຄື່ອງໝາຍຈຸດເພື່ອບໍ່ໃຫ້ຕິດຕໍ່ຜ່ານເຊີບເວີພຣັອກຊີ
LC_MESSAGES, ພາສາ, LANGUAGE - ກໍານົດພາສາຜະລິດຕະພັນ
ກັບຄືນ ມູນຄ່າ
ຄ່າກັບຄືນແມ່ນ 2 ເມື່ອ
· ເກີດຄວາມຜິດພາດໃນໂປຣແກຣມ.
ຄ່າກັບຄືນແມ່ນ 1 ເມື່ອ
· ການເຊື່ອມຕໍ່ທີ່ບໍ່ຖືກຕ້ອງໄດ້ຖືກພົບເຫັນຫຼື
· ການເຕືອນກ່ຽວກັບການເຊື່ອມຕໍ່ໄດ້ຖືກພົບເຫັນແລະການແຈ້ງເຕືອນໄດ້ຖືກເປີດໃຊ້ງານ
ຖ້າບໍ່ດັ່ງນັ້ນຄ່າກັບຄືນແມ່ນສູນ.
ຂອບເຂດ ຈຳ ກັດ
LinkChecker ໃຊ້ຫນ່ວຍຄວາມຈໍາສໍາລັບແຕ່ລະ URL ທີ່ຄິວເພື່ອກວດສອບ. ດ້ວຍຫລາຍພັນ URLs ຄິວ
ຈໍານວນຫນ່ວຍຄວາມຈໍາທີ່ບໍລິໂພກສາມາດກາຍເປັນຂະຫນາດໃຫຍ່ຂ້ອນຂ້າງ. ນີ້ອາດຈະຊ້າລົງໂຄງການຫຼື
ເຖິງແມ່ນວ່າລະບົບທັງຫມົດ.
ໃຊ້ linkchecker ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net