ພາສາອັງກິດພາສາຝຣັ່ງແອສປາໂຍນ

ແລ່ນເຊີບເວີ | Ubuntu > | Fedora > |


OnWorks favicon

linkchecker - ອອນໄລນ໌ຢູ່ໃນຄລາວ

ເປີດໃຊ້ linkchecker ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີຜ່ານ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ນີ້ແມ່ນຕົວເຊື່ອມຕໍ່ຄໍາສັ່ງທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator

ໂຄງການ:

NAME


linkchecker - ລູກຄ້າເສັ້ນຄໍາສັ່ງເພື່ອກວດເບິ່ງເອກະສານ HTML ແລະເວັບໄຊທ໌ສໍາລັບການເຊື່ອມຕໍ່ທີ່ແຕກຫັກ

ສະຫຼຸບສັງລວມ


ຕົວກວດເຊື່ອມຕໍ່ [ທາງເລືອກໃນການ] [file-or-url] ...

ລາຍລະອຽດ


ຄຸນ​ນະ​ສົມ​ບັດ LinkChecker​

· ການ​ກວດ​ສອບ recursive ແລະ multithreaded​,

·ຜົນຜະລິດໃນຂໍ້ຄວາມສີຫຼືປົກກະຕິ, HTML, SQL, CSV, XML ຫຼືກາຟແຜນຜັງເວັບໄຊທ໌ໃນ
ຮູບ​ແບບ​ທີ່​ແຕກ​ຕ່າງ​ກັນ​,

· ຮອງຮັບ HTTP/1.1, HTTPS, FTP, mailto:, news:, nnp:, Telnet ແລະໄຟລ໌ທ້ອງຖິ່ນ
ລິ້ງຄ໌,

· ຂໍ້​ຈໍາ​ກັດ​ຂອງ​ການ​ກວດ​ສອບ​ການ​ເຊື່ອມ​ຕໍ່​ກັບ​ຕົວ​ກັ່ນ​ຕອງ URL​,

· ສະ​ຫນັບ​ສະ​ຫນູນ​ຕົວ​ແທນ​,

· ການ​ອະ​ນຸ​ຍາດ​ຊື່​ຜູ້​ໃຊ້ / ລະ​ຫັດ​ຜ່ານ​ສໍາ​ລັບ HTTP​, FTP ແລະ Telnet​,

·ສະຫນັບສະຫນູນສໍາລັບ protocol ການຍົກເວັ້ນ robots.txt,

·ສະຫນັບສະຫນູນສໍາລັບ Cookies

·ສະຫນັບສະຫນູນສໍາລັບ HTML5

· HTML ແລະ CSS ກວດສອບ syntax

· ການ​ກວດ​ສອບ Antivirus​

·ເສັ້ນຄໍາສັ່ງ, GUI ແລະການໂຕ້ຕອບເວັບໄຊຕ໌

ຕົວຢ່າງ


ການນໍາໃຊ້ທົ່ວໄປທີ່ສຸດກວດເບິ່ງໂດເມນທີ່ໃຫ້ recursively:
ຕົວກວດເຊື່ອມຕໍ່ http://www.example.com/
ຈົ່ງລະວັງວ່ານີ້ຈະກວດເບິ່ງເວັບໄຊທ໌ທັງຫມົດທີ່ສາມາດມີຫລາຍພັນ URLs. ໃຊ້ -r
ທາງເລືອກທີ່ຈະຈໍາກັດຄວາມເລິກ recursion.
ຢ່າກວດເບິ່ງ URL ດ້ວຍ /ລັບ ໃນ​ຊື່​ຂອງ​ຕົນ​. ລິ້ງອື່ນໆທັງໝົດຖືກກວດສອບຕາມປົກກະຕິ:
ຕົວກວດເຊື່ອມຕໍ່ --ignore-url=/ລັບ mysite.example.com
ການກວດສອບໄຟລ໌ HTML ທ້ອງຖິ່ນໃນ Unix:
ຕົວກວດເຊື່ອມຕໍ່ ../bla.html
ການກວດສອບໄຟລ໌ HTML ທ້ອງຖິ່ນໃນ Windows:
ຕົວກວດເຊື່ອມຕໍ່ c:\temp\test.html
ທ່ານສາມາດຂ້າມ http:// ສ່ວນ url ຖ້າໂດເມນເລີ່ມຕົ້ນດ້ວຍ www.:
ຕົວກວດເຊື່ອມຕໍ່ wwwexamplecom
ທ່ານສາມາດຂ້າມ ftp: // ສ່ວນ url ຖ້າໂດເມນເລີ່ມຕົ້ນດ້ວຍ ftp:
ຕົວກວດເຊື່ອມຕໍ່ -r0 ftp.example.com
ສ້າງກຣາຟແຜນຜັງເວັບໄຊທ໌ ແລະປ່ຽນມັນດ້ວຍ graphviz dot utility:
ຕົວກວດເຊື່ອມຕໍ່ -ໂອດອດ -v wwwexamplecom | ຈຸດ -Tps > sitemap.ps

OPTIONS


ໂດຍ​ທົ່ວ​ໄປ ທາງເລືອກໃນການ
-fຊື່​ເອ​ກະ​ສານ, --config=ຊື່​ເອ​ກະ​ສານ
ການນໍາໃຊ້ ຊື່​ເອ​ກະ​ສານ ເປັນໄຟລ໌ການຕັ້ງຄ່າ. ດັ່ງທີ່ LinkChecker ເລີ່ມຕົ້ນໃຊ້
~/.linkchecker/linkcheckerrc.

-h, - ຊ່ວຍ
ຊ່ວຍ​ຂ້ອຍ​ແດ່! ພິມຂໍ້ມູນການນໍາໃຊ້ສໍາລັບໂຄງການນີ້.

--stdin
ອ່ານລາຍຊື່ຂອງຊ່ອງຫວ່າງທີ່ແຍກອອກຈາກ URL ເພື່ອກວດສອບຈາກ stdin.

-tNUMBER, --ກະທູ້=NUMBER
ສ້າງບໍ່ເກີນຈຳນວນກະທູ້ທີ່ກຳນົດ. ຈໍານວນເລີ່ມຕົ້ນຂອງຫົວຂໍ້ແມ່ນ
100. ເພື່ອປິດການໃຊ້ງານ threading ໃຫ້ລະບຸຕົວເລກທີ່ບໍ່ແມ່ນບວກ.

-V, - ການປ່ຽນແປງ
ພິມສະບັບແລະອອກ.

--list-plugins
ພິມປລັກອິນກວດສອບທີ່ມີໃຫ້ແລ້ວອອກ.

ຜົນຜະລິດ ທາງເລືອກໃນການ
-Dຄັກ, --debug=ຄັກ
ພິມຜົນການດີບັ໊ກອອກສຳລັບຕົວຕັດໄມ້ທີ່ໃຫ້ມາ. ຜູ້ຕັດໄມ້ທີ່ມີຢູ່ແມ່ນ cmdline,
ການກວດສອບ, ຖານຄວາມຈໍາ, gui, dns ແລະ ທັງຫມົດ. ການລະບຸ ທັງຫມົດ ເປັນນາມແຝງສໍາລັບການລະບຸທັງໝົດ
ຜູ້ຕັດໄມ້ທີ່ມີຢູ່. ທາງ​ເລືອກ​ທີ່​ສາ​ມາດ​ໄດ້​ຮັບ​ຫຼາຍ​ຄັ້ງ​ເພື່ອ debug ມີ​ຫຼາຍ​ກ​່​ວາ​
ຄົນຕັດໄມ້ຄົນໜຶ່ງ. ສໍາລັບຜົນໄດ້ຮັບທີ່ຖືກຕ້ອງ, threading ຈະຖືກປິດໃຊ້ງານໃນລະຫວ່າງການແລ່ນດີບັກ.

-FTYPE[/ກຳລັງເຂົ້າລະຫັດ][/ຊື່​ເອ​ກະ​ສານ], --file-output=TYPE[/ກຳລັງເຂົ້າລະຫັດ][/ຊື່​ເອ​ກະ​ສານ]
ສົ່ງອອກໄປຍັງໄຟລ໌ linkchecker-out.TYPE, $HOME/.linkchecker/ບັນຊີດຳ ສໍາລັບການ blacklist
ຜົນຜະລິດ, ຫຼື ຊື່​ເອ​ກະ​ສານ ຖ້າລະບຸ. ໄດ້ ກຳລັງເຂົ້າລະຫັດ ກໍານົດການເຂົ້າລະຫັດຜົນຜະລິດ, ໄດ້
ຄ່າເລີ່ມຕົ້ນແມ່ນຂອງທ້ອງຖິ່ນຂອງທ່ານ. ການເຂົ້າລະຫັດທີ່ຖືກຕ້ອງແມ່ນລະບຸໄວ້ຢູ່
http://docs.python.org/library/codecs.html# ການເຂົ້າລະຫັດມາດຕະຖານ.
ໄດ້ ຊື່​ເອ​ກະ​ສານ ແລະ ກຳລັງເຂົ້າລະຫັດ ພາກສ່ວນຂອງ none ປະເພດຜົນຜະລິດຈະຖືກລະເລີຍ, ຖ້າ
ໄຟລ໌ມີຢູ່ແລ້ວ, ມັນຈະຖືກຂຽນທັບ. ທ່ານສາມາດລະບຸທາງເລືອກນີ້ເພີ່ມເຕີມ
ຫຼາຍກວ່າຫນຶ່ງຄັ້ງ. ປະເພດຜົນຜະລິດໄຟລ໌ທີ່ຖືກຕ້ອງແມ່ນ ຂໍ້ຄວາມ, html, sql, csv, gml, ຈຸດ, xml,
ບານ, none or blacklist. ຄ່າເລີ່ມຕົ້ນແມ່ນບໍ່ມີການສົ່ງອອກໄຟລ໌. ປະເພດຜົນຜະລິດຕ່າງໆ
ແມ່ນເອກະສານຂ້າງລຸ່ມນີ້. ໃຫ້ສັງເກດວ່າທ່ານສາມາດສະກັດກັ້ນຜົນຜະລິດ console ທັງຫມົດດ້ວຍທາງເລືອກ
-o none.

--ບໍ່ມີສະຖານະ
ຢ່າພິມຂໍ້ຄວາມກວດສອບສະຖານະ.

-- ບໍ່ມີການເຕືອນ
ຢ່າບັນທຶກການແຈ້ງເຕືອນ. ຄ່າເລີ່ມຕົ້ນແມ່ນເພື່ອບັນທຶກການເຕືອນ.

-oTYPE[/ກຳລັງເຂົ້າລະຫັດ], --output=TYPE[/ກຳລັງເຂົ້າລະຫັດ]
ລະບຸປະເພດຜົນຜະລິດເປັນ ຂໍ້ຄວາມ, html, sql, csv, gml, ຈຸດ, xml, ບານ, none or
blacklist. ປະເພດເລີ່ມຕົ້ນແມ່ນ ຂໍ້ຄວາມ. ປະເພດຜົນຜະລິດຕ່າງໆແມ່ນບັນທຶກໄວ້ຂ້າງລຸ່ມນີ້.
ໄດ້ ກຳລັງເຂົ້າລະຫັດ ລະບຸການເຂົ້າລະຫັດຜົນຜະລິດ, ຄ່າເລີ່ມຕົ້ນແມ່ນຂອງທ້ອງຖິ່ນຂອງທ່ານ.
ການເຂົ້າລະຫັດທີ່ຖືກຕ້ອງແມ່ນລະບຸໄວ້ຢູ່ http://docs.python.org/library/codecs.html#ມາດຕະຖານ-
ການເຂົ້າລະຫັດ.

-q, --ງຽບ
ການດໍາເນີນງານງຽບ, ນາມແຝງສໍາລັບ -o none. ນີ້ແມ່ນພຽງແຕ່ເປັນປະໂຫຍດກັບ -F.

-v, -- verbose
ບັນທຶກທຸກ URL ທີ່ກວດແລ້ວ. ຄ່າເລີ່ມຕົ້ນແມ່ນເພື່ອບັນທຶກຄວາມຜິດພາດແລະຄໍາເຕືອນເທົ່ານັ້ນ.

-WREGEX, --warning-regex=REGEX
ກໍານົດການສະແດງອອກປົກກະຕິທີ່ພິມຄໍາເຕືອນຖ້າຫາກວ່າມັນກົງກັບເນື້ອໃນໃດໆຂອງ
ລິ້ງທີ່ກວດສອບແລ້ວ. ນີ້ໃຊ້ກັບຫນ້າທີ່ຖືກຕ້ອງເທົ່ານັ້ນ, ດັ່ງນັ້ນພວກເຮົາສາມາດໄດ້ຮັບເນື້ອຫາຂອງພວກເຂົາ.
ໃຊ້ນີ້ເພື່ອກວດເບິ່ງຫນ້າທີ່ມີບາງຮູບແບບຂອງຄວາມຜິດພາດ, ຕົວຢ່າງ "ຫນ້ານີ້
ໄດ້ຍ້າຍ" ຫຼື "ຄວາມຜິດພາດຄໍາຮ້ອງສະຫມັກ Oracle".
ໃຫ້ສັງເກດວ່າຫຼາຍຄ່າສາມາດຖືກລວມເຂົ້າກັນໃນການສະແດງຜົນປົກກະຕິ, ຕົວຢ່າງ
"(ໜ້ານີ້ຖືກຍ້າຍ|Oracle Application error)".
ເບິ່ງພາກ REGULAR ການສະແດງອອກ ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.

ການກວດສອບ ທາງເລືອກໃນການ
--cookiefile=ຊື່​ເອ​ກະ​ສານ
ອ່ານໄຟລ໌ທີ່ມີຂໍ້ມູນຄຸກກີເບື້ອງຕົ້ນ. ຮູບແບບຂໍ້ມູນຄຸກກີໄດ້ຖືກອະທິບາຍຂ້າງລຸ່ມນີ້.

--check-extern
ກວດເບິ່ງ URL ພາຍນອກ.

--ignore-url=REGEX
URL ທີ່ກົງກັບການສະແດງຜົນປົກກະຕິທີ່ໃຫ້ນັ້ນຈະຖືກລະເລີຍ ແລະຈະບໍ່ຖືກກວດສອບ.
ທາງເລືອກນີ້ສາມາດຖືກມອບໃຫ້ຫຼາຍຄັ້ງ.
ເບິ່ງພາກ REGULAR ການສະແດງອອກ ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.

-Nຄັກ, --nntp-server=ຄັກ
ລະບຸເຊີບເວີ NNTP ສໍາລັບ ຂ່າວ: ການເຊື່ອມຕໍ່. ຄ່າເລີ່ມຕົ້ນແມ່ນຕົວແປສະພາບແວດລ້ອມ
NNTP_SERVER. ຖ້າບໍ່ມີໂຮດຖືກມອບໃຫ້, ພຽງແຕ່ syntax ຂອງການເຊື່ອມຕໍ່ຖືກກວດສອບ.

--no-follow-url=REGEX
ກວດເບິ່ງແຕ່ບໍ່ recurse ເຂົ້າໄປໃນ URLs ທີ່ກົງກັບການສະແດງປົກກະຕິທີ່ໃຫ້.
ທາງເລືອກນີ້ສາມາດຖືກມອບໃຫ້ຫຼາຍຄັ້ງ.
ເບິ່ງພາກ REGULAR ການສະແດງອອກ ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.

-p, -ລະຫັດຜ່ານ
ອ່ານລະຫັດຜ່ານຈາກ console ແລະໃຊ້ມັນສໍາລັບການອະນຸຍາດ HTTP ແລະ FTP. ສໍາລັບ FTP
ລະຫັດຜ່ານເລີ່ມຕົ້ນແມ່ນ ບໍ່ເປີດເຜີຍຊື່@. ສໍາລັບ HTTP ບໍ່ມີລະຫັດຜ່ານເລີ່ມຕົ້ນ. ເບິ່ງນຳ
-u.

-rNUMBER, --recursion-level=NUMBER
ກວດເບິ່ງຄືນທຸກການເຊື່ອມຕໍ່ເຖິງຄວາມເລິກທີ່ໃຫ້ໄວ້. ຄວາມເລິກທາງລົບຈະເປີດໃຊ້ງານ
recursion infinite. ຄວາມເລິກເລີ່ມຕົ້ນແມ່ນບໍ່ມີຂອບເຂດ.

--ໝົດເວລາ=NUMBER
ກໍານົດເວລາຫມົດເວລາສໍາລັບຄວາມພະຍາຍາມເຊື່ອມຕໍ່ເປັນວິນາທີ. ເວລາໝົດເວລາເລີ່ມຕົ້ນແມ່ນ 60
ວິນາທີ.

-uຄັກ, --user=ຄັກ
ລອງໃຊ້ຊື່ຜູ້ໃຊ້ທີ່ໃຫ້ສໍາລັບການອະນຸຍາດ HTTP ແລະ FTP. ສໍາລັບ FTP ເປັນຄ່າເລີ່ມຕົ້ນ
ຊື່ຜູ້ໃຊ້ແມ່ນ anonymous. ສໍາລັບ HTTP ບໍ່ມີຊື່ຜູ້ໃຊ້ເລີ່ມຕົ້ນ. ເບິ່ງນຳ -p.

--user-agent=ຄັກ
ລະບຸສະຕຣິງ User-Agent ເພື່ອສົ່ງໄປຫາເຊີບເວີ HTTP, ຕົວຢ່າງ
"Mozilla/4.0". ຄ່າເລີ່ມຕົ້ນແມ່ນ "LinkChecker/XY" ທີ່ XY ເປັນເວີຊັນປັດຈຸບັນຂອງ
LinkChecker.

CONFIGURATION ເອກະສານ


ໄຟລ໌ການຕັ້ງຄ່າສາມາດລະບຸຕົວເລືອກທັງໝົດຂ້າງເທິງ. ພວກເຂົາເຈົ້າຍັງສາມາດກໍານົດບາງທາງເລືອກທີ່
ບໍ່ສາມາດຕັ້ງຢູ່ໃນເສັ້ນຄໍາສັ່ງ. ເບິ່ງ linkcheckerrc(5) ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມ.

OUTPUT TYPES


ໃຫ້ສັງເກດວ່າໂດຍຄ່າເລີ່ມຕົ້ນພຽງແຕ່ຄວາມຜິດພາດແລະຄໍາເຕືອນທີ່ຖືກບັນທຶກ. ທ່ານຄວນໃຊ້ -- verbose
ທາງ​ເລືອກ​ທີ່​ຈະ​ໄດ້​ຮັບ​ບັນ​ຊີ​ລາຍ​ການ URL ທີ່​ສົມ​ບູນ​, ໂດຍ​ສະ​ເພາະ​ແມ່ນ​ໃນ​ເວ​ລາ​ທີ່​ອອກ​ຮູບ​ແບບ​ກ​ຣາ​ຟ​ແຜນ​ທີ່​ເວັບ​ໄຊ​ຕ​໌​.

ຂໍ້ຄວາມ ຕົວບັນທຶກຂໍ້ຄວາມມາດຕະຖານ, ບັນທຶກ URL ໃນຄໍາສໍາຄັນ: ຄົນອັບເດດ: ການໂຕ້ຖຽງ.

html ບັນທຶກ URL ໃນຄໍາສໍາຄັນ: ຄົນອັບເດດ: argument, ຮູບແບບເປັນ HTML. ນອກຈາກນີ້ຍັງມີການເຊື່ອມຕໍ່
ໄປຫາຫນ້າທີ່ອ້າງອີງ. URL ທີ່ບໍ່ຖືກຕ້ອງມີການເຊື່ອມໂຍງການກວດສອບ syntax HTML ແລະ CSS
ຕໍ່ທ້າຍ.

csv ບັນທຶກຜົນການກວດສອບໃນຮູບແບບ CSV ທີ່ມີຫນຶ່ງ URL ຕໍ່ແຖວ.

gml ບັນທຶກຄວາມສໍາພັນຂອງພໍ່ແມ່ກັບລູກລະຫວ່າງ URL ທີ່ເຊື່ອມໂຍງເປັນກຣາຟແຜນຜັງເວັບໄຊທ໌ GML.

ຈຸດ ບັນທຶກຄວາມສໍາພັນຂອງພໍ່ແມ່ກັບລູກລະຫວ່າງ URL ທີ່ເຊື່ອມຕໍ່ເປັນກາຟແຜນຜັງເວັບໄຊທ໌ DOT.

gxml ບັນທຶກຜົນການກວດສອບເປັນກຣາຟແຜນຜັງເວັບໄຊທ໌ GraphXML.

xml ບັນທຶກຜົນການກວດສອບເປັນ XML ທີ່ເຄື່ອງອ່ານໄດ້.

ບານ
ບັນທຶກຜົນການກວດສອບເປັນແຜນຜັງເວັບໄຊທ໌ XML ທີ່ໂປຣໂຕຄໍຖືກບັນທຶກຢູ່
http://www.sitemaps.org/protocol.html.

sql ບັນທຶກຜົນການກວດສອບເປັນສະຄິບ SQL ດ້ວຍຄໍາສັ່ງ INSERT. ຕົວຢ່າງ script ເພື່ອສ້າງ
ຕາຕະລາງ SQL ເບື້ອງຕົ້ນແມ່ນລວມເປັນ create.sql.

blacklist
ເຫມາະສໍາລັບວຽກ cron. ບັນທຶກຜົນການກວດສອບເຂົ້າໄປໃນໄຟລ໌ ~/.linkchecker/ບັນຊີດຳ
ເຊິ່ງມີພຽງແຕ່ລາຍການທີ່ມີ URL ທີ່ບໍ່ຖືກຕ້ອງແລະຈໍານວນເວລາທີ່ເຂົາເຈົ້າມີ
ລົ້ມເຫຼວ.

none ບັນທຶກບໍ່ມີຫຍັງ. ເຫມາະສໍາລັບ debugging ຫຼືການກວດສອບລະຫັດອອກ.

REGULAR ການສະແດງອອກ


LinkChecker ຍອມຮັບການສະແດງອອກປົກກະຕິ Python. ເບິ່ງ http://docs.python.org/
howto/regex.html ສໍາລັບການແນະນໍາ.

ນອກຈາກນັ້ນ, ເຄື່ອງຫມາຍ exclamation ນໍາພາປະຕິເສດການສະແດງອອກປົກກະຕິ.

ຄຸກກີ ເອກະສານ


ໄຟລ໌ຄຸກກີມີຂໍ້ມູນສ່ວນຫົວ HTTP ມາດຕະຖານ (RFC 2616) ທີ່ເປັນໄປໄດ້ຕໍ່ໄປນີ້
ຊື່:

ເຈົ້າພາບ (ຕ້ອງການ)
ກໍານົດໂດເມນທີ່ cookies ຖືກຕ້ອງສໍາລັບ.

ເສັ້ນທາງ (ທາງເລືອກ)
ໃຫ້ເສັ້ນທາງທີ່ cookies ມີມູນຄ່າສໍາລັບ; ເສັ້ນທາງເລີ່ມຕົ້ນແມ່ນ /.

ຕັ້ງຄຸກກີ້ (ຕ້ອງການ)
ຕັ້ງຊື່/ຄ່າຄຸກກີ. ສາມາດໃຫ້ຫຼາຍກວ່າຫນຶ່ງຄັ້ງ.

ຫຼາຍລາຍການຖືກແຍກອອກດ້ວຍແຖວຫວ່າງເປົ່າ. ຕົວຢ່າງຂ້າງລຸ່ມນີ້ຈະສົ່ງສອງ cookies
ໄປຫາທຸກ URL ເລີ່ມຕົ້ນດ້ວຍ http://example.com/hello/ ແລະຫນຶ່ງໄປຫາທຸກ URL ເລີ່ມຕົ້ນດ້ວຍ
https://example.org/:

ເຈົ້າພາບ: example.com
ເສັ້ນທາງ: /ສະບາຍດີ
ຊຸດຄຸກກີ້: ID="smee"
Set-cookie: spam="egg"

ເຈົ້າພາບ: example.org
Set-cookie: baggage="elitist"; ຄໍາເຫັນ = "hologram"

ຕົວແທນ ສະຫນັບສະຫນູນ


ເພື່ອໃຊ້ພຣັອກຊີໃນ Unix ຫຼື Windows ຕັ້ງ $http_proxy, $https_proxy ຫຼື $ftp_proxy
ຕົວແປສະພາບແວດລ້ອມຕໍ່ກັບ URL ຕົວແທນ. URL ຄວນເປັນຮູບແບບ
http://[ຜູ້ໃຊ້:ຜ່ານ@]ເຈົ້າພາບ[:port]. LinkChecker ຍັງກວດພົບການຕັ້ງຄ່າພຣັອກຊີຄູ່ມືຂອງ
Internet Explorer ພາຍໃຕ້ລະບົບ Windows, ແລະ gconf ຫຼື KDE ໃນລະບົບ Linux. ໃນ​ການ​ນໍາ​ໃຊ້ Mac​
Internet Config ເພື່ອເລືອກຕົວແທນ. ນອກນັ້ນທ່ານຍັງສາມາດກໍານົດບັນຊີລາຍຊື່ໂດເມນທີ່ແຍກດ້ວຍເຄື່ອງໝາຍຈຸດໃນ
ຕົວແປສະພາບແວດລ້ອມ $no_proxy ທີ່ຈະບໍ່ສົນໃຈການຕັ້ງຄ່າຕົວແທນໃດໆສໍາລັບໂດເມນເຫຼົ່ານີ້.
ການຕັ້ງຄ່າ HTTP proxy ໃນ Unix ຕົວຢ່າງເບິ່ງຄືວ່ານີ້:

ສົ່ງອອກ http_proxy="http://proxy.example.com: 8080 "

ການຮັບຮອງຄວາມຖືກຕ້ອງຂອງພຣັອກຊີຍັງຮອງຮັບ:

ສົ່ງອອກ http_proxy="http://user1:mypass@proxy.example.org: 8081 "

ການ​ຕັ້ງ​ຄ່າ​ຕົວ​ແທນ​ຢູ່​ໃນ​ຄໍາ​ສັ່ງ​ຂອງ Windows​:

ຕັ້ງ http_proxy=http://proxy.example.com: 8080

ປະຕິບັດ ກວດເບິ່ງ


URL ທັງໝົດຕ້ອງຜ່ານການທົດສອບ syntax ເບື້ອງຕົ້ນ. ຄວາມຜິດພາດການອ້າງອີງເລັກນ້ອຍຈະອອກເປັນ
ການເຕືອນໄພ, ບັນຫາ syntax ທີ່ບໍ່ຖືກຕ້ອງທັງຫມົດແມ່ນຄວາມຜິດພາດ. ຫຼັງຈາກການກວດສອບ syntax ຜ່ານ, ໄດ້
URL ແມ່ນຢູ່ໃນຄິວສໍາລັບການກວດສອບການເຊື່ອມຕໍ່. ປະເພດຂອງການກວດສອບການເຊື່ອມຕໍ່ທັງຫມົດແມ່ນໄດ້ອະທິບາຍຂ້າງລຸ່ມນີ້.

ລິ້ງ HTTP (http:, https:)
ຫຼັງຈາກເຊື່ອມຕໍ່ກັບເຄື່ອງແມ່ຂ່າຍ HTTP ທີ່ໃຫ້, ເສັ້ນທາງຫຼືການສອບຖາມແມ່ນຮ້ອງຂໍ. ທັງໝົດ
ການປ່ຽນເສັ້ນທາງແມ່ນປະຕິບັດຕາມ, ແລະຖ້າຜູ້ໃຊ້ / ລະຫັດຜ່ານຖືກມອບໃຫ້, ມັນຈະຖືກນໍາໃຊ້ເປັນ
ການອະນຸຍາດເມື່ອມີຄວາມຈໍາເປັນ. ລະຫັດສະຖານະ HTTP ສຸດທ້າຍທັງໝົດນອກຈາກ 2xx ແມ່ນ
ຄວາມຜິດພາດ. ເນື້ອໃນຂອງຫນ້າ HTML ຖືກກວດສອບການເອີ້ນຄືນ.

ໄຟລ໌ທ້ອງຖິ່ນ (file:)
ໄຟລ໌ປົກກະຕິທີ່ສາມາດອ່ານໄດ້ທີ່ສາມາດເປີດໄດ້ແມ່ນຖືກຕ້ອງ. ໄດເລກະທໍລີທີ່ສາມາດອ່ານໄດ້ເຊັ່ນກັນ
ຖືກຕ້ອງ. ໄຟລ໌ອື່ນໆທັງໝົດ, ຕົວຢ່າງໄຟລ໌ອຸປະກອນ, ໄຟລ໌ທີ່ບໍ່ສາມາດອ່ານໄດ້ ຫຼືບໍ່ມີຢູ່ແລ້ວ
ມີ​ຄວາມ​ຜິດ​ພາດ​. HTML ຫຼືເນື້ອຫາໄຟລ໌ທີ່ວິເຄາະໄດ້ອື່ນໆແມ່ນຖືກກວດສອບການເອີ້ນຄືນ.

ລິ້ງທາງໄປສະນີ (mailto:)
A mailto: ໃນທີ່ສຸດການເຊື່ອມຕໍ່ແກ້ໄຂບັນຊີລາຍຊື່ຂອງທີ່ຢູ່ອີເມວ. ຖ້າທີ່ຢູ່ຫນຶ່ງ
ລົ້ມເຫລວ, ບັນຊີລາຍຊື່ທັງຫມົດຈະລົ້ມເຫລວ. ສໍາລັບແຕ່ລະທີ່ຢູ່ອີເມວພວກເຮົາກວດເບິ່ງຕໍ່ໄປນີ້
ສິ່ງ​ຂອງ:
1) ກວດເບິ່ງ syntax ທີ່ຢູ່, ທັງສອງສ່ວນກ່ອນແລະຫຼັງ
ສັນຍາລັກ @.
2) ຊອກຫາບັນທຶກ MX DNS. ຖ້າພວກເຮົາບໍ່ພົບບັນທຶກ MX,
ພິມ​ຄວາມ​ຜິດ​ພາດ​.
3) ກວດເບິ່ງວ່າຫນຶ່ງໃນແມ່ຂ່າຍເມລຍອມຮັບການເຊື່ອມຕໍ່ SMTP.
ກວດເບິ່ງເຈົ້າພາບທີ່ມີບູລິມະສິດສູງກວ່າກ່ອນ.
ຖ້າບໍ່ມີເຈົ້າພາບຍອມຮັບ SMTP, ພວກເຮົາພິມຄໍາເຕືອນ.
4) ພະຍາຍາມກວດສອບທີ່ຢູ່ດ້ວຍຄໍາສັ່ງ VRFY. ຖ້າພວກເຮົາໄດ້ຮັບ
ຄໍາຕອບ, ພິມທີ່ຢູ່ຢືນຢັນເປັນຂໍ້ມູນ.

ລິ້ງ FTP (ftp:)

ສໍາລັບການເຊື່ອມຕໍ່ FTP ພວກເຮົາເຮັດ:

1) ເຊື່ອມຕໍ່ກັບເຈົ້າພາບທີ່ກໍານົດໄວ້
2) ພະຍາຍາມເຂົ້າສູ່ລະບົບດ້ວຍຜູ້ໃຊ້ແລະລະຫັດຜ່ານທີ່ໃຫ້. ຄ່າເລີ່ມຕົ້ນ
ຜູ້ໃຊ້ແມ່ນ ``anonymous``, ລະຫັດຜ່ານເລີ່ມຕົ້ນແມ່ນ ``anonymous@``.
3) ພະຍາຍາມປ່ຽນໄປຫາໄດເລກະທໍລີທີ່ໃຫ້
4) ລາຍຊື່ໄຟລ໌ດ້ວຍຄໍາສັ່ງ NLST

ການເຊື່ອມຕໍ່ Telnet (``telnet:``)

ພວກເຮົາພະຍາຍາມເຊື່ອມຕໍ່ແລະຖ້າຜູ້ໃຊ້ / ລະຫັດຜ່ານຖືກມອບໃຫ້, ເຂົ້າສູ່ລະບົບ
ເຊີບເວີ telnet ທີ່ມອບໃຫ້.

ລິ້ງ NNTP (``ຂ່າວ:``, ``ຂ່າວ:``, ``nntp``)

ພວກເຮົາພະຍາຍາມເຊື່ອມຕໍ່ກັບເຄື່ອງແມ່ຂ່າຍ NNTP ທີ່ໃຫ້. ຖ້າກຸ່ມຂ່າວ ຫຼື
ບົດຄວາມຖືກລະບຸ, ພະຍາຍາມຮ້ອງຂໍມັນຈາກເຄື່ອງແມ່ຂ່າຍ.

ລິ້ງທີ່ບໍ່ຮອງຮັບ (``javascript:``, ແລະອື່ນໆ.

ລິ້ງທີ່ບໍ່ຮອງຮັບຈະພິມຄຳເຕືອນເທົ່ານັ້ນ. ບໍ່ມີການກວດສອບເພີ່ມເຕີມ
ຈະຖືກເຮັດ.

ບັນຊີລາຍຊື່ຄົບຖ້ວນຂອງການຮັບຮູ້, ແຕ່ການເຊື່ອມຕໍ່ທີ່ບໍ່ສະຫນັບສະຫນູນສາມາດພົບໄດ້
ໃນ linkcheck/checker/unknownurl.py ແຫຼ່ງໄຟລ໌.
ທີ່ໂດດເດັ່ນທີ່ສຸດຂອງພວກເຂົາຄວນຈະເປັນການເຊື່ອມໂຍງ JavaScript.

PLUGINS


ມີສອງປະເພດ plugins: ການເຊື່ອມຕໍ່ແລະ plugins ເນື້ອຫາ. plugins ການເຊື່ອມຕໍ່ແມ່ນດໍາເນີນການ
ຫຼັງຈາກການເຊື່ອມຕໍ່ສົບຜົນສໍາເລັດກັບເຈົ້າພາບ URL. plugins ເນື້ອຫາແມ່ນດໍາເນີນການຖ້າຫາກວ່າປະເພດ URL
ມີເນື້ອຫາ (mailto: URLs ບໍ່ມີເນື້ອຫາສໍາລັບຕົວຢ່າງ) ແລະຖ້າການກວດສອບບໍ່ໄດ້ຖືກຫ້າມ
(ເຊັ່ນ: ໂດຍ HTTP robots.txt). ເບິ່ງ ຕົວກວດເຊື່ອມຕໍ່ --list-plugins ສໍາລັບບັນຊີລາຍຊື່ຂອງ plugins ແລະຂອງເຂົາເຈົ້າ
ເອກະສານ. plugins ທັງ​ຫມົດ​ແມ່ນ​ເປີດ​ນໍາ​ໃຊ້​ໂດຍ​ຜ່ານ​ການ linkcheckerrc(5) ໄຟລ໌ການຕັ້ງຄ່າ.

ກັບຄືນ


ກ່ອນທີ່ຈະຫຼຸດລົງ recursively ເຂົ້າໄປໃນ URL, ມັນຕ້ອງປະຕິບັດຕາມເງື່ອນໄຂຈໍານວນຫນຶ່ງ. ພວກ​ເຂົາ​ແມ່ນ
ກວດ​ສອບ​ໃນ​ຄໍາ​ສັ່ງ​ນີ້​:

1. URL ຕ້ອງຖືກຕ້ອງ.

2. URL ຕ້ອງສາມາດວິເຄາະໄດ້. ໃນປັດຈຸບັນນີ້ປະກອບມີໄຟລ໌ HTML,
Opera bookmarks ໄຟລ໌, ແລະໄດເລກະທໍລີ. ຖ້າປະເພດໄຟລ໌ບໍ່ສາມາດ
ຖືກກໍານົດ (ຕົວຢ່າງມັນບໍ່ມີໄຟລ໌ HTML ທົ່ວໄປ
ການຂະຫຍາຍ, ແລະເນື້ອຫາບໍ່ຄືກັບ HTML), ມັນສົມມຸດວ່າ
ທີ່​ຈະ​ບໍ່​ສາ​ມາດ​ວິ​ເຄາະ​ໄດ້​.

3. ເນື້ອຫາ URL ຕ້ອງສາມາດດຶງຂໍ້ມູນໄດ້. ນີ້ແມ່ນປົກກະຕິແລ້ວກໍລະນີ
ຍົກເວັ້ນຕົວຢ່າງ mailto: ຫຼືປະເພດ URL ທີ່ບໍ່ຮູ້ຈັກ.

4. ລະດັບ recursion ສູງສຸດຈະຕ້ອງບໍ່ເກີນ. ມັນຖືກຕັ້ງຄ່າ
ກັບ --recursion ລະດັບ ທາງເລືອກແລະບໍ່ຈໍາກັດຕໍ່ຄ່າເລີ່ມຕົ້ນ.

5. ມັນຕ້ອງບໍ່ກົງກັບລາຍຊື່ URL ທີ່ລະເລີຍ. ອັນນີ້ຖືກຄວບຄຸມດ້ວຍ
ໄດ້ --ignore-url ທາງເລືອກ.

6. Robots Exclusion Protocol ຕ້ອງອະນຸຍາດໃຫ້ເຊື່ອມຕໍ່ໃນ URL ເປັນ
ປະ​ຕິ​ບັດ​ຕາມ recursively​. ນີ້ແມ່ນການກວດສອບໂດຍການຊອກຫາ a
ຄໍາສັ່ງ "nofollow" ໃນຂໍ້ມູນສ່ວນຫົວ HTML.

ຈົ່ງຈື່ໄວ້ວ່າ recursion ໄດເລກະທໍລີອ່ານໄຟລ໌ທັງຫມົດໃນໄດເລກະທໍລີນັ້ນ, ບໍ່ພຽງແຕ່ຊຸດຍ່ອຍເທົ່ານັ້ນ
ຄື index.htm*.

ຫມາຍເຫດ


URLs ໃນຄໍາສັ່ງເລີ່ມຕົ້ນດ້ວຍ ftp ຖືກປະຕິບັດຄື ftp://ftp., URL ເລີ່ມຕົ້ນດ້ວຍ
www. ຖືກປະຕິບັດຄື http://www.. ນອກນັ້ນທ່ານຍັງສາມາດໃຫ້ໄຟລ໌ທ້ອງຖິ່ນເປັນການໂຕ້ຖຽງ.

ຖ້າ​ຫາກ​ທ່ານ​ມີ​ການ​ຕັ້ງ​ຄ່າ​ລະ​ບົບ​ຂອງ​ທ່ານ​ເພື່ອ​ສ້າງ​ຕັ້ງ​ການ​ເຊື່ອມ​ຕໍ່​ອິນ​ເຕີ​ເນັດ​ອັດ​ຕະ​ໂນ​ມັດ​
(ເຊັ່ນ: ມີ diald), ມັນຈະເຊື່ອມຕໍ່ໃນເວລາທີ່ການກວດສອບການເຊື່ອມຕໍ່ບໍ່ຊີ້ໄປຫາເຈົ້າພາບທ້ອງຖິ່ນຂອງທ່ານ.
ການນໍາໃຊ້ --ignore-url ທາງ​ເລືອກ​ເພື່ອ​ປ້ອງ​ກັນ​ການ​ນີ້​.

ບໍ່ຮອງຮັບການເຊື່ອມຕໍ່ Javascript.

ຖ້າເວທີຂອງທ່ານບໍ່ສະຫນັບສະຫນູນ threading, LinkChecker ປິດມັນອັດຕະໂນມັດ.

ທ່ານ​ສາ​ມາດ​ສະ​ຫນອງ​ຫຼາຍ​ຄູ່​ຜູ້​ໃຊ້ / ລະ​ຫັດ​ຜ່ານ​ໃນ​ໄຟລ​໌​ການ​ຕັ້ງ​ຄ່າ​.

ເມື່ອກວດສອບ ຂ່າວ: ເຊື່ອມຕໍ່ໂຮດ NNTP ທີ່ໃຫ້ມາບໍ່ຈໍາເປັນຕ້ອງເປັນເຈົ້າພາບຂອງ
ຜູ້ໃຊ້ຊອກຫາຫນ້າເວັບຂອງທ່ານ.

ENVIRONMENT


NNTP_SERVER - ກໍານົດເຄື່ອງແມ່ຂ່າຍ NNTP ເລີ່ມຕົ້ນ
http_proxy - ລະບຸເຄື່ອງແມ່ຂ່າຍພຣັອກຊີ HTTP ເລີ່ມຕົ້ນ
ftp_proxy - ກໍານົດເຄື່ອງແມ່ຂ່າຍພຣັອກຊີ FTP ເລີ່ມຕົ້ນ
no_proxy - ລາຍຊື່ໂດເມນທີ່ແຍກກັນດ້ວຍເຄື່ອງໝາຍຈຸດເພື່ອບໍ່ໃຫ້ຕິດຕໍ່ຜ່ານເຊີບເວີພຣັອກຊີ
LC_MESSAGES, ພາສາ, LANGUAGE - ກໍາ​ນົດ​ພາ​ສາ​ຜະ​ລິດ​ຕະ​ພັນ​

ກັບຄືນ ມູນຄ່າ


ຄ່າກັບຄືນແມ່ນ 2 ເມື່ອ

· ເກີດຄວາມຜິດພາດໃນໂປຣແກຣມ.

ຄ່າກັບຄືນແມ່ນ 1 ເມື່ອ

· ການ​ເຊື່ອມ​ຕໍ່​ທີ່​ບໍ່​ຖືກ​ຕ້ອງ​ໄດ້​ຖືກ​ພົບ​ເຫັນ​ຫຼື

· ການ​ເຕືອນ​ກ່ຽວ​ກັບ​ການ​ເຊື່ອມ​ຕໍ່​ໄດ້​ຖືກ​ພົບ​ເຫັນ​ແລະ​ການ​ແຈ້ງ​ເຕືອນ​ໄດ້​ຖືກ​ເປີດ​ໃຊ້​ງານ​

ຖ້າບໍ່ດັ່ງນັ້ນຄ່າກັບຄືນແມ່ນສູນ.

ຂອບເຂດ ຈຳ ກັດ


LinkChecker ໃຊ້ຫນ່ວຍຄວາມຈໍາສໍາລັບແຕ່ລະ URL ທີ່ຄິວເພື່ອກວດສອບ. ດ້ວຍຫລາຍພັນ URLs ຄິວ
ຈໍານວນຫນ່ວຍຄວາມຈໍາທີ່ບໍລິໂພກສາມາດກາຍເປັນຂະຫນາດໃຫຍ່ຂ້ອນຂ້າງ. ນີ້ອາດຈະຊ້າລົງໂຄງການຫຼື
ເຖິງແມ່ນວ່າລະບົບທັງຫມົດ.

ໃຊ້ linkchecker ອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net


Ad


Ad