ນີ້ແມ່ນການກວດສອບເວັບຄໍາສັ່ງທີ່ສາມາດດໍາເນີນການໄດ້ໃນ OnWorks ຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີໂດຍໃຊ້ຫນຶ່ງໃນຫຼາຍໆບ່ອນເຮັດວຽກອອນໄລນ໌ຂອງພວກເຮົາເຊັ່ນ Ubuntu Online, Fedora Online, Windows online emulator ຫຼື MAC OS online emulator
ໂຄງການ:
NAME
webcheck - website link checker
ສະຫຼຸບສັງລວມ
ກວດເຊັກເວັບ [ທາງເລືອກ] ... URL
ລາຍລະອຽດ
ກວດເຊັກເວັບ ຈະກວດສອບເອກະສານຢູ່ທີ່ URL ທີ່ລະບຸໄວ້ສໍາລັບການເຊື່ອມຕໍ່ກັບເອກະສານອື່ນໆ, ປະຕິບັດຕາມ
ການເຊື່ອມຕໍ່ເຫຼົ່ານີ້ recursively ແລະສ້າງບົດລາຍງານ HTML.
-i, --ພາຍໃນ=PATTERN
ໝາຍ URL ທີ່ກົງກັບ PATTERN (perl-type regular expression) ເປັນຕົວເຊື່ອມຕໍ່ພາຍໃນ.
ສາມາດໃຊ້ໄດ້ຫຼາຍຄັ້ງ. ກະລຸນາຮັບຊາບວ່າຮູບແບບແມ່ນກົງກັບ URL ເຕັມ.
URL ທີ່ກົງກັບຮູບແບບນີ້ຈະຖືກພິຈາລະນາພາຍໃນ, ເຖິງແມ່ນວ່າຈະກົງກັບອັນໃດນຶ່ງ
- ຮູບແບບພາຍນອກ.
-x, --ພາຍນອກ=PATTERN
ໝາຍ URL ທີ່ກົງກັບ PATTERN (perl-type regular expression) ເປັນຕົວເຊື່ອມຕໍ່ພາຍນອກ.
ສາມາດໃຊ້ໄດ້ຫຼາຍຄັ້ງ. ກະລຸນາຮັບຊາບວ່າຮູບແບບແມ່ນກົງກັບ URL ເຕັມ.
-y, --yank=PATTERN
ຢ່າກວດເບິ່ງ URL ທີ່ກົງກັບ PATTERN (perl-type ການສະແດງອອກປົກກະຕິ). ເຊັ່ນດຽວກັບ -x
ທຸງ, ເຖິງແມ່ນວ່າທາງເລືອກນີ້ຈະເຮັດໃຫ້ການກວດສອບເວັບບໍ່ກວດສອບການເຊື່ອມຕໍ່ທີ່ກົງກັນໂດຍ regex
ໃນຂະນະທີ່ -x ຈະກວດເບິ່ງການເຊື່ອມຕໍ່ແຕ່ບໍ່ແມ່ນລູກຂອງມັນ. ສາມາດໃຊ້ໄດ້ຫຼາຍຄັ້ງ.
ກະລຸນາຮັບຊາບວ່າຮູບແບບແມ່ນກົງກັບ URL ເຕັມ.
-b, -- ພື້ນຖານເທົ່ານັ້ນ
ພິຈາລະນາທຸກ URL ທີ່ບໍ່ເລີ່ມຕົ້ນດ້ວຍ URL ພື້ນຖານທີ່ຈະເປັນພາຍນອກ. ຕົວຢ່າງ, ຖ້າ
ທ່ານແລ່ນ
ກວດເຊັກເວັບ -b http://www.example.com/foo
ຫຼັງຈາກນັ້ນ http://www.example.com/foo/bar ຈະຖືກພິຈາລະນາພາຍໃນ, ໃນຂະນະທີ່
http://www.example.com/ ຈະຖືກພິຈາລະນາຈາກພາຍນອກ. ໂດຍຄ່າເລີ່ມຕົ້ນທຸກໜ້າຢູ່
ເວັບໄຊທ໌ຈະຖືກພິຈາລະນາພາຍໃນ.
-ກ, --avoid-ພາຍນອກ
ຫຼີກເວັ້ນການເຊື່ອມຕໍ່ພາຍນອກ. ໂດຍປົກກະຕິຖ້າ webcheck ກໍາລັງກວດເບິ່ງຫນ້າ HTML ແລະມັນພົບ
ການເຊື່ອມຕໍ່ທີ່ຊີ້ໄປຫາເອກະສານພາຍນອກ, ມັນຈະກວດເບິ່ງວ່າພາຍນອກ
ເອກະສານມີຢູ່. ທຸງນີ້ປິດການກະທຳນັ້ນ.
--ລະເລີຍຫຸ່ນຍົນ
ຢ່າດຶງຂໍ້ມູນ ແລະວິເຄາະໄຟລ໌ robots.txt. ໂດຍຄ່າເລີ່ມຕົ້ນຂອງໄຟລ໌ robots.txt ແມ່ນ
ໄດ້ຮັບແລະເປັນກຽດ. ຖ້າທ່ານແນ່ໃຈວ່າທ່ານຕ້ອງການທີ່ຈະບໍ່ສົນໃຈແລະ override
ການຕັດສິນໃຈຂອງຜູ້ດູແລເວັບທາງເລືອກນີ້ສາມາດຖືກນໍາໃຊ້.
ສໍາລັບຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບການຈັດການ robots.txt ໃຫ້ເບິ່ງພາກສ່ວນບັນທຶກຂ້າງລຸ່ມນີ້.
-q, --ງຽບ, --ງຽບ
ຢ່າພິມອອກຄວາມຄືບຫນ້າຍ້ອນວ່າ webcheck ຂ້າມຜ່ານເວັບໄຊທ໌.
-d, --debug
ພິມຂໍ້ມູນການດີບັກໃນຂະນະທີ່ກວາດເວັບ. ທາງເລືອກນີ້ແມ່ນເປັນປະໂຫຍດຕົ້ນຕໍ
ສໍາລັບນັກພັດທະນາ.
-o, --output=ທິດທາງ
Output directory. ໃຊ້ເພື່ອລະບຸໄດເລກະທໍລີທີ່ webcheck ຈະ dump ຂອງມັນ
ບົດລາຍງານ. ຄ່າເລີ່ມຕົ້ນແມ່ນໄດເລກະທໍລີປັດຈຸບັນ ຫຼືຕາມທີ່ກຳນົດໄວ້ໂດຍ config.py. ຖ້ານີ້
ບໍ່ມີໄດເລກະທໍລີມັນຈະຖືກສ້າງຂື້ນສໍາລັບທ່ານ (ຖ້າເປັນໄປໄດ້).
-c, --ສືບຕໍ່
ພະຍາຍາມສືບຕໍ່ຈາກການແລ່ນຜ່ານມາ. ເມື່ອໃຊ້ຕົວເລືອກນີ້ webcheck ຈະຊອກຫາ
webcheck.dat ໃນໄດເລກະທໍລີຜົນຜະລິດ. ໄຟລ໌ນີ້ຖືກອ່ານເພື່ອຟື້ນຟູສະຖານະ
ຈາກໄລຍະຜ່ານມາ. ນີ້ອະນຸຍາດໃຫ້ກວດສອບເວັບເພື່ອສືບຕໍ່ການຂັດຂວາງກ່ອນຫນ້ານີ້
ແລ່ນ. ເມື່ອທາງເລືອກນີ້ຖືກນໍາໃຊ້, ທາງເລືອກ --internal, --external ແລະ --yank ຈະ
ຈະຖືກລະເລີຍເຊັ່ນດຽວກັນກັບການໂຕ້ຖຽງ URL ໃດ. --base-only ແລະ --avoid-external
ທາງເລືອກຄວນຈະຄືກັນກັບການແລ່ນທີ່ຜ່ານມາ.
ຈົ່ງຈື່ໄວ້ວ່າທາງເລືອກນີ້ແມ່ນເປັນການທົດລອງແລະຄວາມຫມາຍຂອງມັນອາດຈະມີການປ່ຽນແປງກັບການມາ
ການປ່ອຍຕົວ (ໂດຍສະເພາະກ່ຽວກັບທາງເລືອກອື່ນ). ຍັງສັງເກດວ່າເກັບຮັກສາໄວ້
ໄຟລ໌ບໍ່ໄດ້ຖືກຮັບປະກັນວ່າເຂົ້າກັນໄດ້ລະຫວ່າງການປ່ອຍ.
-f, --ກຳລັງ
ຂຽນທັບໄຟລ໌ໂດຍບໍ່ຕ້ອງຖາມ. ທາງເລືອກນີ້ແມ່ນຕ້ອງການສໍາລັບການດໍາເນີນການກວດສອບເວັບທີ່ບໍ່ແມ່ນ.
ໂຕ້ຕອບ.
-r, --redirects=N
ປ່ຽນເສັ້ນທາງຄວາມເລິກ. ຈໍານວນຂອງ redirects webcheck ຄວນປະຕິບັດຕາມໃນເວລາທີ່ປະຕິບັດຕາມ a
ເຊື່ອມຕໍ່. 0 ຫມາຍເຖິງການປະຕິບັດຕາມການປ່ຽນເສັ້ນທາງທັງຫມົດ.
-u, --userpass=URL
ລະບຸ URL ທີ່ມີຊື່ຜູ້ໃຊ້ ແລະຂໍ້ມູນລະຫັດຜ່ານເພື່ອໃຊ້ພື້ນຖານ
ການກວດສອບຄວາມຖືກຕ້ອງໃນເວລາທີ່ໄປຢ້ຽມຢາມເວັບໄຊທ໌.
ຕົວຢ່າງ: http://test:[email protected]/
ຕົວເລືອກນີ້ອາດຈະຖືກລະບຸຫຼາຍຄັ້ງ.
-w, --ລໍຖ້າ=ວິນາທີ
ລໍຖ້າ ວິນາທີ ລະຫວ່າງການດຶງເອກະສານ. ປົກກະຕິແລ້ວ webcheck ຈະປະມວນຜົນ url ແລະ
ທັນທີທັນໃດຍ້າຍໄປຕໍ່ໄປ. ແນວໃດກໍ່ຕາມໃນບາງລະບົບການໂຫຼດມັນອາດຈະເປັນທີ່ຕ້ອງການ
ເພື່ອໃຫ້ມີການຢຸດການກວດສອບເວັບລະຫວ່າງການຮ້ອງຂໍ. ທາງເລືອກນີ້ສາມາດໄດ້ຮັບການຕັ້ງຄ່າທີ່ບໍ່ແມ່ນ.
ຕົວເລກລົບ.
- ໃນ, - ການປ່ຽນແປງ
ສະແດງເວີຊັນຂອງໂຄງການ.
-ຊ, - ຊ່ວຍ
ສະແດງສະຫຼຸບຫຍໍ້ຂອງທາງເລືອກ.
URL ຫ້ອງ
URLs ຖືກແບ່ງອອກເປັນສອງປະເພດ:
ພາຍໃນ URL ໄດ້ຖືກດຶງມາແລະລາຍການທີ່ດຶງມາໄດ້ຖືກກວດສອບສໍາລັບ syntax. ນອກຈາກນີ້, ໄດ້
ລາຍການທີ່ດຶງມາແມ່ນຊອກຫາການເຊື່ອມຕໍ່ກັບລາຍການອື່ນໆ (ຂອງທຸກຊັ້ນຮຽນ) ແລະການເຊື່ອມຕໍ່ເຫຼົ່ານີ້ແມ່ນ
ຕິດຕາມ.
ພາຍນອກ URL ໄດ້ຖືກດຶງມາພຽງແຕ່ເພື່ອທົດສອບວ່າພວກມັນຖືກຕ້ອງແລະລວບລວມບາງພື້ນຖານ
ຂໍ້ມູນຈາກພວກເຂົາ (ຫົວຂໍ້, ຂະຫນາດ, ປະເພດເນື້ອຫາ, ແລະອື່ນໆ). ລາຍການທີ່ດຶງມາບໍ່ແມ່ນ
ການກວດກາສໍາລັບການເຊື່ອມຕໍ່ກັບລາຍການອື່ນໆ.
ນອກເຫນືອຈາກຫ້ອງຮຽນຂອງພວກເຂົາ, URL ຍັງສາມາດຖືກພິຈາລະນາ yanked (ຕາມທີ່ລະບຸໄວ້ກັບ --yank
ຫຼື --avoid-external options). URLs ສາມາດເປັນພາຍໃນຫຼືພາຍນອກແລະຈະບໍ່ເປັນ
ດຶງຂໍ້ມູນ ຫຼືກວດສອບທັງໝົດ. URL ຂອງແຜນງານທີ່ບໍ່ຮອງຮັບແມ່ນຍັງຖືກພິຈາລະນາວ່າເປັນ yank.
ຕົວຢ່າງ
ກວດເບິ່ງເວັບໄຊທ໌ www.example.com ແຕ່ພິຈາລະນາເສັ້ນທາງໃດໆທີ່ມີ "/webcheck" ໃນມັນເປັນ
ພາຍນອກ.
ກວດເຊັກເວັບ http://www.example.com/ -x /webcheck
ຫມາຍເຫດ
ເມື່ອກວດສອບ URLs ພາຍໃນ webcheck ໃຫ້ກຽດໄຟລ໌ robots.txt, ລະບຸຕົວຂອງມັນເອງເປັນ
ການກວດສອບເວັບຕົວແທນ. ການເຊື່ອມຕໍ່ທີ່ບໍ່ອະນຸຍາດຈະບໍ່ຖືກກວດສອບທັງຫມົດຄືກັບວ່າທາງເລືອກ -y ແມ່ນ
ລະບຸໄວ້ສໍາລັບ URL ນັ້ນ. ເພື່ອອະນຸຍາດໃຫ້ webcheck ລວບລວມບາງສ່ວນຂອງເວັບໄຊທ໌ທີ່ຫຸ່ນຍົນອື່ນໆແມ່ນ
ບໍ່ອະນຸຍາດ, ໃຊ້ບາງຢ່າງເຊັ່ນ:
ຕົວແທນຜູ້ໃຊ້: *
ບໍ່ອະນຸຍາດ: /foo
ຕົວແທນຜູ້ໃຊ້: ກວດເຊັກເວັບ
ອະນຸຍາດ: /foo
ENVIRONMENT
_ພຣັອກຊີ
url ຕົວແທນສໍາລັບ .
ການລາຍງານ ບັກ
ບົດລາຍງານ bug ຄວນຖືກສົ່ງໄປຫາບັນຊີລາຍຊື່ທາງໄປສະນີ[email protected]>.
ຂໍ້ມູນເພີ່ມເຕີມກ່ຽວກັບການລາຍງານຂໍ້ຜິດພາດສາມາດພົບເຫັນຢູ່ໃນຫນ້າທໍາອິດຂອງ webcheck:
http://arthurdejong.org/webcheck/
COPYRIGHT
ສະຫງວນລິຂະສິດ © 1998, 1999 Albert Hopkins (marduk)
ສະຫງວນລິຂະສິດ © 2002 Mike W. Meyer
ສະຫງວນລິຂະສິດ © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
webcheck ແມ່ນຊອບແວຟຣີ; ເບິ່ງແຫຼ່ງສໍາລັບການຄັດລອກເງື່ອນໄຂ. ບໍ່ມີການຮັບປະກັນ;
ບໍ່ແມ່ນແຕ່ເພື່ອການຄ້າ ຫຼືຄວາມເໝາະສົມເພື່ອຈຸດປະສົງສະເພາະ.
ໄຟລ໌ທີ່ຜະລິດເປັນຜົນຜະລິດຈາກຊອບແວບໍ່ອັດຕະໂນມັດຕົກຢູ່ພາຍໃຕ້
ລິຂະສິດຂອງຊອບແວ, ເວັ້ນເສຍແຕ່ໄດ້ລະບຸໄວ້ຢ່າງຈະແຈ້ງ.
ໃຊ້ການກວດສອບເວັບອອນໄລນ໌ໂດຍໃຊ້ບໍລິການ onworks.net