นี่คือคำสั่ง webcheck ที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS
โครงการ:
ชื่อ
webcheck - ตัวตรวจสอบลิงค์เว็บไซต์
เรื่องย่อ
ตรวจสอบเว็บ [ทางเลือกที่] ... URL
DESCRIPTION
ตรวจสอบเว็บ จะตรวจสอบเอกสารที่ URL ที่ระบุเพื่อเชื่อมโยงไปยังเอกสารอื่น ๆ ปฏิบัติตาม
ลิงก์เหล่านี้วนซ้ำและสร้างรายงาน HTML
-ผม, --ภายใน=รูปแบบ
ทำเครื่องหมาย URL ที่ตรงกับ รูปแบบ (นิพจน์ทั่วไปประเภท Perl) เป็นลิงก์ภายใน
สามารถใช้ได้หลายครั้ง โปรดทราบว่า PATTERN จะจับคู่กับ URL แบบเต็ม
URL ที่ตรงกับ PATTERN นี้จะถือว่าเป็น URL ภายใน แม้ว่าจะตรงกับหนึ่งใน
รูปแบบ --external
-NS, --ภายนอก=รูปแบบ
ทำเครื่องหมาย URL ที่ตรงกับ รูปแบบ (นิพจน์ทั่วไปประเภท Perl) เป็นลิงก์ภายนอก
สามารถใช้ได้หลายครั้ง โปรดทราบว่า PATTERN จะจับคู่กับ URL แบบเต็ม
-y, --ดึง=รูปแบบ
อย่าตรวจสอบ URL ที่ตรงกับ รูปแบบ (นิพจน์ทั่วไปประเภท Perl) เช่นเดียวกับ -x
ตั้งค่าสถานะ แม้ว่าตัวเลือกนี้จะทำให้ webcheck ไม่ตรวจสอบลิงก์ที่จับคู่โดยregex
ในขณะที่ -x จะตรวจสอบลิงก์ แต่ไม่ใช่ลูกของมัน สามารถใช้ได้หลายครั้ง
โปรดทราบว่า PATTERN จะจับคู่กับ URL แบบเต็ม
-NS, --ฐานเท่านั้น
พิจารณาว่า URL ใดๆ ที่ไม่ได้ขึ้นต้นด้วย URL ฐานจะเป็น URL ภายนอก ตัวอย่างเช่น if
คุณวิ่ง
ตรวจสอบเว็บ -b http://www.example.com/foo
แล้วก็ http://www.example.com/foo/bar จะถือว่าภายในในขณะที่
http://www.example.com/ จะถือว่าภายนอก โดยค่าเริ่มต้น หน้าทั้งหมดบน
เว็บไซต์จะถือว่าเป็นภายใน
-NS, --หลีกเลี่ยง-ภายนอก
หลีกเลี่ยงการเชื่อมโยงภายนอก โดยปกติถ้า webcheck กำลังตรวจสอบหน้า HTML และพบว่า
ลิงค์ที่ชี้ไปยังเอกสารภายนอก มันจะตรวจสอบดูว่าภายนอกนั้นหรือไม่
เอกสารที่มีอยู่ แฟล็กนี้ปิดใช้งานการกระทำนั้น
--ignore-หุ่นยนต์
อย่าดึงและแยกวิเคราะห์ไฟล์ robots.txt โดยค่าเริ่มต้น ไฟล์ robots.txt คือ
ดึงและให้เกียรติ หากคุณแน่ใจว่าต้องการเพิกเฉยและแทนที่
การตัดสินใจของผู้ดูแลเว็บ ตัวเลือกนี้สามารถใช้ได้
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการจัดการ robots.txt โปรดดูส่วนหมายเหตุด้านล่าง
-NS, --เงียบ, --เงียบ
อย่าพิมพ์ความคืบหน้าในขณะที่ตรวจสอบผ่านเว็บไซต์
-NS, --debug
พิมพ์ข้อมูลการดีบักขณะรวบรวมข้อมูลไซต์ ตัวเลือกนี้มีประโยชน์เป็นหลัก
สำหรับนักพัฒนา
-o, --เอาท์พุท=DIRECTORY
ไดเรกทอรีผลลัพธ์ ใช้เพื่อระบุไดเร็กทอรีที่ webcheck จะดัมพ์ของมัน
รายงาน ค่าดีฟอลต์คือไดเร็กทอรีปัจจุบันหรือตามที่ระบุโดย config.py ถ้านี้
ไม่มีไดเร็กทอรี มันจะถูกสร้างขึ้นสำหรับคุณ (ถ้าเป็นไปได้)
-ค, --ดำเนินต่อ
พยายามดำเนินการต่อจากการรันครั้งก่อน เมื่อใช้ตัวเลือกนี้ webcheck จะมองหา
webcheck.dat ในไดเร็กทอรีเอาต์พุต ไฟล์นี้ถูกอ่านเพื่อเรียกคืนสถานะ
จากการวิ่งครั้งก่อน สิ่งนี้ทำให้ webcheck ดำเนินการขัดจังหวะก่อนหน้านี้ต่อไป
วิ่ง. เมื่อใช้ตัวเลือกนี้ ตัวเลือก --internal, --external และ --yank จะ
ถูกละเว้นเช่นเดียวกับอาร์กิวเมนต์ URL ใดๆ --base-only และ --avoid-external
ตัวเลือกควรเหมือนกับการเรียกใช้ครั้งก่อน
โปรดทราบว่าตัวเลือกนี้เป็นแบบทดลองและความหมายอาจเปลี่ยนแปลงได้เมื่อมา
การเผยแพร่ (โดยเฉพาะอย่างยิ่งในส่วนที่เกี่ยวข้องกับตัวเลือกอื่น ๆ ) นอกจากนี้โปรดทราบว่าที่เก็บไว้
ไม่รับประกันว่าไฟล์จะเข้ากันได้ระหว่างรุ่นต่างๆ
-NS, --บังคับ
เขียนทับไฟล์โดยไม่ต้องถาม ตัวเลือกนี้จำเป็นสำหรับการรัน webcheck ไม่ใช่
โต้ตอบ
-NS, --เปลี่ยนเส้นทาง=N
เปลี่ยนเส้นทางความลึก จำนวนของการเปลี่ยนเส้นทาง webcheck ควรปฏิบัติตามเมื่อติดตาม a
ลิงค์ 0 หมายถึงติดตามการเปลี่ยนเส้นทางทั้งหมด
-ยู, --ผู้ใช้พาส=URL
ระบุ URL พร้อมข้อมูลชื่อผู้ใช้และรหัสผ่านเพื่อใช้สำหรับพื้นฐาน
การรับรองความถูกต้องเมื่อเยี่ยมชมเว็บไซต์
เช่น http://test:[ป้องกันอีเมล]/
ตัวเลือกนี้อาจระบุได้หลายครั้ง
-w, --รอ=วินาที
รอ วินาที ระหว่างการค้นหาเอกสาร โดยปกติ webcheck จะประมวลผล URL และ
ไปที่ถัดไปทันที อย่างไรก็ตามในบางระบบที่โหลดอาจเป็นที่ต้องการ
ให้ webcheck หยุดชั่วคราวระหว่างการร้องขอ ตัวเลือกนี้สามารถตั้งค่าเป็น
จำนวนลบ
-ใน, --รุ่น
แสดงเวอร์ชันของโปรแกรม
-ชม, --ช่วยด้วย
แสดงข้อมูลสรุปสั้นๆ ของตัวเลือก
URL เรียน
URL แบ่งออกเป็นสองคลาส:
ภายใน มีการเรียก URL และรายการที่ดึงมาจะถูกตรวจสอบไวยากรณ์ นอกจากนี้
รายการที่ดึงมาจะถูกค้นหาลิงก์ไปยังรายการอื่น ๆ (ของคลาสใด ๆ ) และลิงก์เหล่านี้คือ
ตาม
ภายนอก URL จะถูกดึงมาเพื่อทดสอบว่าถูกต้องหรือไม่และเพื่อรวบรวมพื้นฐาน
ข้อมูลจากพวกเขา (ชื่อเรื่อง ขนาด ประเภทเนื้อหา ฯลฯ) รายการที่ดึงมาไม่ใช่
ตรวจสอบการเชื่อมโยงไปยังรายการอื่นๆ
นอกเหนือจากชั้นเรียนแล้ว URL ยังได้รับการพิจารณา ถูกดึง (ตามที่ระบุด้วย --yank
หรือ -- หลีกเลี่ยงตัวเลือกภายนอก) URL สามารถเป็นได้ทั้งภายในหรือภายนอก และจะไม่
เรียกคืนหรือตรวจสอบเลย URL ของรูปแบบที่ไม่รองรับจะถือว่าถูกขโมยเช่นกัน
ตัวอย่าง
ตรวจสอบเว็บไซต์ www.example.com แต่พิจารณาเส้นทางใดๆ ที่มี "/webcheck" อยู่ในนั้นให้เป็น
ภายนอก.
ตรวจสอบเว็บ http://www.example.com/ -x /เว็บเช็ค
หมายเหตุ
เมื่อตรวจสอบ URL ภายใน webcheck ให้เกียรติไฟล์ robots.txt โดยระบุว่าตัวเองเป็น
เว็บเช็คตัวแทนผู้ใช้ ลิงก์ที่ไม่อนุญาตจะไม่ถูกตรวจสอบเลยราวกับว่าตัวเลือก -y เป็น
ระบุไว้สำหรับ URL นั้น เพื่ออนุญาตให้ webcheck รวบรวมข้อมูลส่วนต่างๆ ของไซต์ที่โรบ็อตตัวอื่นอยู่
ไม่อนุญาต ใช้บางอย่างเช่น:
ตัวแทนผู้ใช้: *
ไม่อนุญาต: /ฟู
ตัวแทนผู้ใช้: ตรวจสอบเว็บ
อนุญาต: /ฟู
และพวกเรา
_proxy
URL พร็อกซี่สำหรับ .
รายงาน ข้อบกพร่อง
ควรส่งรายงานข้อผิดพลาดไปที่รายชื่อผู้รับจดหมาย[ป้องกันอีเมล]>.
ข้อมูลเพิ่มเติมเกี่ยวกับการรายงานจุดบกพร่องสามารถพบได้ในหน้าแรกของ webcheck:
http://arthurdejong.org/webcheck/
ลิขสิทธิ์
ลิขสิทธิ์ © 1998, 1999 Albert Hopkins (marduk)
ลิขสิทธิ์ © 2002 Mike W. Meyer
ลิขสิทธิ์ © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
webcheck เป็นซอฟต์แวร์ฟรี ดูแหล่งที่มาสำหรับการคัดลอกเงื่อนไข ไม่มีการรับประกัน
ไม่แม้แต่เพื่อการค้าหรือความเหมาะสมสำหรับวัตถุประสงค์เฉพาะ
ไฟล์ที่สร้างเป็นเอาต์พุตจากซอฟต์แวร์ไม่อยู่ภายใต้ .โดยอัตโนมัติ
ลิขสิทธิ์ของซอฟต์แวร์ เว้นแต่จะระบุไว้เป็นอย่างอื่นอย่างชัดเจน
ใช้ webcheck ออนไลน์โดยใช้บริการ onworks.net