Đây là webcheck lệnh có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
webcheck - trình kiểm tra liên kết trang web
SYNOPSIS
kiểm tra web [TÙY CHỌN] ... URL
MÔ TẢ
kiểm tra web sẽ kiểm tra tài liệu tại URL được chỉ định để tìm các liên kết đến các tài liệu khác, hãy làm theo
các liên kết này một cách đệ quy và tạo một báo cáo HTML.
-tôi, --internal =MẪU
Đánh dấu các URL phù hợp với MẪU (biểu thức chính quy kiểu perl) dưới dạng liên kết nội bộ.
Có thể sử dụng nhiều lần. Lưu ý rằng MẪU được khớp với URL đầy đủ.
Các URL khớp với PATTERN này sẽ được coi là nội bộ, ngay cả khi chúng khớp với một trong các
- MẪU bên ngoài.
-NS, - bên ngoài =MẪU
Đánh dấu các URL phù hợp với MẪU (biểu thức chính quy kiểu perl) như một liên kết bên ngoài.
Có thể sử dụng nhiều lần. Lưu ý rằng MẪU được khớp với URL đầy đủ.
-y, --yank =MẪU
Không kiểm tra các URL khớp với MẪU (biểu thức chính quy kiểu perl). Giống như -x
cờ, mặc dù tùy chọn này sẽ khiến kiểm tra web không kiểm tra liên kết được khớp bởi regex
trong khi -x sẽ kiểm tra liên kết nhưng không phải con của nó. Có thể sử dụng nhiều lần.
Lưu ý rằng MẪU được khớp với URL đầy đủ.
-NS, - chỉ cơ sở
Coi bất kỳ URL nào không bắt đầu bằng URL cơ sở là bên ngoài. Ví dụ, nếu
bạn chạy
kiểm tra web -b http://www.example.com/foo
sau đó http://www.example.com/foo/bar sẽ được coi là nội bộ trong khi
http://www.example.com/ sẽ được coi là bên ngoài. Theo mặc định, tất cả các trang trên
trang web sẽ được coi là nội bộ.
-một, --avoid-bên ngoài
Tránh các liên kết bên ngoài. Thông thường, nếu webcheck đang kiểm tra một trang HTML và nó tìm thấy
một liên kết trỏ đến một tài liệu bên ngoài, nó sẽ kiểm tra xem liệu bên ngoài đó có
tài liệu tồn tại. Cờ này vô hiệu hóa hành động đó.
- người máy lớn
Không truy xuất và phân tích cú pháp tệp robots.txt. Theo mặc định, các tệp robots.txt là
truy xuất và vinh danh. Nếu bạn chắc chắn bạn muốn bỏ qua và ghi đè
quyết định của quản trị viên web có thể sử dụng tùy chọn này.
Để biết thêm thông tin về cách xử lý robots.txt, hãy xem phần LƯU Ý bên dưới.
-NS, --Yên lặng, --im lặng
Không in ra tiến trình khi kiểm tra web duyệt qua một trang web.
-NS, --gỡ lỗi
In thông tin gỡ lỗi trong khi thu thập dữ liệu trang web. Tùy chọn này chủ yếu hữu ích
cho các nhà phát triển.
-ồ, --output =MỤC
Thư mục đầu ra. Sử dụng để chỉ định thư mục nơi webcheck sẽ kết xuất
báo cáo. Mặc định là thư mục hiện tại hoặc được chỉ định bởi config.py. Nếu điều này
thư mục không tồn tại nó sẽ được tạo cho bạn (nếu có thể).
-NS, --tiếp tục
Cố gắng tiếp tục từ lần chạy trước. Khi sử dụng tùy chọn này, webcheck sẽ tìm kiếm
một webcheck.dat trong thư mục đầu ra. Tệp này được đọc để khôi phục trạng thái
từ lần chạy trước. Điều này cho phép kiểm tra web tiếp tục một lần bị gián đoạn trước đó
chạy. Khi tùy chọn này được sử dụng, các tùy chọn --internal, --external và --yank sẽ
được bỏ qua cũng như bất kỳ đối số URL nào. - chỉ-base và --avoid-external
các tùy chọn phải giống như lần chạy trước.
Lưu ý rằng tùy chọn này là thử nghiệm và ngữ nghĩa của nó có thể thay đổi khi
phát hành (đặc biệt là liên quan đến các tùy chọn khác). Cũng lưu ý rằng
các tệp không được đảm bảo tương thích giữa các bản phát hành.
-NS, --lực lượng
Ghi đè các tệp mà không cần hỏi. Tùy chọn này là bắt buộc để chạy webcheck không
một cách tương tác.
-NS, --redirects =N
Độ sâu chuyển hướng. số lượng chuyển hướng webcheck nên tuân theo khi thực hiện theo
liên kết. 0 ngụ ý làm theo tất cả các chuyển hướng.
-bạn, --userpass =URL
Chỉ định một URL với thông tin tên người dùng và mật khẩu để sử dụng cho cơ bản
xác thực khi truy cập trang web.
ví dụ http://test:[email được bảo vệ]/
Tùy chọn này có thể được chỉ định nhiều lần.
-w, - chờ đợi =GIÂY
Đợi GIÂY giữa các lần truy xuất tài liệu. Thông thường webcheck sẽ xử lý một url và
ngay lập tức chuyển sang phần tiếp theo. Tuy nhiên, trên một số hệ thống được tải, nó có thể được mong muốn
để kiểm tra web tạm dừng giữa các yêu cầu. Tùy chọn này có thể được đặt thành bất kỳ
số âm.
-v, --phiên bản
Hiển thị phiên bản của chương trình.
-NS, --Cứu giúp
Hiển thị tóm tắt ngắn về các tùy chọn.
URL CÁC LỚP HỌC
URL được chia thành hai lớp:
nội URL được truy xuất và mục truy xuất được kiểm tra cú pháp. Ngoài ra,
mục đã truy xuất được tìm kiếm các liên kết đến các mục khác (thuộc bất kỳ lớp nào) và các liên kết này là
theo sau.
Bên ngoài URL chỉ được truy xuất để kiểm tra xem chúng có hợp lệ hay không và để thu thập một số
thông tin từ chúng (tiêu đề, kích thước, loại nội dung, v.v.). Các mục được truy xuất không phải là
kiểm tra các liên kết đến các mục khác.
Ngoài lớp của chúng, các URL cũng có thể được coi là giật mạnh (như được chỉ định với --yank
hoặc tùy chọn - không-bên ngoài). Các URL có thể là nội bộ hoặc bên ngoài và sẽ không
truy xuất hoặc kiểm tra ở tất cả. URL của các chương trình không được hỗ trợ cũng được coi là bị kéo.
VÍ DỤ
Kiểm tra trang web www.example.com nhưng hãy xem bất kỳ đường dẫn nào có "/ webcheck" trong đó là
bên ngoài.
kiểm tra web http://www.example.com/ -x / webcheck
GHI CHÚ
Khi kiểm tra URL nội bộ, webcheck sẽ tôn trọng tệp robots.txt, tự xác định là
kiểm tra web tác nhân người dùng. Các liên kết không được phép sẽ không được kiểm tra như thể tùy chọn -y là
được chỉ định cho URL đó. Để cho phép kiểm tra web thu thập thông tin các phần của trang web mà các rô bốt khác đang
không được phép, sử dụng một cái gì đó như:
Đại lý người dùng: *
Không cho phép: / foo
Đại lý người dùng: kiểm tra web
Cho phép: / foo
MÔI TRƯỜNG
_Ủy quyền
Url proxy cho .
BÁO CÁO GIỎI
Báo cáo lỗi shoult được gửi đến danh sách gửi thư[email được bảo vệ]>.
Bạn có thể tìm thêm thông tin về báo cáo lỗi trên trang chủ webcheck:
http://arthurdejong.org/webcheck/
BẢN QUYỀN
Bản quyền © 1998, 1999 Albert Hopkins (marduk)
Bản quyền © 2002 Mike W. Meyer
Bản quyền © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
webcheck là phần mềm miễn phí; xem nguồn để biết điều kiện sao chép. KHÔNG có bảo hành;
thậm chí không phải vì tính KHẢ NĂNG LÊN LỚN hoặc SỰ PHÙ HỢP VỚI MỤC ĐÍCH CỤ THỂ.
Các tệp được tạo ra dưới dạng đầu ra từ phần mềm không tự động nằm trong
bản quyền của phần mềm, trừ khi có quy định rõ ràng khác.
Sử dụng webcheck trực tuyến bằng các dịch vụ onworks.net