webcheck - 클라우드에서 온라인

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 명령 webcheck입니다.

프로그램:

이름


webcheck - 웹사이트 링크 검사기

개요


웹체크 [OPTION] ... URL

기술


웹체크 다른 문서에 대한 링크에 대해 지정된 URL의 문서를 확인합니다.
이러한 링크를 재귀적으로 생성하고 HTML 보고서를 생성합니다.

-NS, --내부=무늬
일치하는 URL 표시 무늬 (perl 유형 정규식)을 내부 링크로 사용합니다.
여러 번 사용할 수 있습니다. PATTERN은 전체 URL과 일치합니다.
이 PATTERN과 일치하는 URL은 다음 중 하나와 일치하더라도 내부로 간주됩니다.
--외부 패턴.

-NS, --외부=무늬
일치하는 URL 표시 무늬 (perl 유형 정규식)을 외부 링크로 사용합니다.
여러 번 사용할 수 있습니다. PATTERN은 전체 URL과 일치합니다.

-와이, --양크=무늬
일치하는 URL을 확인하지 마십시오. 무늬 (펄 유형 정규식). -x처럼
플래그, 이 옵션을 사용하면 webcheck가 정규식과 일치하는 링크를 확인하지 않습니다.
반면 -x는 링크를 확인하지만 자식은 확인하지 않습니다. 여러 번 사용할 수 있습니다.
PATTERN은 전체 URL과 일치합니다.

-NS, --기본 전용
기본 URL로 시작하지 않는 모든 URL을 외부 URL로 간주합니다. 예를 들어
너는 달린다
웹체크 -b http://www.example.com/foo
그때 http://www.example.com/foo/bar 내부로 간주되지만
http://www.example.com/ 외부로 간주됩니다. 기본적으로 모든 페이지
사이트는 내부로 간주됩니다.

-ㅏ --회피-외부
외부 링크를 피하십시오. 일반적으로 webcheck가 HTML 페이지를 검사하고 발견하면
외부 문서를 가리키는 링크는 외부 문서가
문서가 존재합니다. 이 플래그는 해당 작업을 비활성화합니다.

--무시 로봇
robots.txt 파일을 검색 및 구문 분석하지 마십시오. 기본적으로 robots.txt 파일은
되찾고 존경합니다. 무시하고 재정의하려는 경우
웹마스터의 결정에 따라 이 옵션을 사용할 수 있습니다.
robots.txt 처리에 대한 자세한 내용은 아래의 참고 섹션을 참조하십시오.

-NS, --조용한, --조용한
webcheck가 사이트를 통과할 때 진행 상황을 인쇄하지 마십시오.

-NS, -디버그
사이트를 크롤링하는 동안 디버깅 정보를 인쇄합니다. 이 옵션은 주로 유용합니다.
개발자 용.

-영형, --출력=디렉토리
출력 디렉토리. webcheck가 덤프할 디렉토리를 지정하는 데 사용합니다.
보고서. 기본값은 현재 디렉토리이거나 config.py에서 지정한 대로입니다. 이 경우
디렉토리가 존재하지 않으면 생성됩니다(가능한 경우).

-씨, --계속하다
이전 실행에서 계속해 보십시오. 이 옵션을 사용할 때 webcheck는 다음을 찾습니다.
출력 디렉토리의 webcheck.dat. 이 파일을 읽어 상태를 복원합니다.
이전 실행에서. 이렇게 하면 이전에 중단된 Webcheck를 계속할 수 있습니다.
운영. 이 옵션을 사용하면 --internal, --external 및 --yank 옵션이
URL 인수와 마찬가지로 무시됩니다. --base-only 및 --avoid-external
옵션은 이전 실행과 동일해야 합니다.
이 옵션은 실험적이며 의미 체계가 다음과 같이 변경될 수 있습니다.
릴리스(특히 다른 옵션과 관련하여). 또한 저장된다는 점에 유의하십시오.
파일은 릴리스 간에 호환성이 보장되지 않습니다.

-NS, --힘
묻지 않고 파일을 덮어씁니다. 이 옵션은 webcheck가 아닌 실행에 필요합니다.
대화식으로.

-NS, --리디렉션=N
깊이를 리디렉션합니다. 다음을 따를 때 웹 검사가 따라야 하는 리디렉션 수
링크. 0은 모든 리디렉션을 따르는 것을 의미합니다.

-유, --사용자 패스=URL
기본에 사용할 사용자 이름과 비밀번호 정보가 있는 URL을 지정합니다.
사이트 방문 시 인증.
http://test:secret@example.com/
이 옵션은 여러 번 지정할 수 있습니다.

-w, --대기=
기다림 문서 검색 사이. 일반적으로 webcheck는 URL을 처리하고
즉시 다음으로 넘어갑니다. 그러나 일부 로드된 시스템에서는 바람직할 수 있습니다.
요청 사이에 webcheck 일시 중지를 갖습니다. 이 옵션은 다음과 같이 설정할 수 있습니다.
음수.

-V, --번역
프로그램의 버전을 표시합니다.

-시간, --도움
옵션에 대한 간략한 요약을 표시합니다.

URL 클래스


URL은 두 가지 클래스로 나뉩니다.

내부의 URL이 검색되고 검색된 항목의 구문이 확인됩니다. 또한,
검색된 항목은 (모든 클래스의) 다른 항목에 대한 링크를 검색하고 이러한 링크는
따라 갔다.

외부 URL은 유효한지 테스트하고 몇 가지 기본 정보를 수집하기 위해서만 검색됩니다.
정보(제목, 크기, 콘텐츠 유형 등). 검색된 항목이 아닙니다
다른 항목에 대한 링크를 검사했습니다.

클래스 외에도 URL도 고려할 수 있습니다. (--yank로 지정된 대로
또는 --avoid-external 옵션). URL은 내부 또는 외부일 수 있으며
검색되거나 전혀 확인되지 않았습니다. 지원되지 않는 스키마의 URL도 yanked로 간주됩니다.

사용 예


www.example.com 사이트를 확인하지만 "/webcheck"가 포함된 경로는
외부의.
웹체크 http://www.example.com/ -x /웹체크

노트


내부 URL을 확인할 때 webcheck는 robots.txt 파일을 존중하여 다음과 같이 식별합니다.
사용자 에이전트 웹 체크. 허용되지 않는 링크는 -y 옵션이 있는 것처럼 전혀 확인되지 않습니다.
해당 URL에 대해 지정됩니다. Webcheck가 다른 로봇이 있는 사이트의 일부를 크롤링할 수 있도록 하려면
허용되지 않는 경우 다음과 같이 사용하십시오.
사용자 에이전트: *
금지 : / foo

사용자 에이전트: 웹체크
허용하다: / foo

환경


_대리
프록시 URL .

보고 버그


버그 보고서는 메일링 리스트로 보내야 합니다.webcheck-users@lists.arthurde Jong.org>.
버그 보고에 대한 자세한 내용은 webcheck 홈페이지에서 확인할 수 있습니다.
http://arthurdejong.org/webcheck/

저작권


Copyright © 1998, 1999 Albert Hopkins(마르둑)
저작권 © 2002 마이크 W. 메이어
저작권 © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
webcheck는 무료 소프트웨어입니다. 복사 조건에 대한 소스를 참조하십시오. 보증이 없습니다.
상품성 또는 특정 목적에의 적합성에도 해당하지 않습니다.
소프트웨어에서 출력으로 생성된 파일은 자동으로 아래에 해당하지 않습니다.
명시적으로 달리 명시되지 않는 한 소프트웨어의 저작권.

onworks.net 서비스를 사용하여 온라인으로 webcheck 사용



최신 Linux 및 Windows 온라인 프로그램