이것은 Ubuntu Online, Fedora Online, Windows online emulator 또는 MAC OS online emulator와 같은 다양한 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공자에서 실행할 수 있는 명령 webcheck입니다.
프로그램:
이름
webcheck - 웹사이트 링크 검사기
개요
웹체크 [OPTION] ... URL
기술
웹체크 지정된 URL의 문서에서 다른 문서로의 링크를 확인하고 다음을 수행합니다.
이러한 링크는 재귀적으로 연결되어 HTML 보고서를 생성합니다.
-NS, --내부=무늬
일치하는 URL을 표시하세요 무늬 (perl 유형의 정규 표현식)을 내부 링크로 사용합니다.
여러 번 사용할 수 있습니다. PATTERN은 전체 URL과 일치합니다.
이 패턴과 일치하는 URL은 다음 중 하나와 일치하더라도 내부로 간주됩니다.
--외부 패턴.
-NS, --외부=무늬
일치하는 URL을 표시하세요 무늬 (perl 유형의 정규 표현식)을 외부 링크로 사용합니다.
여러 번 사용할 수 있습니다. PATTERN은 전체 URL과 일치합니다.
-와이, --yank=무늬
일치하는 URL을 확인하지 마세요. 무늬 (perl 유형 정규 표현식). -x와 같이
플래그이지만 이 옵션을 사용하면 webcheck가 정규 표현식과 일치하는 링크를 확인하지 않습니다.
반면 -x는 링크는 확인하지만 자식은 확인하지 않습니다. 여러 번 사용할 수 있습니다.
PATTERN은 전체 URL과 일치한다는 점에 유의하세요.
-NS, --베이스 전용
기본 URL로 시작하지 않는 모든 URL을 외부 URL로 간주합니다. 예를 들어,
너는 달린다
웹체크 -b http://www.example.com/foo
그때 http://www.example.com/foo/bar 내부로 간주될 것입니다
http://www.example.com/ 외부로 간주됩니다. 기본적으로 모든 페이지는
해당 사이트는 내부용으로 간주됩니다.
-ㅏ --외부 사용을 피하세요
외부 링크를 피하십시오. 일반적으로 웹체크가 HTML 페이지를 검사하고 다음을 발견하면
외부 문서를 가리키는 링크가 있는 경우 해당 외부 문서가 있는지 확인합니다.
문서가 존재합니다. 이 플래그는 해당 작업을 비활성화합니다.
--무시-로봇
robots.txt 파일을 검색하고 구문 분석하지 마십시오. 기본적으로 robots.txt 파일은
검색하고 존중합니다. 무시하고 재정의하려는 경우
웹마스터의 결정에 따라 이 옵션을 사용할 수 있습니다.
robots.txt 처리에 대한 자세한 내용은 아래의 '참고' 섹션을 참조하세요.
-NS, --조용한, --조용한
웹 검사가 사이트를 탐색하는 동안 진행 상황을 인쇄하지 마세요.
-NS, -디버그
사이트를 크롤링하는 동안 디버깅 정보를 인쇄합니다. 이 옵션은 주로 유용합니다.
개발자 용.
-영형, --출력=디렉토리
출력 디렉토리. webcheck가 덤프할 디렉토리를 지정하는 데 사용합니다.
보고서. 기본값은 현재 디렉토리 또는 config.py에서 지정한 디렉토리입니다. 이것이
디렉토리가 존재하지 않습니다. (가능하다면) 자동으로 생성됩니다.
-씨, --계속하다
이전 실행에서 계속 진행해 보세요. 이 옵션을 사용하면 webcheck가 다음을 찾습니다.
출력 디렉토리에 webcheck.dat가 있습니다. 이 파일은 상태를 복원하기 위해 읽힙니다.
이전 실행에서. 이를 통해 webcheck는 이전에 중단된 작업을 계속할 수 있습니다.
실행. 이 옵션을 사용하면 --internal, --external 및 --yank 옵션이 적용됩니다.
URL 인수와 마찬가지로 무시됩니다. --base-only 및 --avoid-external
옵션은 이전 실행과 동일해야 합니다.
이 옵션은 실험적인 것이며 의미는 향후 변경될 수 있습니다.
릴리스(특히 다른 옵션과 관련하여). 또한 저장된
파일은 릴리스 간에 호환성이 보장되지 않습니다.
-NS, --힘
묻지 않고 파일을 덮어씁니다. 이 옵션은 웹체크를 실행하지 않는 데 필요합니다.
대화식으로.
-NS, --리디렉션=N
리디렉션 깊이. 웹체크가 다음을 따를 때 따라야 하는 리디렉션 수
링크. 0은 모든 리디렉션을 따르는 것을 의미합니다.
-유, --사용자패스=URL
기본적인 용도로 사용할 사용자 이름 및 비밀번호 정보가 있는 URL을 지정하세요.
사이트 방문 시 인증.
예 http://test:[이메일 보호]/
이 옵션은 여러 번 지정할 수 있습니다.
-w, --대기=초
기다림 초 문서 검색 사이. 일반적으로 웹체크는 URL을 처리하고
즉시 다음으로 넘어갑니다. 그러나 일부 로드된 시스템에서는 바람직할 수 있습니다.
요청 사이에 웹체크 일시 정지를 설정합니다. 이 옵션은 비
음수.
-V, --번역
프로그램의 버전을 표시합니다.
-시간, --도움
옵션에 대한 간략한 요약을 표시합니다.
URL 클래스
URL은 두 가지 클래스로 구분됩니다.
내부의 URL을 검색하고 검색된 항목의 구문을 확인합니다. 또한,
검색된 항목은 다른 항목(모든 클래스)에 대한 링크를 검색하고 이러한 링크는
따라 갔다.
외부 URL은 유효한지 테스트하고 기본적인 정보를 수집하기 위해서만 검색됩니다.
이들로부터의 정보(제목, 크기, 콘텐츠 유형 등) 검색된 항목은 아닙니다.
다른 항목과의 링크를 검사했습니다.
클래스 외에도 URL을 고려할 수도 있습니다. 잡아당겼다 (--yank로 지정한 대로)
또는 --avoid-external 옵션). URL은 내부 또는 외부일 수 있으며 허용되지 않습니다.
검색되거나 확인되지 않음. 지원되지 않는 스키마의 URL도 yanked로 간주됩니다.
사용 예
www.example.com 사이트를 확인하지만 "/webcheck"가 포함된 모든 경로를 고려하십시오.
외부.
웹체크 http://www.example.com/ -x /웹체크
노트
내부 URL을 검사할 때 webcheck는 robots.txt 파일을 존중하여 자신을 식별합니다.
user-agent 웹 검사. 허용되지 않는 링크는 -y 옵션이 있는 것처럼 전혀 검사되지 않습니다.
해당 URL에 대해 지정됨. 다른 로봇이 크롤링하는 사이트의 일부를 웹체크가 크롤링할 수 있도록 허용하려면
허용되지 않는 경우 다음과 같은 것을 사용하세요.
사용자 에이전트: *
금지 : / foo
사용자 에이전트: 웹체크
허용하다: / foo
환경
_대리
프록시 url .
보고 버그
버그 보고서는 메일링 목록으로 보내야 합니다.[이메일 보호]>.
버그 신고에 대한 자세한 내용은 웹체크 홈페이지에서 확인할 수 있습니다.
http://arthurdejong.org/webcheck/
저작권
저작권 © 1998, 1999 Albert Hopkins (marduk)
저작권 © 2002 Mike W. Meyer
저작권 © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
웹체크는 무료 소프트웨어입니다. 복사 조건은 출처를 참조하세요. 보증은 없습니다.
상품성이나 특정 목적에의 적합성 여부도 고려되지 않습니다.
소프트웨어에서 출력으로 생성된 파일은 자동으로 다음에 해당되지 않습니다.
명확하게 달리 명시되어 있지 않는 한, 소프트웨어의 저작권이 있습니다.
onworks.net 서비스를 사용하여 온라인으로 웹체크를 사용하세요