영어FrenchSpanish

서버 실행 | Ubuntu > | Fedora > |


온웍스 파비콘

linkchecker - 클라우드의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 linkchecker 실행

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 명령 linkchecker입니다.

프로그램:

이름


linkchecker - HTML 문서와 웹사이트에서 끊어진 링크를 확인하는 명령줄 클라이언트

개요


링크 체커 [옵션] [파일 또는 URL] ...

기술


LinkChecker 기능

· 재귀 및 다중 스레드 검사,

· 컬러 또는 일반 텍스트, HTML, SQL, CSV, XML 또는 사이트맵 그래프로 출력
다양한 형식,

· HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet 및 로컬 파일 지원
연결,

· URL 필터로 링크 확인 제한,

· 프록시 지원,

· HTTP, FTP 및 Telnet에 대한 사용자 이름/암호 인증,

· robots.txt 제외 프로토콜 지원,

· 쿠키 지원

· HTML5 지원

· HTML 및 CSS 구문 검사

· 안티바이러스 검사

· 명령줄, GUI 및 웹 인터페이스

사용 예


가장 일반적인 용도는 주어진 도메인을 재귀적으로 확인하는 것입니다.
링크 체커 http://www.example.com/
이것은 수천 개의 URL을 가질 수 있는 전체 사이트를 확인한다는 점에 유의하십시오. 사용 -r
재귀 깊이를 제한하는 옵션입니다.
다음으로 URL을 확인하지 마십시오. /비밀 그 이름으로. 다른 모든 링크는 평소와 같이 확인됩니다.
링크 체커 --ignore-url=/비밀 mysite.example.com
Unix에서 로컬 HTML 파일 확인:
링크 체커 ../bla.html
Windows에서 로컬 HTML 파일 확인:
링크 체커 c:\temp\test.html
당신은 http:// 도메인이 다음으로 시작하는 경우 URL 부분 WWW.:
링크 체커 www.example.com
당신은 ftp://를 도메인이 다음으로 시작하는 경우 URL 부분 FTP:
링크 체커 -r0 ftp.example.com
사이트맵 그래프를 생성하고 graphviz dot 유틸리티로 변환하십시오:
링크 체커 -오도트 -v www.example.com | -Tps > 사이트맵.ps

옵션


일반 옵션
-f파일 이름, --구성=파일 이름
용도 파일 이름 구성 파일로. 기본 LinkChecker가 사용하는 것처럼
~/.linkchecker/linkcheckerrc.

-h, --도움
도와 줘요! 이 프로그램에 대한 사용 정보를 인쇄합니다.

--stdin
stdin에서 확인할 공백으로 구분된 URL 목록을 읽습니다.

-tNUMBER, --스레드=NUMBER
주어진 스레드 수 이하로 생성하십시오. 기본 스레드 수는
100. 스레딩을 비활성화하려면 양수가 아닌 숫자를 지정하십시오.

-V, --번역
버전을 인쇄하고 종료합니다.

--list-플러그인
사용 가능한 체크 플러그인을 인쇄하고 종료합니다.

산출 옵션
-DSTRING, --디버그=STRING
주어진 로거에 대한 디버깅 출력을 인쇄합니다. 사용 가능한 로거는 명령줄,
확인, 캐시, GUI, DNS모든. 지정 모든 모두를 지정하기 위한 별칭입니다.
사용 가능한 로거. 이 옵션은 여러 번 사용하여 디버그할 수 있습니다.
한 로거. 정확한 결과를 위해 디버그 실행 중에는 스레딩이 비활성화됩니다.

-FTYPE[/부호화][/파일 이름], --파일 출력=TYPE[/부호화][/파일 이름]
파일로 출력 링크 체커 아웃.TYPE, $HOME/.linkchecker/블랙리스트 ...에 대한 블랙리스트
출력, 또는 파일 이름 지정된 경우. NS 부호화 출력 인코딩을 지정하고,
기본값은 로캘의 기본값입니다. 유효한 인코딩은 다음 위치에 나열됩니다.
http://docs.python.org/library/codecs.html#표준 인코딩.
또한 파일 이름부호화 의 일부 없음 출력 유형은 무시됩니다. 그렇지 않으면
파일이 이미 존재하면 덮어씁니다. 이 옵션을 더 지정할 수 있습니다.
한 번보다. 유효한 파일 출력 유형은 다음과 같습니다. 본문, HTML, SQL, csv 파일, gml, , XML,
사이트 맵, 없음 or 블랙리스트. 기본값은 파일 출력 없음입니다. 다양한 출력 유형
아래에 문서화되어 있습니다. 옵션을 사용하여 모든 콘솔 출력을 억제할 수 있습니다.
-o 없음.

--상태 없음
상태 확인 메시지를 인쇄하지 마십시오.

--경고 없음
경고를 기록하지 마십시오. 기본값은 경고를 기록하는 것입니다.

-oTYPE[/부호화], --출력=TYPE[/부호화]
출력 유형을 다음과 같이 지정하십시오. 본문, HTML, SQL, csv 파일, gml, , XML, 사이트 맵, 없음 or
블랙리스트. 기본 유형: 본문. 다양한 출력 유형은 아래에 설명되어 있습니다.
또한 부호화 출력 인코딩을 지정하고 기본값은 로케일의 인코딩입니다.
유효한 인코딩은 다음 위치에 나열됩니다. http://docs.python.org/library/codecs.html#기준-
인코딩.

-q, --조용한
조용한 작업, 별칭 -o 없음. 이것은 다음과 함께만 유용합니다. -F.

-v, --말 수가 많은
확인된 모든 URL을 기록합니다. 기본값은 오류 및 경고만 기록하는 것입니다.

-W정규식, --경고-정규식=정규식
의 내용과 일치하는 경우 경고를 출력하는 정규식을 정의하십시오.
링크를 확인했습니다. 이는 유효한 페이지에만 적용되므로 해당 콘텐츠를 가져올 수 있습니다.
이를 사용하여 "이 페이지
이동했습니다." 또는 "오라클 애플리케이션 오류"입니다.
예를 들어 정규식에서 여러 값을 결합할 수 있습니다.
"(이 페이지는 이동되었습니다|오라클 애플리케이션 오류)".
섹션 참조 정규병 표현 자세한 정보입니다.

확인 옵션
--쿠키파일=파일 이름
초기 쿠키 데이터가 있는 파일을 읽습니다. 쿠키 데이터 형식은 아래에 설명되어 있습니다.

--check-extern
외부 URL을 확인하십시오.

--무시 URL=정규식
주어진 정규 표현식과 일치하는 URL은 무시되고 확인되지 않습니다.
이 옵션은 여러 번 주어질 수 있습니다.
섹션 참조 정규병 표현 자세한 정보입니다.

-NSTRING, --nntp-서버=STRING
NNTP 서버 지정 뉴스: 연결. 기본값은 환경 변수입니다.
NNTP_SERVER. 호스트가 지정되지 않으면 링크 구문만 확인됩니다.

--no-follow-url=정규식
주어진 정규 표현식과 일치하는 URL을 확인하되 재귀하지 마십시오.
이 옵션은 여러 번 주어질 수 있습니다.
섹션 참조 정규병 표현 자세한 정보입니다.

-p, --비밀번호
콘솔에서 암호를 읽고 HTTP 및 FTP 인증에 사용합니다. FTP의 경우
기본 비밀번호는 익명의@. HTTP의 경우 기본 암호가 없습니다. 또한보십시오
-u.

-rNUMBER, --재귀 수준=NUMBER
주어진 깊이까지 모든 링크를 재귀적으로 확인합니다. 음수 깊이는
무한 재귀. 기본 깊이는 무한입니다.

--시간 초과=NUMBER
연결 시도에 대한 시간 초과를 초 단위로 설정합니다. 기본 시간 초과는 60입니다.
초.

-uSTRING, --사용자=STRING
HTTP 및 FTP 인증을 위해 주어진 사용자 이름을 시도하십시오. FTP의 경우 기본값
사용자 이름은 익명. HTTP의 경우 기본 사용자 이름이 없습니다. 또한보십시오 -p.

--사용자 에이전트=STRING
예를 들어 HTTP 서버에 보낼 사용자 에이전트 문자열을 지정합니다.
"모질라/4.0". 기본값은 "LinkChecker/XY"입니다. 여기서 XY는 현재 버전입니다.
링크 체커.

구성 파일


구성 파일은 위의 모든 옵션을 지정할 수 있습니다. 그들은 또한 다음과 같은 몇 가지 옵션을 지정할 수 있습니다.
명령줄에서 설정할 수 없습니다. 보다 linkcheckerrc(5) 자세한 내용은.

출력 타입


기본적으로 오류와 경고만 기록됩니다. 당신은 사용해야합니다 --말 수가 많은
특히 사이트맵 그래프 형식을 출력할 때 전체 URL 목록을 가져오는 옵션입니다.

본문 표준 텍스트 로거, 키워드의 URL 로깅: 인수 방식.

HTML 키워드의 로그 URL: 인수 형식, HTML 형식. 추가로 링크가 있습니다
참조 페이지로 이동합니다. 잘못된 URL에는 HTML 및 CSS 구문 확인 링크가 있습니다.
추가됨.

csv 파일 한 줄에 하나의 URL이 있는 CSV 형식으로 확인 결과를 기록합니다.

gml 연결된 URL 간의 상위-하위 관계를 GML 사이트맵 그래프로 기록합니다.

연결된 URL 간의 부모-자식 관계를 DOT 사이트맵 그래프로 기록합니다.

gxml GraphXML 사이트맵 그래프로 확인 결과를 기록합니다.

XML 검사 결과를 기계가 읽을 수 있는 XML로 기록합니다.

사이트 맵
프로토콜이 문서화된 XML 사이트맵으로 확인 결과를 기록합니다.
http://www.sitemaps.org/protocol.html.

SQL INSERT 명령을 사용하여 검사 결과를 SQL 스크립트로 기록합니다. 생성할 예제 스크립트
초기 SQL 테이블은 create.sql로 포함됩니다.

블랙리스트
크론 작업에 적합합니다. 검사 결과를 파일에 기록 ~/.linkchecker/블랙리스트
유효하지 않은 URL과 포함된 횟수만 포함하는 항목
실패한.

없음 아무것도 기록하지 않습니다. 디버그 또는 종료 코드 확인에 적합합니다.

정규병 표현


LinkChecker는 Python 정규식을 허용합니다. 보다 http://docs.python.org/
방법/regex.html 소개를 위해.

또한 선행 느낌표는 정규식을 무효화합니다.

COOKIE 파일


쿠키 파일에는 다음과 같은 가능한 표준 HTTP 헤더(RFC 2616) 데이터가 포함되어 있습니다.
이름 :

주인 (필수)
쿠키가 유효한 도메인을 설정합니다.

경로 (선택 사항)
쿠키가 값을 갖는 경로를 제공합니다. 기본 경로는 /.

쿠키 설정 (필수)
쿠키 이름/값을 설정합니다. XNUMX회 이상 부여할 수 있습니다.

여러 항목은 빈 줄로 구분됩니다. 아래 예는 두 개의 쿠키를 보냅니다.
로 시작하는 모든 URL에 http://example.com/hello/ 로 시작하는 일대일 URL
https://example.org/:

호스트: example.com
경로: /안녕하세요
쿠키 설정: ID="smee"
쿠키 설정: spam="egg"

호스트: example.org
세트 쿠키: 수하물="엘리트주의자"; comment="홀로그램"

PROXY SUPPORT


Unix 또는 Windows에서 프록시를 사용하려면 $http_proxy, $https_proxy 또는 $ftp_proxy를 설정하십시오.
환경 변수를 프록시 URL에 추가합니다. URL은 다음 형식이어야 합니다.
http://[사용자:패스@]주인[:포트]. LinkChecker는 수동 프록시 설정도 감지합니다.
Windows 시스템에서는 Internet Explorer, Linux 시스템에서는 gconf 또는 KDE. Mac에서 사용
인터넷 구성에서 프록시를 선택합니다. 다음에서 쉼표로 구분된 도메인 목록을 설정할 수도 있습니다.
$no_proxy 환경 변수를 사용하여 이러한 도메인에 대한 프록시 설정을 무시합니다.
예를 들어 Unix에서 HTTP 프록시를 설정하는 것은 다음과 같습니다.

내보내기 http_proxy="http://proxy.example.com:8080"

프록시 인증도 지원됩니다.

내보내기 http_proxy="http://user1:mypass@proxy.example.org:8081"

Windows 명령 프롬프트에서 프록시 설정:

http_proxy= 설정http://proxy.example.com: 8080

수행 체크 무늬


모든 URL은 예비 구문 테스트를 통과해야 합니다. 사소한 인용 실수는
경고, 다른 모든 잘못된 구문 문제는 오류입니다. 구문 검사를 통과한 후
URL이 연결 확인을 위해 대기 중입니다. 모든 연결 확인 유형은 아래에 설명되어 있습니다.

HTTP 링크(HTTP :, HTTPS :)
지정된 HTTP 서버에 연결한 후 지정된 경로 또는 쿼리가 요청됩니다. 모두
리디렉션을 따르고 사용자/비밀번호가 제공되면 다음과 같이 사용됩니다.
필요한 경우 권한 부여. 2xx를 제외한 모든 최종 HTTP 상태 코드는
오류. HTML 페이지 내용은 재귀에 대해 검사됩니다.

로컬 파일(파일 :)
열 수 있는 일반 읽기 가능한 파일이 유효합니다. 읽을 수 있는 디렉토리도
유효한. 다른 모든 파일(예: 장치 파일, 읽을 수 없거나 존재하지 않는 파일)
오류입니다. HTML 또는 기타 구문 분석 가능한 파일 내용이 재귀에 대해 검사됩니다.

메일 링크(mailto :)
mailto: 링크는 결국 이메일 주소 목록으로 확인됩니다. 주소가 하나인 경우
실패하면 전체 목록이 실패합니다. 각 메일 주소에 대해 다음을 확인합니다.
소지품:
1) 앞뒤 부분 모두 주소 구문을 확인합니다.
그 신호.
2) MX DNS 레코드를 조회합니다. MX 레코드를 찾지 못한 경우
오류를 인쇄합니다.
3) 메일 호스트 중 하나가 SMTP 연결을 수락하는지 확인합니다.
우선 순위가 더 높은 호스트를 먼저 확인하십시오.
SMTP를 수락하는 호스트가 없으면 경고를 인쇄합니다.
4) VRFY 명령어로 주소 확인을 시도합니다. 만약 우리가
답변, 확인된 주소를 정보로 인쇄하십시오.

FTP 링크(FTP:)

FTP 링크의 경우 다음을 수행합니다.

1) 지정된 호스트에 연결
2) 주어진 사용자와 비밀번호로 로그인을 시도합니다. 기본값
사용자는 ``anonymous``, 기본 비밀번호는 ``anonymous@``입니다.
3) 주어진 디렉토리로 변경 시도
4) NLST 명령으로 파일 나열

텔넷 링크(``telnet:``)

연결을 시도하고 사용자/비밀번호가 주어지면
주어진 텔넷 서버.

NNTP 링크(``news:``, ``snews:``, ``nntp``)

주어진 NNTP 서버에 연결을 시도합니다. 뉴스 그룹 또는
기사가 지정되면 서버에서 기사를 요청하십시오.

지원되지 않는 링크(``javascript:`` 등)

지원되지 않는 링크는 경고만 인쇄합니다. 더 이상 확인하지 않음
만들어질 것이다.

인식되었지만 지원되지 않는 링크의 전체 목록을 찾을 수 있습니다.
에서 linkcheck/checker/unknownurl.py 소스 파일.
그 중 가장 눈에 띄는 것은 JavaScript 링크입니다.

PLUGINS


연결 플러그인과 콘텐츠 플러그인의 두 가지 플러그인 유형이 있습니다. 연결 플러그인이 실행됩니다.
URL 호스트에 성공적으로 연결한 후 URL 유형이 있는 경우 콘텐츠 플러그인이 실행됩니다.
내용이 있고(mailto: URL에 내용이 없음 등) 확인이 금지되지 않은 경우
(즉, HTTP robots.txt에 의해). 보다 링크 체커 --list-플러그인 플러그인 목록 및 해당
선적 서류 비치. 모든 플러그인은 다음을 통해 활성화됩니다. linkcheckerrc(5) 구성 파일.

회복


재귀적으로 URL로 내려가기 전에 몇 가지 조건을 충족해야 합니다. 그들은
이 순서로 확인:

1. URL이 유효해야 합니다.

2. URL은 구문 분석 가능해야 합니다. 여기에는 현재 HTML 파일이 포함되며,
Opera 북마크 파일 및 디렉토리. 파일 형식을 사용할 수 없는 경우
결정해야 합니다(예: 공통 HTML 파일이 없습니다.
확장명이며 콘텐츠가 HTML처럼 보이지 않음)
구문 분석할 수 없습니다.

3. URL 내용은 검색 가능해야 합니다. 이것은 일반적으로
예를 들어 mailto: 또는 알 수 없는 URL 유형은 제외됩니다.

4. 최대 재귀 수준을 초과하지 않아야 합니다. 구성되어 있습니다
와 더불어 --재귀 수준 옵션이며 기본적으로 무제한입니다.

5. 무시된 URL 목록과 일치하지 않아야 합니다. 이것은 다음으로 제어됩니다.
전에, --무시 URL 옵션을 선택합니다.

6. 로봇 배제 프로토콜은 URL의 링크를 허용해야 합니다.
재귀적으로 따랐다. 이것은 다음을 검색하여 확인됩니다.
HTML 헤더 데이터의 "nofollow" 지시문.

디렉터리 재귀는 하위 집합뿐만 아니라 해당 디렉터리의 모든 파일을 읽습니다.
처럼 index.htm*.

노트


로 시작하는 명령줄의 URL FTP 처럼 취급된다 ftp://ftp., 로 시작하는 URL
WWW. 처럼 취급된다 http://www.. 로컬 파일을 인수로 제공할 수도 있습니다.

인터넷 연결을 자동으로 설정하도록 시스템을 구성한 경우
(예: 다이얼 사용), 로컬 호스트를 가리키지 않는 링크를 확인할 때 연결됩니다.
사용 --무시 URL 이를 방지하기 위한 옵션입니다.

자바스크립트 링크는 지원되지 않습니다.

플랫폼이 스레딩을 지원하지 않으면 LinkChecker가 자동으로 스레딩을 비활성화합니다.

구성 파일에 여러 사용자/암호 쌍을 제공할 수 있습니다.

확인할 때 뉴스: 링크는 주어진 NNTP 호스트가 의 호스트와 같을 필요는 없습니다.
귀하의 페이지를 탐색하는 사용자.

환경


NNTP_SERVER - 기본 NNTP 서버를 지정합니다.
http_proxy - 기본 HTTP 프록시 서버를 지정합니다.
ftp_proxy - 기본 FTP 프록시 서버를 지정합니다.
no_proxy - 프록시 서버를 통해 연결하지 않을 쉼표로 구분된 도메인 목록
LC_MESSAGES, , 언어 - 출력 언어 지정

RETURN VALUE


반환 값은 2일 때

· 프로그램 오류가 발생했습니다.

반환 값은 1일 때

· 잘못된 링크가 발견되었거나

· 링크 경고가 발견되었고 경고가 활성화되었습니다.

그렇지 않으면 반환 값은 XNUMX입니다.

제한


LinkChecker는 확인하기 위해 대기열에 있는 각 URL에 대해 메모리를 사용합니다. 대기 중인 수천 개의 URL
소비된 메모리의 양이 상당히 커질 수 있습니다. 이로 인해 프로그램이 느려지거나
심지어 전체 시스템.

onworks.net 서비스를 사용하여 온라인으로 linkchecker 사용


Ad


Ad