이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 pdfgrep입니다.
프로그램:
이름
pdfgrep - 정규 표현식에 대한 pdf 파일 검색
개요
pdfgrep [OPTION...] 무늬 [FILE...]
기술
에 대한 검색 무늬 각 FILE. 무늬 확장 정규식입니다.
pdfgrep grep과 매우 유사하게 작동하지만 한 가지 차이점이 있습니다. 페이지에서 작동하고 행에서는 작동하지 않습니다.
옵션
-i, --대소문자 무시
두 경우 모두에서 대소문자 구분을 무시합니다. 무늬 및 입력 파일.
-F, --고정 문자열
해석하다 무늬 개행으로 구분된 고정 문자열 목록으로, 그 중 하나는 다음과 같습니다.
일치합니다.
-P, --perl-regexp
해석하다 무늬 Perl 호환 정규식(PCRE)으로. 보다 사전 구문(3)
빠른 개요.
-H, --파일 이름 포함
각 일치에 대한 파일 이름을 인쇄하십시오. 더 있을 때 기본 설정입니다.
하나 이상의 파일을 검색할 수 있습니다.
-h, --no-파일 이름
출력에서 파일 이름의 접두사를 억제합니다. 있을 때 기본 설정입니다.
검색할 파일은 하나뿐입니다.
-n, --페이지 번호
각 일치 항목에 발견된 페이지 번호를 접두사로 붙입니다.
-c, --세다
정상 출력을 억제합니다. 대신 각 입력 파일에 대해 일치하는 수를 인쇄하십시오. 메모
grep과 달리 동일한 페이지의 여러 일치 항목은 개별적으로 계산됩니다.
-p, --페이지 수
처럼 -c, 그러나 페이지당 일치 항목 수를 인쇄합니다.
-C, --문맥 NUM
최대 인쇄 INUM 각 경기에 대한 컨텍스트의 문자. 정확한 숫자는
pdfgrep은 단어 경계를 존중하려고 하기 때문에 다양합니다. 만약에 NUM "선", 전체
라인이 인쇄됩니다. 이 옵션이 설정되어 있지 않으면 pdfgrep은 다음과 같은 줄을 인쇄하려고 시도합니다.
터미널 너비보다 길지 않습니다.
--색상 WHEN
파일 이름, 페이지 번호 및 일치하는 텍스트를 표시할 이스케이프 시퀀스로 묶습니다.
터미널에 색상으로 표시됩니다. (기본 설정은 자동). WHEN 될 수 있습니다 :
항상
stdout이 터미널이 아닌 경우에도 항상 색상을 사용하십시오.
못
색상을 사용하지 마십시오.
자동
stdout이 터미널인 경우에만 색상을 사용하십시오.
-o, --만 일치
주변 컨텍스트 없이 줄에서 일치하는 부분만 인쇄합니다.
-r, -재귀
모든 파일을 재귀적으로 검색합니다( --포함하다 그리고 --들어오지 못하게 하다) 각 아래
디렉토리, 명령줄에 있는 경우에만 심볼릭 링크를 따릅니다.
-R, --역참조-재귀적
과 동일 -r, 그러나 모든 심볼릭 링크를 따릅니다.
--제외=GLOB
기본 이름이 일치하는 파일 건너뛰기 GLOB. 참조 글롭(7) 와일드 카드의 경우 사용할 수 있습니다. 너
이 옵션을 여러 번 사용하여 더 많은 패턴을 제외할 수 있습니다. 에 우선합니다
--포함하다. in- 및 exclude는 다음을 통해 찾은 파일에만 적용됩니다. -재귀 그리고
인수 목록에 없습니다.
--포함=GLOB
기본 이름이 일치하는 파일만 검색 GLOB. 참조 --들어오지 못하게 하다 자세한 내용은. 기본값
is * .pdf.
--비밀번호=PASSWORD
PASSWORD를 사용하여 PDF 파일의 암호를 해독하십시오. 여러 번 지정할 수 있습니다. 모든 비밀번호
모든 PDF에서 시도됩니다. 주의 사항 이 암호가 명령에 표시됩니다.
역사와 결과물 ps(1). 따라서 보안이 필요한 경우 사용하지 마십시오. PASSWORD
중요하다.
-m, --최대 개수 NUM
다음 후 파일 읽기 중지 NUM 성냥. -c 또는 --count 옵션도 함께 사용되는 경우,
pdfgrep은 다음보다 큰 수를 출력하지 않습니다. NUM.
-Z, --없는
널 바이트 출력( NUL 콜론 대신 ASCII 및 '\0'
일반적으로 파일 이름을 줄의 나머지 부분과 구분합니다. 이 옵션은 출력을
파일 이름에 콜론, 공백 또는 개행 문자가 있는 경우 모호하지 않습니다. 그것은 될 수 있습니다
다음과 같은 명령과 함께 사용 xargs -0 or 펄 -0.
--일치 접두사 구분 기호 9월
출력에서 파일 이름, 줄 번호 및 텍스트를 구분하는 데 사용되는 콜론을 다음으로 변경합니다.
9월, 임의의 문자열이 될 수 있습니다. 이것은 파일 이름에 콜론이 포함되어 있을 때 유용합니다.
그러나 대화식 사용에만 해당됩니다. 스크립팅의 경우, --없는 사용되어야한다.
-디버그
디버그 출력을 활성화합니다. 주의 사항: 0.30.0 이전 버전에서는 포플러의 한계로 인해 일부
디버그 출력도 없이 인쇄됩니다. -디버그 이러한 포플러 버전을 사용할 때.
--경고-비어 있음
경고 인쇄 표준 오류 PDF에 검색 가능한 텍스트가 없는 경우. 에 대한 경우입니다.
스캔한 문서와 같이 이미지로만 구성된 PDF.
--우낙
검색 패턴과 PDF 문서 모두에서 악센트와 합자를 제거합니다. 이것
"ae"가 포함된 단어를 검색하려는 경우 유용하지만 PDF는
대신 단일 문자 "æ". 보다 우낙(3) 그리고 억양(1) 를 참조하세요
이 option is 실험 그리고 만 가능 if pdfgrep is 컴파일 과 우낙
지원합니다.
-q, --조용한
stdout에 대한 모든 일반 출력을 억제합니다. 오류가 인쇄되고 종료 코드가
반환됩니다(아래 참조).
--도움
옵션에 대한 간략한 요약을 인쇄하십시오.
-V, --번역 버전 정보를 표시합니다.
EXIT 지위
일반적으로 종료 상태는 일치하는 항목이 하나 이상 있으면 0이고 일치하는 항목이 없으면 1입니다.
2 오류가 발생한 경우. 하지만 만약 --조용한 or -q 옵션이 사용되었고 일치하는 항목이 발견되었습니다.
pdfgrep 오류에 관계없이 0을 반환합니다.
환경 변수
행동 pdfgrep 다음 환경 변수의 영향을 받습니다.
GREP_COLORS
다양한 부분을 강조 표시하는 데 사용되는 색상 및 기타 속성을 지정합니다.
산출. 구문과 값은 다음과 같습니다. GREP_COLORS of GREP. 참조 GREP(1) 더 많은
세부. 현재 기능만 mt, ms, mc, fn, ln 그리고 se 에 의해 사용됩니다
pdfgrep어디로 mt, ms 그리고 mc 같은 효과가 있습니다.
사용 예
인쇄 전에, 먼저 안색 라인 어울리는 무늬 그리고 인쇄 그들의 페이지 번호
pdfgrep -n --max-count 10 패턴 foo.pdf
검색 모든 .PDF 파일 누구의 이름 시작하다 과 푸 재귀 적으로 in 전에, current 예배 규칙서
pdfgrep -r -- "foo*.pdf" 패턴 포함
검색 모든 .PDF 파일 그 are 작은 보다 12M 재귀 적으로 in 전에, current 예배 규칙서
찾기 . -이름 "*.pdf" -크기 -12M -print0 | xargs -0 pdfgrep 패턴
이전 예와 달리 이 작업은 다음으로 해결할 수 없습니다.
pdfgrep만 사용할 수 있지만 Unix 도구 발견(1) 그리고 xargs(1) 사용해야했습니다. 그것은 왜냐하면
pdfgrep 자체에는 크기별로 파일을 제외하는 옵션이 포함되어 있지 않습니다. 하지만 보시다시피,
그럴 필요가 없습니다!
onworks.net 서비스를 사용하여 pdfgrep 온라인 사용
