이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 pdf2htmlEX 명령입니다.
프로그램:
이름
pdf2htmlEX - 텍스트와 형식을 잃지 않고 PDF를 HTML로 변환합니다.
사용법
pdf2htmlEX [옵션] [ ]
기술
pdf2htmlEX는 PDF 파일을 HTML 파일로 변환하는 유틸리티입니다.
pdf2htmlEX는 PDF를 정확하게 렌더링하고 적절한 스타일을 유지하기 위해 최선을 다합니다.
텍스트를 유지하고 웹에 최적화합니다.
글꼴은 PDF에서 추출된 다음 HTML, 변환된 HTML 파일의 텍스트에 포함됩니다.
일반적으로 선택 및 복사가 가능합니다.
다른 개체는 이미지로 렌더링되고 포함됩니다.
옵션
페이지
-NS, --첫 페이지 (기본: 1)
처리할 첫 번째 페이지 지정
-엘, --마지막 페이지 (기본: 지난 페이지)
처리할 마지막 페이지 지정
크기
--줌 , --맞춤 너비 , --적합 높이
--zoom은 확대/축소 비율을 직접 지정합니다. --fit-width/height는 최대값을 지정합니다.
페이지의 너비/높이 값은 픽셀 단위입니다.
여러 값을 지정하는 경우 최소 값이 사용됩니다.
아무것도 지정하지 않으면 페이지가 72DPI로 렌더링됩니다.
--사용-cropbox <0|1> (기본: 1)
출력에는 MediaBox 대신 CropBox를 사용하십시오.
--hdpi , --vdpi (기본: 144)
이미지의 수평 및 수직 DPI 지정
산출
--포함시키다
--embed-css <0|1> (기본: 1)
--삽입 글꼴 <0|1> (기본: 1)
--이미지 삽입 <0|1> (기본: 1)
--embed-자바스크립트 <0|1> (기본: 1)
--삽입 개요 <0|1> (기본: 1)
출력 HTML 파일에 포함되어야 하는 요소를 지정합니다.
스위치를 끄면 HTML 파일과 함께 분리된 파일이 생성됩니다.
해당 요소.
--embed는 문자열을 인수로 허용합니다. 문자열의 각 문자는 다음 중 하나여야 합니다.
--embed-*** 스위치 중 하나에 해당하는 `cCfFiIjJoO`. 소문자
0은 문자, 1은 대문자입니다. 예를 들어 `--embed cFIJo`는 다음을 의미합니다.
CSS 파일과 개요를 제외한 모든 것을 포함합니다.
--분할 페이지 <0|1> (기본: 0)
켜면 각 페이지의 내용이 별도의 파일에 저장됩니다.
이 스위치는 페이지를 개별적으로 동적으로 로드하려는 경우에 유용합니다.
지원 서버가 필요할 수 있습니다.
--page-filename도 참조하세요.
--대상 디렉토리 (기본: .)
대상 폴더를 지정합니다.
--css-파일 이름 (기본: )
포함되지 않은 경우 생성된 CSS 파일의 파일 이름을 지정합니다.
비어 있으면 파일 이름이 자동으로 결정됩니다.
--페이지 파일 이름 (기본: )
--split-pages가 1인 경우 페이지의 파일 이름 템플릿을 지정합니다.
페이지 번호가 어디에 있는지 나타내기 위해 `filename`에 %d자리 표시자가 포함될 수 있습니다.
배치해야 합니다. 자리 표시자는 일반 숫자의 제한된 하위 집합을 지원합니다.
지정된 너비와 제로 패딩을 포함한 자리 표시자.
`filename`에 페이지 번호에 대한 자리 표시자가 포함되어 있지 않으면 페이지 번호
파일 확장자 바로 앞에 삽입됩니다. 파일 이름에 없는 경우
확장자가 있는 경우 페이지 번호는 파일 이름 끝에 표시됩니다.
--page-filename이 지정되지 않은 경우 출력에 사용됩니다
파일 이름, 확장자를 .page로 바꾸고 페이지 번호를 직접 추가
연장 전.
예
pdf2htmlEX --분할 페이지 1 푸.pdf
페이지 파일 foo1.page, foo2.page 등을 생성합니다.
pdf2htmlEX --분할 페이지 1 푸.pdf --페이지 파일 이름 바.바즈
페이지 파일 bar1.baz, bar2.baz 등을 생성합니다.
pdf2htmlEX --분할 페이지 1 푸.pdf --페이지 파일 이름 페이지%dbar.baz
페이지 파일 page1bar.baz, page2bar.baz 등을 생성합니다.
pdf2htmlEX --분할 페이지 1 푸.pdf --페이지 파일 이름 바%03d.baz
페이지 파일 bar001.baz, bar002.baz 등을 생성합니다.
--outline-파일 이름 (기본: )
포함되지 않은 경우 생성된 개요 파일의 파일 이름을 지정합니다.
비어 있으면 파일 이름이 자동으로 결정됩니다.
--프로세스-비텍스트 <0|1> (기본: 1)
텍스트가 아닌 객체를 이미지로 처리할지 여부
--프로세스 개요 <0|1> (기본: 1)
생성된 HTML에 개요를 표시할지 여부
--프로세스 주석 <0|1> (기본: 0)
생성된 HTML에 주석을 표시할지 여부
--프로세스 양식 <0|1> (기본: 0)
생성된 HTML에 텍스트 필드와 라디오 버튼을 포함할지 여부
--인쇄 <0|1> (기본: 1)
인쇄 지원을 활성화합니다. 이 옵션을 비활성화하면 CSS 크기가 줄어들 수 있습니다.
--대체 <0|1> (기본: 0)
정확성과 브라우저 호환성을 높이기 위해 대체 모드로 출력하지만
크기가 커집니다.
--tmp-파일-크기-제한 (기본: - 1)
이는 임시 파일의 전체 크기(KB)를 제한하며, 이는 또한
출력 파일의 전체 크기입니다. 이는 추정치이며 한 페이지가 지나면 중지됩니다.
총 임시 파일 크기가 이 숫자보다 큰 경우.
-1은 제한이 없음을 의미하며 기본값입니다.
글꼴
--삽입 외부 글꼴 <0|1> (기본: 1)
PDF에 포함되지 않은 글꼴에 대해 로컬 일치 글꼴을 사용해야 하는지 여부를 지정합니다.
HTML에 포함됩니다.
이 스위치가 꺼져 있으면 웹 브라우저가 시도할 수 있도록 글꼴 이름만 내보내집니다.
적절한 글꼴을 직접 찾으려면 잘못된 글꼴 문제가 발생할 수 있습니다.
측정 항목.
--글꼴 형식 (기본: 와우)
PDF 파일에서 추출된 글꼴 형식을 지정합니다.
--분해 합자 <0|1> (기본: 0)
합자를 분해합니다. 예를 들어 'fi' -> 'f''i'입니다.
--자동 힌트 <0|1> (기본: 0)
1로 설정하면 FontForge를 사용하여 글꼴에 대한 힌트가 생성됩니다.
--external-hint-tool이 앞에 올 수 있습니다.
--외부 힌트 도구 (기본: )
지정된 경우 글꼴에 대한 힌트를 강화하기 위해 도구가 호출됩니다.
--auto-hint보다 우선합니다.
도구 이름은 ' ', 접미사는 어디에 있습니까?
--font-format에 지정된 것과 동일합니다.
--stretch-narrow-glyph <0|1> (기본: 0)
1로 설정하면 PDF에 설명된 것보다 좁은 글리프가 늘어납니다. 그렇지 않으면
문자 오른쪽에 공간이 채워집니다.
--squeeze-wide-glyph <0|1> (기본: 1)
1로 설정하면 PDF에 설명된 것보다 더 넓은 글리프가 압착됩니다. 그렇지 않으면 그럴 것이다
잘립니다.
--override-fstype <0|1> (기본: 0)
TTF/OTF 글꼴에서 fstype 비트를 지웁니다.
Internet Explorer에서 '권한을 설치할 수 있어야 합니다'라는 메시지가 표시되는 경우 이 기능을 켜십시오.
그리고 귀하는 그렇게 할 수 있는 권한이 있습니다.
--프로세스 유형3 <0|1> (기본: 0)
켜져 있으면 pdf2htmlEX는 텍스트가 가능하도록 Type 3 글꼴을 변환하려고 시도합니다.
기본적으로 HTML로 렌더링됩니다. 그렇지 않으면 Type 3 글꼴이 포함된 모든 텍스트가 렌더링됩니다.
이미지로.
이 기능은 매우 실험적입니다.
본문
--헵스 , --veps (기본: 1)
허용 가능한 최대 가로/세로 오프셋(픽셀 단위)을 지정합니다.
pdf2htmlEX는 생성된 HTML 파일을 이 내에서 텍스트를 이동하여 최적화하려고 시도합니다.
거리.
--공간 임계값 (기본: 0.125)
pdf2htmlEX는 두 문자 사이의 거리가 공백 문자 ''를 삽입합니다.
같은 줄에 연속된 문자가 ratio *font_size보다 넓습니다.
--글꼴 크기 승수 (기본: 4.0)
많은 웹 브라우저는 최소 글꼴 크기를 제한하며 많은 웹 브라우저는 지정된 글꼴을 반올림합니다.
크기로 인해 잘못된 렌더링이 발생합니다.
1보다 큰 비율을 지정하면 이 문제가 해결되지만 정지될 수 있습니다.
일부 브라우저.
그러나 일부 Firefox 버전에서는 글꼴 크기가 다음과 같은 경우 문제가 발생할 수 있습니다.
너무 크면 여기에 더 작은 값을 지정해야 합니다.
--오프셋으로서의 공간 <0|1> (기본: 0)
1로 설정하면 공백 문자가 오프셋으로 처리되어 더 나은 결과를 얻을 수 있습니다.
최적화.
인코딩이 잘못된 PDF 파일의 경우 이 옵션을 켜면 파일이 손실될 수 있습니다.
자.
--투유니코드 <-1|0|1> (기본: 0)
PDF의 각 글꼴에 대해 '의미'를 나타내는 ToUnicode 맵이 제공될 수 있습니다.
캐릭터의. 그러나 Type 0/1에는 더 나은 "ToUnicode" 정보가 있는 경우가 많습니다.
글꼴이 있으며 때로는 제공된 ToUnicode 맵이 잘못되었습니다. 이 값이 다음으로 설정되면
1, PDF로 제공되는 경우 ToUnicode 맵은 항상 적용되며 문자는 그렇지 않을 수 있습니다.
충돌이 있는 경우 HTML에서 올바르게 렌더링됩니다.
-1로 설정하면 HTML에서 렌더링이 정확하도록 사용자 정의된 지도가 사용됩니다.
(시각적으로 동일) 그러나 선택 및 복사 및 복사로는 올바른 문자를 얻지 못할 수 있습니다.
풀.
0으로 설정하면 pdf2htmlEX는 위의 두 가지 방법의 균형을 맞추기 위해 최선을 다합니다.
--최적화-텍스트 <0|1> (기본: 0)
1로 설정하면 pdf2htmlEX는 HTML 요소의 수를 줄이려고 시도합니다.
텍스트. 문제가 있으면 끄십시오.
--올바른 텍스트 가시성 <0|1> (기본: 0)
1로 설정하면 pdf2htmlEX는 다른 그래픽에 포함된 텍스트를 감지하려고 시도하며
적절하게 배열합니다. 즉, 가려진 텍스트는 텍스트 레이어에서 투명하게 만들어집니다.
배경 레이어에 그려집니다.
배경 영상
--bg 형식 (기본: png)
배경 이미지 형식을 지정합니다. `pdf2htmlEX -v`를 실행하여 지원되는 모든 항목을 확인하세요.
형식.
--svg-노드-개수-제한 (기본: - 1)
SVG 배경 이미지의 노드 수가 이 제한을 초과하는 경우 이 페이지를 다음으로 대체합니다.
비트맵 배경; 음수 값은 제한이 없음을 의미합니다. 이 옵션은 다음 경우에만 유용합니다.
'--bg-format svg'가 지정되었습니다. svg의 노드 수는 방금 계산되었습니다.
대략.
--svg-포함-비트맵 <0|1> (기본: 1)
SVG 배경 이미지에 비트맵을 포함할지 여부입니다. 1: svg 배경에 비트맵을 삽입합니다.
0: 가능하면 비트맵을 외부 파일로 덤프합니다.
이 옵션은 '--bg-format svg'가 지정되고 '--embed-image'가 지정된 경우에만 유용합니다.
꺼져있다.
현재 PDF의 RGB 또는 회색 JPEG 비트맵은 덤프될 수 있지만 다른 PDF의 비트맵은 덤프될 수 있습니다.
형식이나 색상 공간은 여전히 포함되어 있습니다. 비트맵이 예상대로 덤프되지 않으면
고스트스크립트나 곡예사로 PDF를 사전 처리하고 비트맵이 있는지 확인하세요.
RGB/회색 JPEG 형식으로 변환됩니다. 자세한 내용은 프로젝트 위키를 참조하세요.
PDF 보호
-영형, --소유자 암호
소유자 비밀번호 지정
-유, --사용자 암호
사용자 비밀번호 지정
--no-drm <0|1> (기본: 0)
문서 DRM 설정 재정의
권한이 있는 경우에만 이 기능을 켜세요.
기타.
--clean-tmp <0|1> (기본: 1)
스위치를 끄면 중간 파일이 결국 정리되지 않습니다.
--데이터 디렉토리 (기본: /usr/share/pdf2htmlEX)
매니페스트 및 기타 파일을 보관하는 폴더를 지정합니다(매니페스트에 대해서는 아래 참조).
파일)`
--tmp-디렉토리 (기본: / TMP or $TMPDIR if 세트)
임시 파일에 사용할 임시 폴더 지정
--css-그리기 <0|1> (기본: 0)
실험적이며 지원되지 않는 CSS 드로잉
-디버그 <0|1> (기본: 0)
디버그 정보를 인쇄합니다.
--증거 <0|1|2> (기본: 0)
증명 버전을 출력합니다. 양수 값을 지정하면 양쪽에 텍스트가 그려집니다.
비교를 위한 텍스트 레이어와 배경 이미지. 2를 지정하면 텍스트가
배경은 다양한 색상으로 되어 있습니다. png/jpg 배경 형식을 사용하는 경우 더 높은
가독성을 위해 hdpi/vdpi(예: 288)를 권장합니다.
메타
-V, --번역
저작권 및 버전 정보 인쇄
--도움 사용 정보 인쇄
명백한 그리고 데이터-디렉터리
분할 페이지가 0이면 매니페스트 파일은 최종 HTML 페이지가 어떻게 되어야 하는지 설명합니다.
생성.
기본적으로 pdf2htmlEX는 기본 data-dir의 매니페스트를 사용합니다(`pdf2htmlEX -v` 실행).
확인), 구문에 대한 간단한 데모를 제공합니다.
기본 항목을 수정하거나 새 항목을 만들고 올바른 항목을 지정할 수 있습니다.
명령줄의 data-dir.
매니페스트에서 참조하는 모든 파일은 data-dir에 있어야 합니다.
예
pdf2htmlEX /경로/to/file.pdf
file.pdf를 file.html로 변환
pdf2htmlEX --clean-tmp 0 -디버그 1 /경로/to/file.pdf
file.pdf를 변환하고 모든 중간 파일을 그대로 둡니다.
pdf2htmlEX --대상 디렉토리 아웃 --포함시키다 fi /경로/to/file.pdf
file.pdf를 out/file.html로 변환하고 글꼴/이미지 파일을 분리하여 둡니다.
저작권
저작권 2012,2013 루 왕[이메일 보호]>
pdf2htmlEX는 추가 조건과 함께 GPLv3에 따라 라이센스가 부여됩니다. 자세한 내용은 라이센스를 읽어보세요.
onworks.net 서비스를 사용하여 온라인으로 pdf2htmlEX를 사용하세요.