최신 릴리스를 ApacheTika2.6.0Release.zip으로 다운로드할 수 있는 tika-python이라는 Linux 앱입니다. 워크스테이션용 무료 호스팅 제공업체인 OnWorks에서 온라인으로 실행할 수 있습니다.
OnWorks와 함께 tika-python이라는 이 앱을 무료로 다운로드하여 온라인에서 실행하십시오.
이 앱을 실행하려면 다음 지침을 따르세요.
- 1. 이 애플리케이션을 PC에 다운로드했습니다.
- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.
- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.
- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.
- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.
- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.
스크린 샷
Ad
티카-파이썬
기술
Tika REST 서버를 사용하여 Tika를 사용할 수 있도록 하는 Apache Tika 라이브러리의 Python 포트입니다. 이를 통해 Apache Tika를 Python 라이브러리로 사용할 수 있으며 Setuptools, Pip을 통해 설치할 수 있고 설치가 쉽습니다. 이 라이브러리를 사용하려면 tika-python이 백그라운드에서 Tika REST 서버를 시작하므로 시스템에 Java 7+가 설치되어 있어야 합니다. 연결되지 않은 환경에서 이 작업을 수행하려면 tika 서버 파일(여기에서 찾을 수 있는 tika-server.jar 및 tika-server.jar.md5 모두)을 다운로드하고 TIKA_SERVER_JAR 환경 변수를 TIKA_SERVER_JAR="file://로 설정하십시오. //tika-server.jar"는 python-tika에게 이 파일을 "다운로드"하여 /tmp/tika-server.jar로 이동하고 백그라운드 프로세스로 실행하도록 성공적으로 지시합니다. 이것은 인터넷 액세스 없이 python-tika를 실행하는 유일한 방법입니다. 이 설정이 없으면 기본값은 tika 버전을 확인하고 Apache에서 매번 최신 버전을 가져오는 것입니다.
기능
- 파서 인터페이스(REST 이전의 하위 호환성)
- 파서 인터페이스는 /rmeta 인터페이스를 사용하여 텍스트와 메타데이터를 추출합니다.
- 선택적으로 다중 인스턴스 실행에 유용한 호출과 함께 Tika 서버 URL을 전달할 수 있습니다.
- 출력 형식을 XHTML로 지정
- 언팩 인터페이스는 단일 호출에서 메타데이터와 텍스트 추출을 모두 처리합니다.
- 내부적으로 압축을 푼 메타데이터 및 텍스트 항목의 tarball을 내부적으로 반환합니다.
프로그래밍 언어
Python
카테고리
이것은 https://sourceforge.net/projects/tika-python.mirror/에서도 가져올 수 있는 애플리케이션입니다. 무료 운영 체제 중 하나에서 가장 쉬운 방법으로 온라인으로 실행하기 위해 OnWorks에서 호스팅되었습니다.