이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 langidentp 명령입니다.
프로그램:
이름
langident - 작성된 언어 파일을 식별합니다.
개요
langident [옵션] 파일1 [파일2 ...]
기술
Perl 모듈 Lingua::Identify를 사용하여 작성된 언어 파일을 식별합니다.
옵션
-a
모든 결과를 표시합니다(가장 가능성이 높은 언어뿐만 아니라).
-c
가장 가능성이 높은 언어에 대한 신뢰 수준을 표시합니다(다음 바로 첫 번째 값이 됩니다).
가장 가능성이 높은 언어).
-d
디버그(개발 전용).
-E 부호화
입력 인코딩을 선택하세요. 기본값은 UTF-8입니다.
# ISO-8859-1(latin1)을 사용합니다.
langident -E ISO-8859-1 파일
-e 방법
사용할 방법을 선택합니다. 이를 수행하는 방법에는 세 가지가 있습니다.
# 단순히 메소드를 사용하는 것
langident -e ngrams3 파일
# 여러 가지 방법 사용(쉼표로 구분)
langident -e 접두사3,접미사3
# 여러 가지 방법을 사용하고 각각에 다른 가중치를 할당합니다.
langident -e 작은 단어=2,접두사=1,ngrams3=1.3
사용 가능한 방법은 다음과 같습니다. 작은 단어, 접두사1, 접두사2, 접두사3,
접두사4, 접미사1, 접미사2, 접미사3, 접미사4, ngrams1, ngrams2, ngrams3 과
ngrams4.
-h
도움말 메시지를 표시하고 종료합니다.
-l
사용 가능한 모든 언어를 나열하고 종료합니다.
-m NUMBER
표시할 최대 결과(언어) 수를 설정합니다(가장 가능성이 높은 N개의 언어 표시,
확률의 내림차순).
-a 스위치를 재정의합니다.
-o 언어
지정된 언어로만 작업하세요.
# 포르투갈어와 영어만 식별합니다.
langident -o pt,en *
-p
백분율도 표시합니다.
-s SIZE
검사할 최대 크기입니다.
-v
버전을 표시하고 종료합니다.
사용 예
ngrams2 및 ngrams1 메소드를 사용하여 ngrams2에 두 배의 중요도를 할당합니다(-e
스위치); 출력에는 가장 가능성이 높은 세 가지 언어(-m 스위치)가 포함됩니다.
첫 번째 결과의 백분율(-p 스위치) 및 신뢰도(-c 스위치)입니다.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 읽어보기
추가 정보:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
~까지 DO
· HTML 태그(다른 형식도 가능)를 무시하는 스위치를 추가하세요.
onworks.net 서비스를 사용하여 온라인으로 langidentp 사용