이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 공급자에서 실행할 수 있는 명령 파일입니다.
프로그램:
이름
ifile - ifile 메일 필터링 시스템의 핵심 실행 파일
개요
아이파일 [-b 파일] [-q|-Q] [-g] [-k] [-o] [-v NUM] [렉싱 옵션] 파일 ...
아이파일 -c -q|-Q [-T 임계값] [-b 파일] [-g] [-k] [-o] [렉싱 옵션] 파일 ...
아이파일 [-b 파일] [-d 폴더] [-i 폴더|-u 폴더] [-g] [-k] [-o] [-v NUM] [렉싱 옵션]
파일 ...
아이파일 -r [-b 파일]
기술
아이파일 기계 학습을 사용하여 전자 메일을 분류하는 메일 필터 클라이언트입니다.
폴더/우편함. 사용하는 알고리즘을 Naive Bayes라고 합니다. 기본적으로 순진한
Bayes는 각 문서를 정렬되지 않은 단어 모음으로 간주하고 일치하여 분류합니다.
가장 근접하게 일치하는 폴더/사서함 배포가 있는 문서 배포입니다.
옵션
-b, --db 파일=파일
파일 데이터베이스를 읽고/저장할 위치입니다. 기본값은 ~/.idata
-c, --간결한
"ifile -v 0 | 머리 -1 | 자르다 -f1 -d"와 함께 사용해야 합니다. -q or -Q.
-d, --삭제=폴더
각각에 대한 통계를 삭제합니다. 파일 카테고리에서 폴더
-f, --폴더 계산=폴더
다음에 대한 단어 확률 계산 표시 폴더
-g, --로그 파일
디버깅 정보 생성 및 저장 ~/.ifile.log
-i, --끼워 넣다=폴더
범주에 각 파일에 대한 통계 추가 폴더
-k, --간헐적으로 유지
드물게 발생하는 단어를 데이터베이스에 남겨둡니다(일반적으로 던짐).
-l, --쿼리-loocv=폴더
각 파일에 대해 임시로 파일을 제거합니다. 폴더, 쿼리를 수행하고
그런 다음 파일을 다시 삽입하십시오. 폴더. 데이터베이스가 수정되지 않았습니다.
-o, --발생하다
문서 비트 벡터 표현을 사용합니다. 문서당 각 단어를 한 번 계산합니다.
-q, --질문
각 파일에 대한 출력 등급 점수
-Q, --쿼리-삽입
각 파일에 대해 등급 점수를 출력하고 다음을 사용하여 폴더에 대한 통계를 추가합니다.
최고 점수
-T, --한계점=임계값
둘 다 사용할 때 -c 과 -q, 다음과 같은 경우 두 개의 가장 높은 순위 범주를 출력합니다.
최대 점수 차이 임계값 / 1000, 경계를 감지하는 데 사용할 수 있습니다.
사례. 와 함께 사용할 때 -q 만 그리고 아무 임계값 > 0, 점수 차이 출력
백분율. 예를 들어,
아이파일 -T1 -q foo.txt
결과를 초래할 수 있습니다
스팸 -15570.48640776
비스팸 -18728.00272369
diff[스팸,비스팸](%) 9.21
그렇다면
아이파일 -T93 -q -c foo.txt
결과적으로
foo.txt 스팸, 스팸 아님
이므로
아이파일 -T92 -q -c foo.txt
결과적으로
foo.txt 스팸
-r, --리셋-데이터
현재 저장된 모든 정보 삭제
-u, --최신 정보=폴더
다음 경우에만 통계를 추가한다는 점을 제외하고는 '삽입'과 동일합니다. 폴더 이미 존재 함
-v, --다변=NUM
실행 중 출력량: 0=무음, 1=조용함, 2=진행 중, 3=상세, 4=디버그
렉싱 옵션:
-a, --알파 렉서
Lex 단어를 알파벳 문자 시퀀스로(기본값)
-A, --알파 전용 렉서
전체로 구성된 lex 공백으로 구분된 문자 시퀀스만
알파벳 문자
-h, --스트립 헤더
Subject:, From: 및 To:를 제외한 모든 헤더 행을 건너뜁니다.
-m, --최대 길이=이륜 전차
첫 번째 이후의 메시지 부분 무시 이륜 전차 문자. 다음 경우 전체 메시지 사용 이륜 전차
0으로 설정합니다. 기본값은 50,000입니다.
-p, --인쇄 토큰
토큰화 및 인쇄만 하고 다른 처리는 하지 마십시오. 문서는 다음과 같이 반환됩니다.
단어 목록, 빈도 쌍.
-s, --중지 목록 없음
렉싱할 때 지나치게 빈번한(정지 목록) 단어를 버리지 마십시오.
-S, --형태소 분석
문서를 렉싱할 때 '포터' 형태소 분석 알고리즘 사용
-w, --화이트 렉서
공백으로 구분된 일련의 문자로 Lex 단어
명령줄에 파일이 지정되지 않은 경우 iffile은 표준 입력을 해당 파일로 사용합니다.
처리할 메시지.
-?, --도움
이 도움말 목록 제공
--용법
간단한 사용 메시지를 보내주세요
-V, --번역
프로그램 버전 인쇄
long 옵션에 대한 필수 또는 선택적 인수도 필수 또는 선택 사항입니다.
해당하는 짧은 옵션.
onworks.net 서비스를 사용하여 온라인으로 ifile 사용