영어프랑스어스페인어

Ad


온웍스 파비콘

bmf - 클라우드에서의 온라인

Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터를 통해 OnWorks 무료 호스팅 제공업체에서 bmf를 실행하세요.

이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 bmf 명령입니다.

프로그램:

이름


bmf - 효율적인 베이지안 메일 필터

개요


bmf [-t] [-n] [-s] [-N] [-S] [-f fmt] [-d db] [-i 파일] [-kn] [-m 유형] [-p]
[-v] [-V] [-h]

기술


bmf는 베이지안 메일 필터입니다. 정상적인 작동 모드에서는 이메일 메시지가 필요합니다.
또는 표준 입력의 다른 텍스트는 "양호" 목록에 대해 통계적 검사를 수행하고
"스팸" 단어, 새 데이터를 등록하고 여부를 나타내는 상태 코드를 반환합니다.
메시지가 스팸입니다. BMF는 C로 직접 코딩된 빠른 제로 복사 알고리즘으로 작성되었습니다.
속도에 맞게 조정되었습니다. 유사한 것보다 더 빠르고, 더 작고, 더 다재다능한 것을 목표로 합니다.
분야의 다양한 어플리케이션에서 사용됩니다.

bmf는 mbox 및 maildir 메일 저장 형식을 모두 지원합니다. 자동으로 처리됩니다
mbox 파일 내의 여러 메시지를 개별적으로 처리합니다.

옵션


명령줄 옵션이 없으면 bmf는 입력을 처리하고 "양호" 또는 "양호"로 등록합니다.
"스팸"이며 적절한 오류 코드를 반환합니다. 단어 목록 디렉토리가 존재하지 않습니다.
없으면 워드파일이 생성됩니다.

-t 입력 내용이 스팸인지 테스트해 보세요. 단어 목록은 업데이트되지 않습니다. 보고서가 작성됩니다
최종 점수를 표준 출력으로 표시하고 편차가 가장 높은 토큰은
0.5.

-n 입력 내용을 스팸이 아닌 것으로 등록하세요.

-s 입력 내용을 스팸으로 등록합니다.

-N 입력한 내용을 스팸이 아닌 것으로 등록하고 이전 스팸 등록을 취소합니다.

-S 입력한 내용을 스팸으로 등록하고 이전에 스팸이 아닌 것으로 등록을 취소합니다.

-f fmt 데이터베이스 형식을 지정합니다. 유효한 형식은 text, db 및 mysql입니다. 텍스트는 항상
유효한. 해당 옵션이 활성화되지 않은 경우 다른 옵션은 사용하지 못할 수 있습니다.
컴파일 시간. 기본값은 사용 가능한 경우 db이고, 그렇지 않으면 텍스트입니다.

-d db 단어 목록을 로드하고 저장하기 위한 데이터베이스 또는 디렉터리를 지정합니다. 기본값은
~/.bmf 텍스트 모드에서.

-i 파일 입력에 stdin 대신 파일을 사용하십시오.

-k n 베이즈 계산에 사용할 극값(키퍼) 수를 지정합니다. 기본값
15입니다.

-m fmt 메일 저장 형식을 지정합니다. 유효한 형식은 mbox 및 maildir입니다. 기본값은
메일 저장 형식을 자동으로 감지합니다. 이 옵션은 더 이상 사용되지 않습니다.

-p 입력을 출력(통과)에 복사하고 다음 스타일로 스팸 헤더를 삽입합니다.
스팸어새신. X-Spam-Status 헤더는 항상 처리 세부 정보와 함께 삽입됩니다. 그만큼
이 헤더의 내용은 항상 "Yes" 또는 "No"로 시작됩니다. 입력이 다음과 같이 판단되는 경우
스팸이면 "X-Spam-Flag: YES"라는 헤더도 삽입됩니다.

-v 좀 더 자세히 설명하세요. 이 옵션은 아직 제대로 지원되지 않습니다.

-V 버전 정보를 표시합니다.

-h 사용 정보를 표시합니다.

이론 OF 운영


bmf는 입력을 토큰 백으로 처리합니다. 각 토큰은 "양호" 및 "불량"에 대해 확인됩니다.
스팸이 아닌 항목에서 발생한 횟수를 유지하는 단어 목록
스팸 메일. 이 숫자는 다음과 같은 메일이 발송될 확률을 계산하는 데 사용됩니다.
토큰이 발생하면 스팸입니다. 모든 입력 토큰에 대한 확률이 계산된 후 고정
평균에서 가장 멀리 벗어나는 확률의 수는 Bayes's를 사용하여 결합됩니다.
조건부 확률에 관한 정리.

이 방법은 보다 일반적인 패턴 일치 접근 방식에 비해 투박하게 들리지만
매우 효과적인 것으로 밝혀졌습니다. Paul Graham의 논문 A Plan For Spam:
http://www.paulgraham.com/spam.html 읽기를 권장합니다.

bmf는 보다 스마트한 어휘 분석을 수행하여 Paul의 제안을 개선합니다. 특히,
호스트 이름과 IP 주소는 삭제되지 않으며 특정 유형의 MTA 정보는 삭제되지 않습니다.
삭제됩니다(예: 메시지 ID 및 날짜).

MIME 및 기타 첨부 파일은 디코딩되지 않습니다. 토큰 스트림 시청 경험
인클로저가 포함된 스팸은 항상 다음의 신호를 통해 자신을 전달한다는 것을 암시합니다.
헤더 및 비인클로저 부분. 그럼에도 불구하고 디코딩 기능을 추가하고 싶습니다.
인용 인쇄 가능 및 텍스트 첨부 파일에 대한 base64 인코딩.

통합 세이프가드가 기타 도구


샘플과 제안 사항은 /usr/share/doc/bmf/README.gz를 참조하세요.

RETURN Values


통과 모드에서: 성공의 경우 XNUMX, 실패의 경우 XNUMX이 아닙니다.

비통과 모드: 스팸의 경우 0; 스팸이 아닌 경우 1개, I/O 또는 기타 오류의 경우 2개입니다.

onworks.net 서비스를 사용하여 온라인으로 bmf를 사용하세요.


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad