EnglezăFrancezăSpaniolă

Ad


Favicon OnWorks

bmf - Online în cloud

Rulați bmf în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda bmf care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


bmf - filtru bayesian de corespondență eficient

REZUMAT


bmf [-t] [-n] [-s] [-N] [-S] [-f fmt] [-d db] [-i fișier] [-kn] [-m tip] [-p]
[-v] [-V] [-h]

DESCRIERE


bmf este un filtru bayesian de e-mail. În modul normal de funcționare, este nevoie de un mesaj de e-mail
sau alt text de intrare standard, face o verificare statistică împotriva listelor de „bun” și
cuvintele „spam”, înregistrează noile date și returnează un cod de stare care indică dacă sau nu
mesajul este spam. BMF este scris cu algoritmi rapidi, zero-copy, codificati direct in C,
și reglat pentru viteză. Acesta își propune să fie mai rapid, mai mic și mai versatil decât similar
aplicatii.

bmf acceptă atât formatele de stocare a e-mailurilor mbox, cât și maildir. Se va procesa automat
mai multe mesaje într-un fișier mbox separat.

OPŢIUNI


Fără opțiuni de linie de comandă, bmf procesează intrarea, o înregistrează fie ca „bună”, fie
„spam” și returnează codul de eroare corespunzător. Directorul listei de cuvinte și inexistent
fișierele word sunt create dacă lipsesc.

-t Testați pentru a vedea dacă intrarea este spam. Listele de cuvinte nu sunt actualizate. Se scrie un raport
to stdout care arată scorul final și jetoanele cu cea mai mare abatere formează o medie de
0.5.

-n Înregistrați intrarea ca non-spam.

-s Înregistrați intrarea ca spam.

-N Înregistrați intrarea ca non-spam și anulați o înregistrare anterioară ca spam.

-S Înregistrați intrarea ca spam și anulați o înregistrare anterioară ca non-spam.

-f fmt Specificați formatul bazei de date. Formatele valide sunt text, db și mysql. Textul este întotdeauna
valabil. Este posibil ca celelalte să nu fie disponibile dacă opțiunea corespunzătoare nu a fost activată la
timpul de compilare. Valoarea implicită este db dacă este disponibil, altfel text.

-d db Specificați baza de date sau directorul pentru încărcarea și salvarea listelor de cuvinte. Valoarea implicită este
~/.bmf în modul text.

-i fişier Utilizați fișierul pentru intrare în loc de stdin.

-k n Specificați numărul de extreme (deținători) de utilizat în calculul Bayes. Implicit
este 15.

-m fmt Specificați formatul de stocare a e-mailului. Formatele valide sunt mbox și maildir. Valoarea implicită este să
detectează automat formatul de stocare a e-mailului. Această opțiune este depreciată.

-p Copiați intrarea în ieșire (passthrough) și inserați anteturi de spam în stilul
Spam Assassin. Un antet X-Spam-Status este întotdeauna inserat cu detalii de procesare. The
conținutul acestui antet începe întotdeauna cu „Da” sau „Nu”. Dacă intrarea este judecată ca
fie spam, este inserat și antetul „X-Spam-Flag: YES”.

-v Fii mai pronunțat. Această opțiune nu este încă bine acceptată.

-V Afișează informații despre versiune.

-h Afișează informații de utilizare.

TEORIE OF OPERAȚIUNEA


bmf tratează intrarea sa ca pe un sac de jetoane. Fiecare jeton este verificat împotriva „bun” și „rău”
liste de cuvinte, care țin cont de numărul de ori a apărut în non-spam și
mail-uri spam. Aceste numere sunt folosite pentru a calcula probabilitatea ca un e-mail în care
simbolul care apare este spam. După ce au fost calculate probabilitățile pentru toate jetoanele de intrare, o soluție fixă
numărul de probabilități care se abate cel mai mult de la medie sunt combinate folosind Bayes
teorema probabilităților condiționate.

Deși această metodă sună grosolană în comparație cu abordarea mai obișnuită de potrivire a modelelor, ea
se dovedește a fi extrem de eficient. Lucrarea lui Paul Graham Un plan pentru spam:
http://www.paulgraham.com/spam.html se recomanda lectura.

bmf îmbunătățește propunerea lui Paul făcând o analiză lexicală mai inteligentă. În special,
numele de gazdă și adresele IP nu sunt eliminate, iar anumite tipuri de informații MTA sunt
eliminate (cum ar fi ID-urile mesajelor și datele).

MIME și alte atașamente nu sunt decodificate. Experiență de vizionare a fluxurilor de simboluri
sugerează că spam-ul cu incinte se dă în mod invariabil prin indicii în
antete și părți non-incinte. Cu toate acestea, aș dori să adaug capacitatea de decodare
codificări care pot fi imprimate citate și, probabil, în bază64 pentru atașamentele textuale.

INTEGRARE CU ALTE UNELTE


Consultați /usr/share/doc/bmf/README.gz pentru mostre și sugestii.

A REVENI VALORI


În modul de trecere: zero pentru succes, diferit de zero pentru eșec.

În modul non-passthrough: 0 pentru spam; 1 pentru non-spam; 2 pentru I/O sau alte erori.

Utilizați bmf online folosind serviciile onworks.net


Servere și stații de lucru gratuite

Descărcați aplicații Windows și Linux

Comenzi Linux

Ad