Amazon Best VPN GoSearch

OnWorks-Favicon

bmf – Online in der Cloud

Führen Sie bmf im kostenlosen Hosting-Anbieter OnWorks über Ubuntu Online, Fedora Online, den Windows-Online-Emulator oder den MAC OS-Online-Emulator aus

Dies ist der Befehl bmf, der beim kostenlosen Hosting-Anbieter OnWorks mit einer unserer zahlreichen kostenlosen Online-Workstations wie Ubuntu Online, Fedora Online, dem Windows-Online-Emulator oder dem MAC OS-Online-Emulator ausgeführt werden kann

PROGRAMM:

NAME/FUNKTION


bmf – effizienter Bayesianischer Mailfilter

ZUSAMMENFASSUNG


bmf [-t] [-n] [-s] [-N] [-S] [-f fmt] [-d db] [-i Datei] [-kn] [-m Typ] [-p]
[-v] [-V] [-h]

BESCHREIBUNG


bmf ist ein Bayesianischer Mailfilter. Im normalen Betriebsmodus nimmt es eine E-Mail-Nachricht entgegen
oder anderer Text in der Standardeingabe, führt eine statistische Prüfung anhand von Listen mit „guten“ und „guten“ Texten durch
„Spam“-Wörter, registriert die neuen Daten und gibt einen Statuscode zurück, der angibt, ob oder nicht
Die Nachricht ist Spam. BMF wird mit schnellen Zero-Copy-Algorithmen geschrieben und direkt in C codiert.
und auf Geschwindigkeit abgestimmt. Ziel ist es, schneller, kleiner und vielseitiger als vergleichbare Geräte zu sein
um weitere Anwendungsbeispiele zu finden.

bmf unterstützt sowohl die E-Mail-Speicherformate mbox als auch maildir. Es wird automatisch verarbeitet
Mehrere Nachrichten innerhalb einer Mbox-Datei separat.

OPTIONAL


Ohne Befehlszeilenoptionen verarbeitet bmf die Eingabe und registriert sie entweder als „gut“ oder
„Spam“ und gibt den entsprechenden Fehlercode zurück. Das Wortlistenverzeichnis und nicht vorhanden
Bei Abwesenheit werden Worddateien erstellt.

-t Testen Sie, ob es sich bei der Eingabe um Spam handelt. Die Wortlisten werden nicht aktualisiert. Ein Bericht wird verfasst
to stdout zeigt das Endergebnis an und die Token mit der höchsten Abweichung bilden einen Mittelwert von
0.5

-n Registrieren Sie die Eingabe als Nicht-Spam.

-s Registrieren Sie die Eingabe als Spam.

-N Registrieren Sie die Eingabe als Nicht-Spam und machen Sie eine vorherige Registrierung als Spam rückgängig.

-S Registrieren Sie die Eingabe als Spam und machen Sie eine vorherige Registrierung als Nicht-Spam rückgängig.

-f fmt Geben Sie das Datenbankformat an. Gültige Formate sind Text, DB und MySQL. Text ist immer
gültig. Die anderen sind möglicherweise nicht verfügbar, wenn die entsprechende Option nicht aktiviert wurde
Kompilierzeit. Der Standardwert ist db, sofern verfügbar, andernfalls text.

-d db Geben Sie eine Datenbank oder ein Verzeichnis zum Laden und Speichern von Wortlisten an. Die Standardeinstellung ist
~/.bmf im Textmodus.

-i Datei Verwenden Sie für die Eingabe eine Datei anstelle von stdin.

-k n Geben Sie die Anzahl der Extrema (Keeper) an, die in der Bayes-Berechnung verwendet werden sollen. Der Standard
ist 15.

-m fmt Geben Sie das E-Mail-Speicherformat an. Gültige Formate sind mbox und maildir. Die Standardeinstellung ist „to“.
erkennt automatisch das E-Mail-Speicherformat. Diese Option ist veraltet.

-p Kopieren Sie die Eingabe in die Ausgabe (Passthrough) und fügen Sie Spam-Header im Stil von ein
SpamAssassin. Es wird immer ein X-Spam-Status-Header mit Verarbeitungsdetails eingefügt. Der
Der Inhalt dieser Kopfzeile beginnt immer entweder mit „Ja“ oder „Nein“. Wenn die Eingabe beurteilt wird
Wenn es sich um Spam handelt, wird zusätzlich der Header „X-Spam-Flag: YES“ eingefügt.

-v Seien Sie ausführlicher. Diese Option wird noch nicht gut unterstützt.

-V Versionsinformationen anzeigen.

-h Nutzungsinformationen anzeigen.

THEORIE OF OPERATION


bmf behandelt seine Eingabe als einen Beutel voller Token. Jeder Token wird auf „gut“ und „schlecht“ geprüft.
Wortlisten, die zählen, wie oft es im Nicht-Spam-Bereich vorkommt
Spam-Mails. Diese Zahlen werden verwendet, um die Wahrscheinlichkeit zu berechnen, dass eine E-Mail, in der die
Das Auftreten des Tokens ist Spam. Nachdem die Wahrscheinlichkeiten für alle Eingabetoken berechnet wurden, wird ein fester Wert ermittelt
Die Anzahl der Wahrscheinlichkeiten, die am weitesten vom Durchschnitt abweichen, wird mithilfe der Bayes-Methode kombiniert
Satz über bedingte Wahrscheinlichkeiten.

Während diese Methode im Vergleich zum üblicheren Pattern-Matching-Ansatz grob klingt, ist sie
erweist sich als äußerst effektiv. Paul Grahams Artikel „A Plan For Spam“:
http://www.paulgraham.com/spam.html ist eine empfehlenswerte Lektüre.

bmf verbessert Pauls Vorschlag durch eine intelligentere lexikalische Analyse. Insbesondere,
Hostnamen und IP-Adressen werden nicht verworfen, bestimmte Arten von MTA-Informationen jedoch schon
verworfen (z. B. Nachrichten-IDs und Daten).

MIME und andere Anhänge werden nicht dekodiert. Erfahrung aus dem Ansehen der Token-Streams
deutet darauf hin, dass Spam mit Beilagen sich ausnahmslos durch Hinweise in der verrät
Header und Nichtgehäuseteile. Dennoch möchte ich die Möglichkeit zum Dekodieren hinzufügen
quoted-printable und möglicherweise Base64-Kodierungen für Textanhänge.

Integration MIT anderes TOOLS


Beispiele und Vorschläge finden Sie unter /usr/share/doc/bmf/README.gz.

RÜCKKEHR WERTE


Im Passthrough-Modus: Null für Erfolg, ungleich Null für Fehler.

Im Nicht-Passthrough-Modus: 0 für Spam; 1 für Nicht-Spam; 2 für E/A- oder andere Fehler.

Nutzen Sie BMF online über die Dienste von onworks.net


Kostenlose Server & Workstations

Laden Sie Windows- und Linux-Apps herunter

Linux-Befehle

Ad




×
Werbung
❤ ️Hier einkaufen, buchen oder kaufen – kostenlos, damit die Dienste kostenlos bleiben.