EngelsFransSpaans

Ad


OnWorks-favicon

bmf - Online in de cloud

Voer bmf uit in OnWorks gratis hostingprovider via Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

Dit is de opdracht bmf die kan worden uitgevoerd in de gratis hostingprovider van OnWorks met behulp van een van onze meerdere gratis online werkstations zoals Ubuntu Online, Fedora Online, Windows online emulator of MAC OS online emulator

PROGRAMMA:

NAAM


bmf - efficiënte Bayesiaanse mailfilter

KORTE INHOUD


bmf [-t] [-n] [-s] [-N] [-S] [-f fmt] [-d db] [-i bestand] [-kn] [-m type] [-p]
[-v] [-V] [-h]

PRODUCTBESCHRIJVING


bmf is een Bayesiaanse mailfilter. In de normale werkingsmodus duurt het een e-mailbericht
of andere tekst op standaardinvoer, doet een statistische controle aan de hand van lijsten met "goede" en
"spam"-woorden, registreert de nieuwe gegevens en retourneert een statuscode die aangeeft of:
het bericht is spam. BMF is geschreven met snelle, kopieervrije algoritmen, direct gecodeerd in C,
en afgestemd op snelheid. Het is bedoeld om sneller, kleiner en veelzijdiger te zijn dan vergelijkbare
toepassingen.

bmf ondersteunt zowel mbox- als maildir-mailopslagformaten. Het wordt automatisch verwerkt
meerdere berichten binnen een mbox-bestand afzonderlijk.

OPTIES


Zonder opdrachtregelopties verwerkt bmf de invoer, registreert deze als "goed" of
"spam", en retourneert de juiste foutcode. De woordenlijst directory en niet-bestaand
wordfiles worden aangemaakt indien afwezig.

-t Test of de invoer spam is. De woordenlijsten worden niet bijgewerkt. Er wordt een verslag geschreven
naar stdout met de eindscore en de tokens met de hoogste afwijking vormen een gemiddelde van
0.5.

-n Registreer de invoer als niet-spam.

-s Registreer de invoer als spam.

-N Registreer de invoer als niet-spam en maak een eerdere registratie als spam ongedaan.

-S Registreer de invoer als spam en maak een eerdere registratie als niet-spam ongedaan.

-f fmt Geef het databaseformaat op. Geldige formaten zijn tekst, db en mysql. Tekst is altijd
Geldig. De andere zijn mogelijk niet beschikbaar als de corresponderende optie niet was ingeschakeld op
compileer tijd. De standaardwaarde is db indien beschikbaar, anders tekst.

-d db Specificeer database of directory voor het laden en opslaan van woordenlijsten. De standaard is
~/.bmf in tekstmodus.

-i filet Gebruik bestand voor invoer in plaats van stdin.

-k n Geef het aantal extrema (keepers) op dat moet worden gebruikt in de Bayes-berekening. De standaard
is 15.

-m fmt Geef de indeling voor e-mailopslag op. Geldige formaten zijn mbox en maildir. De standaard is om
automatisch het e-mailopslagformaat detecteren. Deze optie is verouderd.

-p Kopieer de invoer naar de uitvoer (passthrough) en voeg spamheaders in de stijl van
SpamAssassin. Er wordt altijd een X-Spam-Status-header ingevoegd met verwerkingsdetails. De
inhoud van deze header begint altijd met "Ja" of "Nee". Als de invoer wordt beoordeeld als:
spam zijn, wordt de kop "X-Spam-Flag: YES" ook ingevoegd.

-v Wees uitgebreider. Deze optie wordt nog niet goed ondersteund.

-V Versie-informatie weergeven.

-h Gebruiksinformatie weergeven.

THEORIE OF OPERATIE


bmf behandelt zijn invoer als een zak tokens. Elk token wordt gecontroleerd op "goed" en "slecht"
woordenlijsten, die tellingen bijhouden van het aantal keren dat het is voorgekomen in niet-spam en
spam-mails. Deze getallen worden gebruikt om de kans te berekenen dat een e-mail waarin de
token voorkomt is spam. Nadat de kansen voor alle invoertokens zijn berekend, wordt een vast
aantal kansen dat het verst van het gemiddelde afwijkt, wordt gecombineerd met behulp van Bayes'
stelling over voorwaardelijke kansen.

Hoewel deze methode grof klinkt in vergelijking met de meer gebruikelijke patroonovereenkomst, is het
blijkt zeer effectief te zijn. Paul Graham's paper Een plan voor spam:
http://www.paulgraham.com/spam.html aanbevolen lectuur.

bmf verbetert het voorstel van Paul door slimmere lexicale analyse uit te voeren. Vooral,
hostnamen en IP-adressen worden niet weggegooid, en bepaalde soorten MTA-informatie zijn:
verwijderd (zoals bericht-ID's en datums).

MIME en andere bijlagen worden niet gedecodeerd. Ervaring met het kijken naar de tokenstreams
suggereert dat spam met bijlagen zichzelf steevast verraadt door middel van signalen in de
headers en niet-bijgesloten onderdelen. Desalniettemin zou ik de mogelijkheid willen toevoegen om te decoderen
geciteerd-afdrukbare en misschien base64-coderingen voor tekstuele bijlagen.

INTEGRATIE MET ANDERE TOOLS


Zie /usr/share/doc/bmf/README.gz voor voorbeelden en suggesties.

RETURN WAARDEN


In passthrough-modus: nul voor succes, niet-nul voor mislukking.

In non-passthrough-modus: 0 voor spam; 1 voor niet-spam; 2 voor I/O of andere fouten.

Gebruik bmf online met onworks.net-services


Gratis servers en werkstations

Windows- en Linux-apps downloaden

Linux-commando's

Ad