Ini ialah arahan bogofilter-sqlite yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
bogofilter - penapis spam Bayesian pantas
SINOPSIS
penapis bogo [pilihan bantuan | pilihan klasifikasi | pilihan pendaftaran |
pilihan parameter | pilihan maklumat] [pilihan umum] [pilihan fail konfigurasi]
di mana
membantu pilihan ialah:
[-h] [--help] [-V] [-Q]
klasifikasi pilihan ialah:
[-p] [-e] [-t] [-T] [-u] [-H] [-M] [-b] [-B objek ...] [-R] [pilihan umum]
[pilihan parameter] [pilihan fail konfigurasi]
pendaftaran pilihan ialah:
[-s | -n] [-S | -N] [pilihan umum]
umum pilihan ialah:
[-c nama fail] [-C] [-d dir] [-k saiz cache] [-ll tag] [-Saya nama fail] [-O nama fail]
parameter pilihan ialah:
[-E nilai [, nilai]] [-m nilai[,nilai][,nilai]] [-O nilai [, nilai]]
maklumat pilihan ialah:
[-v] [-y tarikh] [-D] [-x bendera]
config fail pilihan ialah:
[--pilihan=nilai]
Nota: Gunakan penapis bogo - membantu untuk memaparkan senarai lengkap pilihan.
DESCRIPTION
Bogofilter ialah penapis spam Bayesian. Dalam mod operasi biasa, ia memerlukan e-mel
mesej atau teks lain pada input standard, melakukan semakan statistik terhadap senarai "baik"
dan perkataan "buruk", dan mengembalikan kod status yang menunjukkan sama ada mesej itu spam atau tidak.
Bogofilter direka dengan algoritma pantas, menggunakan Berkeley DB untuk permulaan pantas dan
carian, dikodkan terus dalam C, dan ditala untuk kelajuan, supaya ia boleh digunakan untuk pengeluaran oleh
tapak yang memproses banyak mel.
TEORI OF OPERASI
Bogofilter menganggap inputnya sebagai beg token. Setiap token disemak terhadap senarai perkataan,
yang mengekalkan kiraan bilangan kali ia berlaku dalam mel bukan spam dan spam.
Nombor ini digunakan untuk mengira anggaran kebarangkalian mesej itu
token yang berlaku adalah spam. Mereka digabungkan untuk menunjukkan sama ada mesej itu spam atau
hmm.
Walaupun kaedah ini kelihatan kasar berbanding pendekatan padanan corak yang lebih biasa, ia
ternyata sangat berkesan. Kertas kerja Paul Graham A pelan Untuk Spam[1] disyorkan
membaca.
Program ini banyak menambah baik cadangan Paul dengan melakukan analisis leksikal yang lebih bijak.
Bogofilter melakukan penyahkodan MIME yang betul dan penghuraian HTML yang munasabah. Jenis istimewa
token seperti nama hos dan alamat IP dikekalkan sebagai ciri pengecaman dan bukannya
putus cinta. Pelbagai jenis MTA cruft seperti tarikh dan message-ID diabaikan supaya tidak
untuk mengembung senarai perkataan. Token yang ditemui dalam pelbagai medan pengepala ditanda dengan sewajarnya.
Satu lagi penambahbaikan ialah program ini menawarkan pengubahsuaian yang dicadangkan oleh Gary Robinson kepada
pengiraan (lihat parameter robx dan robs di bawah). Pengubahsuaian ini adalah
diterangkan dalam kertas Robinson Spam Pengesanan[2].
Sejak itu, Robinson (lihat artikel Jurnal Linuxnya A Statistik Pendekatan kepada yang Spam
Masalah[3]) dan lain-lain telah menyedari bahawa pengiraan boleh dioptimumkan lagi menggunakan
Kaedah Fisher. Satu lagi penambahbaikan[4] mengimbangi lebihan token dengan memohon
asingkan faktor saiz berkesan (ESF) kepada pengiraan kebarangkalian spam dan bukan spam.
Ringkasnya, ini adalah cara ia berfungsi: Anggaran untuk kebarangkalian spam individu tersebut
token digabungkan menggunakan "fungsi khi kuasa dua songsang". Nilainya menunjukkan betapa teruknya
hipotesis nol bahawa mesej itu hanyalah koleksi rawak perkataan bebas dengan
kebarangkalian yang diberikan oleh anggaran kami sebelum ini gagal. Fungsi ini sangat sensitif kepada
kebarangkalian kecil (perkataan hammis), tetapi tidak kepada kebarangkalian tinggi (perkataan spam); jadi
nilai hanya menunjukkan tanda hammis yang kuat dalam mesej. Sekarang menggunakan songsang
kebarangkalian untuk token, pengiraan yang sama dilakukan sekali lagi, memberikan penunjuk bahawa
mesej kelihatan sangat spam. Akhirnya, kedua-dua penunjuk tersebut ditolak (dan
berskala ke dalam selang 0-1). Penunjuk gabungan ini (bogositi) adalah hampir kepada 0 jika tanda-tanda
untuk mesej hammish lebih kuat daripada mesej spam dan hampir 1 jika
keadaan adalah sebaliknya. Jika tanda untuk kedua-duanya adalah sama kuat, nilainya adalah
dekat 0.5. Memandangkan mesej tersebut tidak memberikan petunjuk yang jelas terdapat mod tristate
bogofilter untuk menandakan mesej tersebut sebagai tidak pasti, manakala mesej yang jelas ditandakan sebagai spam
atau ham, masing-masing. Dalam mod dua keadaan, setiap mesej ditandakan sebagai spam atau ham.
Pelbagai parameter mempengaruhi pengiraan ini, yang paling penting ialah:
robx: markah yang diberikan kepada token yang tidak pernah dilihat sebelum ini. robx ialah kebarangkalian itu
token itu adalah spam.
robx: pemberat pada robx yang menggerakkan kebarangkalian token yang dilihat sedikit ke arah robx.
min-dev: jarak minimum dari .5 untuk token digunakan dalam pengiraan. Hanya token
lebih jauh daripada 0.5 daripada nilai ini digunakan.
pemotongan spam: mesej dengan markah lebih besar daripada atau sama dengan akan ditandakan sebagai spam.
ham-cutoff: Jika sifar atau spam-cutoff, semua mesej dengan nilai betul-betul di bawah spam-cutoff
ditandakan sebagai ham, semua yang lain sebagai spam (dua keadaan). Nilai lain kurang daripada atau sama dengan
ham-cutoff ditandakan sebagai ham, mesej dengan nilai yang ketat antara ham-cutoff dan
pemotongan spam ditandakan sebagai tidak pasti; selebihnya sebagai spam (tristate)
sp-esf: faktor saiz berkesan (ESF) untuk spam.
ns-esf: ESF untuk bukan spam. Nilai ESF ini lalai kepada 1.0, yang sama dengan tidak
menggunakan ESF dalam pengiraan. Nilai yang sesuai dengan populasi e-mel pengguna boleh
ditentukan dengan bantuan program bogotune.
PILIHAN
PILIHAN BANTUAN
. -h pilihan mencetak mesej bantuan dan keluar.
. -V pilihan mencetak nombor versi dan keluar.
. -Q (pertanyaan) pilihan mencetak konfigurasi bogofilter, iaitu parameter pendaftaran,
pilihan penghuraian, direktori bogofilter, dsb.
PILIHAN KLASIFIKASI
. -p Pilihan (laluan) mengeluarkan mesej dengan baris X-Bogosity pada penghujung
pengepala mesej. Ini memerlukan menyimpan keseluruhan mesej dalam ingatan apabila ia dibaca daripada
stdin (atau dari paip atau soket). Jika mesej dibaca daripada fail yang boleh diputar semula,
bogofilter akan membacanya untuk kali kedua.
. -e (embed) pilihan memberitahu bogofilter untuk keluar dengan kod 0 jika mesej boleh
dikelaskan, iaitu jika tiada ralat. Biasanya bogofilter menggunakan kod yang berbeza untuk
spam, ham dan klasifikasi tidak pasti, tetapi ini memudahkan penggunaan bogofilter dengan procmail
atau surat mel.
. -t (terse) pilihan memberitahu bogofilter untuk mencetak mesej spamicity yang disingkatkan
mengandungi 1 huruf dan markah. Spam ditunjukkan dengan "Y", ham dengan "N", dan tidak pasti dengan
"U". Nota: pemformatan boleh disesuaikan menggunakan fail konfigurasi.
. -T menyediakan mod terselit invarian untuk digunakan skrip. bogofilter akan mencetak an
dipendekkan mesej spamicity yang mengandungi 1 huruf dan markah. Spam ditunjukkan dengan
"S", ham oleh "H", dan tidak pasti oleh "U".
. -TT menyediakan mod terselit invarian untuk digunakan skrip. Bogofilter hanya mencetak
skor dan memaparkannya kepada 16 digit bererti.
. -u pilihan memberitahu bogofilter untuk mendaftarkan teks mesej selepas mengklasifikasikannya sebagai spam
atau bukan spam. Mesej spam akan didaftarkan pada senarai spam dan mesej bukan spam dihidupkan
senarai yang baik. Jika klasifikasi "tidak pasti", mesej tidak akan didaftarkan.
Secara berkesan pilihan ini menjalankan bogofilter dengan -s or -n bendera, mengikut kesesuaian. Berhati-hati adalah
digesa dalam penggunaan keupayaan ini, kerana apa-apa ralat klasifikasi bogofilter mungkin akan dibuat
dipelihara dan akan terkumpul sehingga diperbetulkan secara manual dengan -Sn and -NS pilihan
gabungan. Perhatikan pilihan ini menyebabkan pangkalan data dibuka untuk akses tulis, yang
boleh menyebabkan kelembapan besar-besaran melalui pertikaian kunci dan operasi I/O segerak.
. -H pilihan memberitahu bogofilter untuk tidak menandakan token daripada pengepala. Pilihan ini adalah untuk
ujian, anda tidak seharusnya menggunakannya dalam operasi biasa.
. -M pilihan memberitahu bogofilter untuk memproses inputnya sebagai fail berformat mbox. Sekiranya -v or
-t pilihan juga diberikan, baris spamicity akan dicetak untuk setiap mesej.
. -b (mod pukal penstriman) pilihan memberitahu bogofilter untuk mengklasifikasikan berbilang objek yang
nama dibaca dari stdin. Sekiranya -v or -t pilihan juga diberikan, bogofilter akan mencetak a
baris memberi nama fail dan maklumat klasifikasi bagi setiap fail. Ini adalah alternatif
kepada -B yang menyenaraikan objek pada baris arahan.
Objek dalam konteks ini hendaklah menjadi maildir (dikesan secara automatik), atau jika ia bukan maildir, a
mel tunggal melainkan -M diberikan - dalam kes itu ia diproses sebagai mbox. (Panjang Kandungan:
pengepala tidak diambil kira pada masa ini.)
Apabila membaca format mbox, bogofilter bergantung pada baris kosong selepas mel. Jika diperlukan,
rasmi -es akan memastikan perkara ini berlaku.
. -B objek ... (mod pukal) pilihan memberitahu bogofilter untuk mengklasifikasikan berbilang objek yang dinamakan
pada baris arahan. Objek mungkin nama fail (untuk mesej tunggal), peti mel (fail
dengan berbilang mesej), atau direktori (format maildir dan MH). Sekiranya -v or -t pilihan
juga diberikan, bogofilter akan mencetak baris yang memberi nama fail dan klasifikasi
maklumat bagi setiap fail. Ini adalah alternatif kepada -b yang menyenaraikan objek pada stdin.
. -R pilihan memberitahu bogofilter untuk mengeluarkan bingkai data R dalam bentuk teks pada standard
pengeluaran. Lihat bahagian penyepaduan dengan R, di bawah, untuk butiran lanjut.
PILIHAN PENDAFTARAN
. -s pilihan memberitahu bogofilter untuk mendaftarkan teks yang dibentangkan sebagai spam. Pangkalan data adalah
dicipta jika tiada.
. -n pilihan memberitahu bogofilter untuk mendaftarkan teks yang dibentangkan sebagai bukan spam.
Bogofilter tidak mengesan jika mesej didaftarkan dua kali. Jika anda melakukan ini secara tidak sengaja,
kiraan token akan berkurangan sebanyak 1 daripada perkara yang anda mahukan dan markah spam yang sepadan
akan terkeluar sedikit. Memandangkan sejumlah besar token dan mesej dalam senarai perkataan, ini
tidak mengapa. Masalah boleh diperbetulkan dengan menggunakan -S pilihan atau -N pilihan.
. -S pilihan memberitahu bogofilter untuk membuat asal pendaftaran sebelumnya bagi mesej yang sama seperti spam.
Jika mesej tersilap dimasukkan sebagai spam oleh -s or -u dan anda mahu mengeluarkannya dan
masukkannya sebagai bukan spam, gunakan -Sn. Jika -S digunakan untuk mesej yang tidak didaftarkan sebagai spam,
kiraan masih akan dikurangkan.
. -N pilihan memberitahu bogofilter untuk membuat asal pendaftaran sebelumnya bagi mesej yang sama seperti
bukan spam. Jika mesej tersilap dimasukkan sebagai bukan spam oleh -n or -u dan anda mahu
alih keluar dan masukkan sebagai spam, kemudian gunakan -NS. Jika -N digunakan untuk mesej yang bukan
didaftarkan sebagai bukan spam, kiraan masih akan dikurangkan.
PILIHAN UMUM
. -c nama fail pilihan memberitahu bogofilter untuk membaca fail konfigurasi bernama.
. -C pilihan menghalang bogofilter daripada membaca fail konfigurasi.
. -d dir pilihan membolehkan anda menetapkan direktori untuk pangkalan data. Lihat PERSEKITARAN
bahagian untuk pilihan tetapan direktori lain.
. -k saiz cache pilihan menetapkan saiz cache untuk subsistem BerkeleyDB, dalam unit 1
MiB (1,048,576 bait). Saiz cache yang betul meningkatkan prestasi bogofilter. The
saiz yang disyorkan ialah satu pertiga daripada saiz fail pangkalan data. Anda boleh menjalankan bogotune
skrip (dalam direktori penalaan) untuk menentukan saiz yang disyorkan.
. -l pilihan menulis baris maklumat ke log sistem setiap kali bogofilter dijalankan.
Maklumat yang dilog bergantung pada cara penapisan bogo dijalankan.
. -L tag pilihan mengkonfigurasi teg yang boleh disertakan dalam maklumat yang dilog
oleh -l pilihan, tetapi ia memerlukan format tersuai yang termasuk rentetan %l buat masa ini.
Pilihan ini membayangkan -l.
. -I nama fail pilihan memberitahu bogofilter untuk membaca inputnya daripada fail yang ditentukan, sebaliknya
daripada daripada stdin.
. -O nama fail pilihan memberitahu bogofilter di mana untuk menulis outputnya dalam mod laluan.
Ambil perhatian bahawa ini hanya berfungsi apabila -p diberikan secara eksplisit.
PILIHAN PARAMETER
. -E nilai [, nilai] pilihan membenarkan menetapkan nilai sp-esf dan nilai ns-esf. Dengan dua
nilai, kedua-dua sp-esf dan ns-esf ditetapkan. Jika hanya satu nilai diberikan, parameter ditetapkan sebagai
diterangkan dalam nota di bawah.
. -m nilai[,nilai][,nilai] pilihan membenarkan menetapkan nilai min-dev dan, secara pilihan,
merompak dan nilai robx. Dengan tiga nilai, min-dev, robs dan robx sudah sedia. Jika kurang
nilai diberikan, parameter ditetapkan seperti yang diterangkan dalam nota di bawah.
. -o nilai [, nilai] pilihan membenarkan menetapkan nilai pemotongan ham-potongan spam. Dengan dua
nilai, kedua-dua spam-cutoff dan ham-cutoff ditetapkan. Jika hanya satu nilai diberikan, parameter
ditetapkan seperti yang diterangkan dalam nota di bawah.
Nota: Semua pilihan ini membenarkan lebih sedikit nilai untuk diberikan. Nilai boleh dilangkau oleh
menggunakan hanya pembatas koma, dalam hal ini parameter(-parameter) yang sepadan tidak akan menjadi
berubah. Jika hanya nilai pertama diberikan, maka hanya parameter pertama ditetapkan.
Nilai jejak boleh dilangkau, dalam hal ini parameter yang sepadan tidak akan menjadi
berubah. Dalam senarai parameter, ruang tidak dibenarkan selepas koma.
PILIHAN INFO
. -v pilihan menghasilkan laporan kepada output standard pada analisis bogofilter terhadap input.
Setiap tambahan v akan meningkatkan verbositi output, sehingga maksimum 4. Dengan
-vv, laporan itu menyenaraikan token dengan sisihan tertinggi daripada min 0.5 perkaitan
dengan spam.
Lebih Baik -y tarikh boleh digunakan untuk mengatasi tarikh semasa apabila token cap masa. Suatu nilai
daripada sifar (0) mematikan cap masa.
. -D pilihan mengubah hala output nyahpepijat ke stdout.
. -x bendera pilihan membenarkan penetapan bendera nyahpepijat untuk mencetak maklumat nyahpepijat. Lihat
fail header debug.h untuk senarai bendera yang boleh digunakan.
PILIHAN FAIL KONFIG
Menggunakan GNU longopt -- sintaks, fail konfigurasi nama=nilai pernyataan menjadi baris arahan
--pilihan=nilai. Gunakan arahan penapis bogo - membantu untuk senarai pilihan dan lihat
bogofilter.cf.example untuk mendapatkan maklumat lanjut tentang mereka. Contohnya untuk menukar tajuk X-Bogosity
ke "X-Spam-Header", gunakan:
--spam-header-name=X-Spam-Header
PERSEKITARAN
Bogofilter menggunakan direktori pangkalan data, yang boleh ditetapkan dalam fail konfigurasi. Jika tidak ditetapkan
di sana, bogofilter akan menggunakan nilai BOGOFILTER_DIR. Kedua-duanya boleh ditindih oleh -d
dir pilihan. Jika tiada satu pun daripada itu tersedia, bogofilter akan menggunakan direktori $HOME/.bogofilter.
CONFIGURATION
Baris arahan bogofilter membenarkan penetapan banyak pilihan yang menentukan bagaimana bogofilter
beroperasi. Fail /etc/bogofilter.cf boleh digunakan untuk menetapkan parameter tambahan yang mempengaruhinya
operasi. Fail /etc/bogofilter.cf.example mempunyai sampel semua parameter. Status
dan mesej log boleh disesuaikan untuk setiap tapak.
PULANG BALIK NILAI-NILAI
0 untuk spam; 1 untuk bukan spam; 2 kerana tidak pasti; 3 untuk I/O atau ralat lain.
Sekiranya kedua-duanya -p and -e digunakan, nilai pulangan ialah: 0 untuk spam atau bukan spam; 3 untuk I/O atau
kesilapan lain.
Ralat 3 biasanya bermaksud bahawa fail senarai perkataan bogofilter ingin membaca pada permulaan adalah
hilang atau cakera keras telah diisi -p mod.
INTEGRASI DENGAN LAIN TOOLS
Gunakan dengan procmail
Resipi berikut (a) tong sampah spam apa-apa yang dinilaikan oleh penapis bogo sebagai spam, (b) didaftarkan
perkataan dalam mesej dinilai sebagai spam seperti itu, dan (c) mendaftarkan perkataan dalam mesej dinilai
sebagai bukan spam seperti itu. Dengan adanya ini, ia biasanya hanya diperlukan untuk pengguna
untuk campur tangan (dengan -NS or -Sn) apabila bogofilter salah mengkategorikan sesuatu.
# tapis mel melalui penapis bogo, menandainya sebagai Ham, Spam atau Tidak Pasti,
# dan mengemas kini senarai perkataan
:0fw
| bogofilter -u -e -p
# jika bogofilter gagal, kembalikan mel ke baris gilir;
# MTA akan cuba menghantarnya semula kemudian
# 75 ialah nilai untuk EX_TEMPFAIL dalam /usr/include/sysexits.h
:0e
{ EXITCODE=75 HOS }
# failkan mel ke spam-bogofilter jika ia adalah spam.
: 0:
* ^X-Bogosity: Spam, tests=bogofilter
penapis spam-bogo
# failkan mel ke unsure-bogofilter
# jika ia bukan ham mahupun spam.
: 0:
* ^X-Bogosity: Tidak pasti, tests=bogofilter
tidak pasti-bogofilter
# Dengan resipi ini, anda boleh melatih penapis bogo bermula dengan yang kosong
# senarai perkataan. Pastikan anda menyemak folder tidak pasti anda dengan kerap, ambil
# mesej daripadanya, klasifikasikannya sebagai ham (atau spam), dan gunakannya untuk
# penapis bogo kereta api.
Peraturan procmail berikut akan mengambil mel pada stdin dan menyimpannya ke fail spam jika bogofilter
fikir ia adalah spam:
:0HB:
* ? penapis bogo
spam
dan peraturan serupa ini juga akan mendaftarkan token dalam mel mengikut
klasifikasi bogofilter:
:0HB:
* ? bogofilter -u
spam
Jika bogofilter gagal (kembali 3) mesej akan dianggap sebagai bukan spam.
Yang ini adalah untuk surat mel, ia secara automatik menangguhkan mel dan cuba semula kemudian apabila
arahan xfilter gagal, gunakan ini dalam anda ~/.mailfilter:
xfilter "bogofilter -u -e -p"
jika (/^X-Bogosity: Spam, tests=bogofilter/)
{
kepada "spam-bogofilter"
}
Baris .muttrc berikut akan mencipta makro mutt untuk menghantar mel ke bogofilter.
indeks makro d " nyahset wait_key\n\
bogofilter -n\n\
tetapkan kunci_tunggu\n\
" "padam mesej sebagai bukan spam"
indeks makro \ed " nyahset wait_key\n\
bogofilter -s\n\
tetapkan kunci_tunggu\n\
" "padam mesej sebagai spam"
Penyepaduan dengan Ejen Pengangkutan Mel (MTA)
1. bogofilter juga boleh diintegrasikan ke dalam MTA untuk menapis semua mel masuk. Sementara
pelaksanaan khusus adalah bergantung kepada MTA, langkah-langkah umum adalah seperti berikut:
2. Pasang bogofilter pada pelayan mel
3. Utamakan pangkalan data bogofilter dengan korpus spam dan bukan spam. Oleh kerana bogofilter akan
berkhidmat kepada komuniti yang lebih besar, adalah penting untuk menyempurnakannya dengan set perwakilan
daripada mesej.
4. Sediakan MTA untuk menggunakan penapis bogo pada setiap mesej. Walaupun ini adalah khusus MTA
langkah, anda mungkin perlu menggunakan -p, -u, dan -e pilihan.
5. Sediakan mekanisme untuk pengguna mendaftarkan mesej spam/bukan spam, serta membetulkan
salah klasifikasi. Penyelesaian yang paling generik ialah menyediakan alamat e-mel alias kepada
yang mana pengguna melantunkan mesej.
6. Lihat direktori dokumen dan sumbangan untuk mendapatkan maklumat lanjut.
Penggunaan R untuk mengesahkan pengiraan bogofilter
Pilihan -R memberitahu bogofilter untuk menghasilkan bingkai data R. Bingkai data mengandungi satu
baris setiap token dianalisis. Setiap baris tersebut mengandungi token, jumlah pangkalan datanya "baik"
dan kiraan "spam", kiraan "baik" dibahagikan dengan bilangan mesej bukan spam yang digunakan
buat pangkalan data latihan, kiraan "spam" dibahagikan dengan kiraan mesej spam,
f(w) Robinson untuk token, log semula jadi bagi (1 - f(w)) dan f(w), dan penunjuk
aksara (+ jika nilai f(w) token melebihi sisihan minimum daripada 0.5, - jika ia
tidak). Terdapat satu baris tambahan di hujung jadual yang mengandungi label dalam
medan token, diikuti dengan bilangan perkataan yang sebenarnya digunakan (yang mempunyai + penunjuk),
Nilai P, Q, S, s dan x Robinson dan sisihan minimum.
Bingkai data R boleh disimpan ke fail dan kemudian dibaca ke dalam sesi R (lihat yang R
projek laman web[5] untuk maklumat tentang pakej matematik R). Disediakan dengan
pengedaran bogofilter ialah skrip R ringkas (fail bogo.R) yang boleh digunakan untuk mengesahkan
pengiraan bogofilter. Arahan penggunaannya disertakan dalam skrip dalam borang
daripada komen.
LOG PESAN
Bogofilter menulis mesej ke log sistem apabila -l pilihan digunakan. Apa yang tertulis
bergantung pada bendera lain yang digunakan.
Larian klasifikasi akan menjana (kami tidak menunjukkan tarikh dan bahagian hos di sini):
bogofilter[1412]: X-Bogosity: Ham, spamicity=0.000227
bogofilter[1415]: X-Bogosity: Spam, spamicity=0.998918
Menggunakan -u untuk mengklasifikasikan mesej dan mengemas kini senarai perkataan akan menghasilkan (satu baris tunggal):
bogofilter[1426]: X-Bogosity: Spam, spamicity=0.998918,
daftar -s, 329 perkataan, 1 mesej
Mendaftar perkataan (-l and -s, -n, -S, Atau -N) akan menghasilkan:
bogofilter[1440]: daftar-n, 255 perkataan, 1 mesej
Larian pendaftaran (menggunakan -s, -n, -N, Atau -S) akan menjana mesej seperti:
bogofilter[17330]: daftar-n, 574 perkataan, 3 mesej
bogofilter[6244]: daftar-s, 1273 perkataan, 4 mesej
Gunakan bogofilter-sqlite dalam talian menggunakan perkhidmatan onworks.net