 
Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen bogofilter-bdb komutudur.
Program:
ADI
bogofilter - hızlı Bayes spam filtresi
SİNOPSİS
bogfiltre [yardım seçenekleri | sınıflandırma seçenekleri | kayıt seçenekleri |
parametre seçenekleri | bilgi seçenekleri] [genel seçenekler] [yapılandırma dosyası seçenekleri]
nerede
yardım et seçenekleri şunlardır:
[-h] [--yardım] [-V] [-Q]
sınıflandırma seçenekleri şunlardır:
[-p] [-e] [-t] [-T] [-u] [-H] [-M] [-b] [-B nesne Kendi ID’n ile mağazalarını oluştur] [-R] [genel seçenekler]
[parametre seçenekleri] [yapılandırma dosyası seçenekleri]
lisanslama seçenekleri şunlardır:
[-s | -n] [-S | -N] [genel seçenekler]
genel seçenekleri şunlardır:
[-C Dosya] [-C] [-d dir] [-k önbellek boyutu] [-ll etiket] [-BEN Dosya] [-Ö Dosya]
parametre seçenekleri şunlardır:
[-E değer[,değer]] [-M değer[,değer][,değer]] [-Ö değer[,değer]]
bilgi seçenekleri şunlardır:
[-v] [-y tarih] [-D] [-x bayraklar]
yapılandırma dosya seçenekleri şunlardır:
[--seçenek=değer]
Not: Kullanım bogfiltre --yardım et seçeneklerin tam listesini görüntülemek için
AÇIKLAMA
Bogofilter bir Bayes spam filtresidir. Normal çalışma modunda, bir e-posta alır
standart girdideki mesaj veya başka bir metin, "iyi" listelerine karşı istatistiksel bir kontrol yapar
ve "kötü" kelimeler ve mesajın spam olup olmadığını gösteren bir durum kodu döndürür.
Bogofilter hızlı bir algoritma ile tasarlanmıştır, hızlı başlatma için Berkeley DB'yi kullanır ve
aramalar, doğrudan C ile kodlanmış ve hıza göre ayarlanmış, böylece üretim için kullanılabilir.
çok fazla posta işleyen siteler.
TEORİSİ OF ÇALIŞMA PRENSİBİ
Bogofilter, girdisini bir jeton torbası olarak değerlendirir. Her simge bir kelime listesine göre kontrol edilir,
bu, istenmeyen posta olmayan ve istenmeyen postalarda kaç kez meydana geldiğinin sayısını tutar.
Bu sayılar, bir mesajın içinde bulunduğu olasılığın bir tahminini hesaplamak için kullanılır.
belirteç oluşur spam. Bunlar, iletinin spam olup olmadığını belirtmek için birleştirilir.
jambon.
Bu yöntem, daha olağan model eşleştirme yaklaşımına kıyasla kaba gibi görünse de,
son derece etkili olduğu ortaya çıkıyor. Paul Graham'ın makalesi A Plan Her Ticaretçi İçin Mükemmellik İstenmeyen e[1] önerilir
okuma.
Bu program, daha akıllı sözcük analizi yaparak Paul'ün önerisini önemli ölçüde geliştirir.
Bogofilter uygun MIME kod çözme ve makul bir HTML ayrıştırma yapar. Özel çeşitler
ana bilgisayar adları ve IP adresleri gibi belirteçler yerine tanıma özellikleri olarak tutulur.
ayrılmış. Tarihler ve mesaj kimlikleri gibi çeşitli MTA bilgileri dikkate alınmaz.
kelime listesini şişirmek için. Çeşitli başlık alanlarında bulunan jetonlar uygun şekilde işaretlenmiştir.
Başka bir gelişme, bu programın, Gary Robinson'ın önerilen değişiklikleri sunmasıdır.
hesaplamalar (aşağıdaki robx ve robs parametrelerine bakın). Bu değişiklikler
Robinson'ın makalesinde açıklanan İstenmeyen e Bulma[2].
O zamandan beri, Robinson (Linux Journal makalesine bakın) A Istatistiksel Yaklaşım için the İstenmeyen e
Sorun[3] ve diğerleri, hesaplamanın aşağıdakiler kullanılarak daha da optimize edilebileceğini fark ettiler.
Fisher'ın yöntemi. Başka iyileşme[4] uygulayarak belirteç fazlalığını telafi eder
etkin boyut faktörlerini (ESF) spam ve spam olmayan olasılık hesaplamalarına ayırın.
Kısaca şöyle işler: Bireyin spam olasılıklarına ilişkin tahminler
belirteçler "ters ki-kare işlevi" kullanılarak birleştirilir. Değeri ne kadar kötü olduğunu gösterir
mesajın yalnızca rastgele bir bağımsız kelimeler topluluğu olduğu şeklindeki boş hipotez
önceki tahminlerimiz tarafından verilen olasılıklar başarısız olur. Bu fonksiyon çok hassastır.
küçük olasılıklar (kelimeler), ancak yüksek olasılıklar için değil (spam amaçlı kelimeler); Bu yüzden
değer, bir mesajda yalnızca güçlü hammish işaretlerini gösterir. Şimdi ters kullanarak
belirteçler için olasılıklar, aynı hesaplama tekrar yapılır ve bir gösterge verilir.
bir ileti şiddetle spam görünüyor. Son olarak, bu iki gösterge çıkarılır (ve
0-1 aralığına ölçeklenir). Bu birleşik gösterge (bogosity), işaretler varsa 0'a yakındır.
bir hammish mesajı için spam mesajından daha güçlüdür ve 1'e yakındır.
durum tam tersi. Her ikisinin de işaretleri eşit derecede güçlüyse, değer
0.5'e yakın. Bu mesajlar net bir gösterge vermediğinden, üç durumlu bir mod vardır.
bogofilter, bu iletileri belirsiz olarak işaretlemek için, açık iletiler ise spam olarak işaretlenir.
veya sırasıyla jambon. İki durumlu modda, her ileti spam veya jambon olarak işaretlenir.
Bu hesaplamaları etkileyen çeşitli parametreler, en önemlileri şunlardır:
robx: Daha önce görülmemiş bir jetona verilen puan. robx olasılıktır
belirteç spam.
robs: robx üzerinde, az görülen bir belirteç olasılığını robx'a doğru hareket ettiren bir ağırlık.
min-dev: hesaplamada kullanılacak belirteçler için 5'ten minimum mesafe. Sadece jetonlar
0.5'ten uzak bu değer kullanılır.
spam-cutoff: Skoru eşit veya üzerinde olan iletiler spam olarak işaretlenir.
jam-cutoff: Sıfır veya spam kesme ise, değerleri spam kesme sınırının kesinlikle altında olan tüm iletiler
jambon, diğerleri spam (iki durumlu) olarak işaretlenir. Diğer değerler, daha küçük veya buna eşit
jambon kesmesi jambon olarak işaretlenir, mesajlar kesinlikle jambon kesme ve
spam kesme, emin değil olarak işaretlenir; geri kalanı spam olarak (tristate)
sp-esf: spam için etkili boyut faktörü (ESF).
ns-esf: spam olmayanlar için ESF. Bu ESF değerleri varsayılan olarak 1.0'dır ve bu, olmayan ile aynıdır.
hesaplamada ESF kullanarak. Bir kullanıcının e-posta popülasyonuna uygun değerler şunlar olabilir:
bogotune programı yardımıyla belirlenir.
SEÇENEKLER
YARDIM SEÇENEKLERİ
The -h seçeneği yardım mesajını yazdırır ve çıkar.
The -V seçeneği sürüm numarasını yazdırır ve çıkar.
The -Q (sorgu) seçeneği, bogofilter'ın konfigürasyonunu, yani kayıt parametrelerini yazdırır,
ayrıştırma seçenekleri, bogofilter dizini vb.
SINIFLAMA SEÇENEKLERİ
The -p (geçiş) seçeneği, mesajın sonunda bir X-Bogosity satırı ile çıktı verir.
Mesaj başlığı. Bu, okunduğunda tüm mesajın bellekte tutulmasını gerektirir.
stdin (veya bir boru veya prizden). Mesaj geri sarılabilen bir dosyadan okunursa,
bogofilter ikinci kez okuyacaktır.
The -e (embed) seçeneği, bogofilter'a mesaj gönderilebiliyorsa 0 koduyla çıkmasını söyler.
sınıflandırılır, yani bir hata yoksa. Normalde bogofilter için farklı kodlar kullanır
spam, jambon ve emin olmayan sınıflandırmalar, ancak bu, procmail ile bogofilter kullanmayı basitleştirir
veya posta damlası.
The -t (özlü) seçeneği, bogofilter'a kısaltılmış bir istenmeyen posta iletisi yazdırmasını söyler
1 harf ve puan içeren. Spam "Y" ile, jambon "N" ile ve emin değil ile gösterilir
"Ü". Not: biçimlendirme, yapılandırma dosyası kullanılarak özelleştirilebilir.
The -T komut dosyalarının kullanması için değişmez bir kısa mod sağlar. bogofilter bir yazdıracak
1 harf ve puan içeren kısaltılmış spam içerikli mesaj. Spam ile gösterilir
"S", jambon "H" ve emin değil "U".
The -TT komut dosyalarının kullanması için değişmez bir kısa mod sağlar. Bogofilter yalnızca
puan verir ve 16 anlamlı basamağa kadar görüntüler.
The -u seçenek, bogofilter'a iletinin metnini spam olarak sınıflandırdıktan sonra kaydetmesini söyler
veya spam olmayan. İstenmeyen posta listesine bir spam mesaj kaydedilecek ve spam olmayan bir mesaj şu adrese kaydedilecek:
iyi liste. Sınıflandırma "emin değil" ise, mesaj kaydedilmeyecektir.
Etkili bir şekilde bu seçenek, bogofilter ile çalışır. -s or -n bayrak, uygun şekilde. Dikkat
Bogofilter'in yapabileceği herhangi bir sınıflandırma hatası olacağından, bu yeteneğin kullanımında ısrar
ile manuel olarak düzeltilene kadar korunacak ve birikecektir. -Sn ve -N'ler seçenek
kombinasyonlar. Bu seçeneğin veritabanının yazma erişimi için açılmasına neden olduğunu unutmayın;
kilit çekişmesi ve eşzamanlı G/Ç işlemleri yoluyla büyük yavaşlamalar gerektirebilir.
The -H seçenek, bogofilter'a başlıktaki belirteçleri etiketlememesini söyler. Bu seçenek için
test, normal çalışmada kullanmamalısınız.
The -M seçenek, bogofilter'a girdisini mbox formatlı bir dosya olarak işlemesini söyler. Eğer -v or
-t seçeneği de verilirse, her mesaj için bir spam satırı yazdırılacaktır.
The -b (toplu akış modu) seçeneği, bogofilter'a birden çok nesneyi sınıflandırmasını söyler.
isimler stdin'den okunur. Eğer -v or -t seçeneği de verilmişse, bogofilter bir
Her dosya için dosya adı ve sınıflandırma bilgilerini veren satır. Bu bir alternatif
için -B komut satırındaki nesneleri listeler.
Bu bağlamdaki bir nesne bir maildir (otomatik algılanan) olacaktır veya bir maildir değilse, bir
sürece tek posta -M verilir - bu durumda mbox olarak işlenir. (İçerik Uzunluğu:
başlık şu anda dikkate alınmamaktadır.)
Mbox biçimini okurken, bogofilter bir postadan sonraki boş satıra güvenir. Gerekirse,
resmi posta -es durumun böyle olmasını sağlayacaktır.
The -B nesne Kendi ID’n ile mağazalarını oluştur (toplu mod) seçeneği, bogofilter'a adlandırılmış birden çok nesneyi sınıflandırmasını söyler
komut satırında. Nesneler dosya adları (tek mesajlar için), posta kutuları (dosyalar) olabilir.
birden fazla mesajla) veya dizinler (maildir ve MH formatında). Eğer -v or -t seçenek
ayrıca verilir, bogofilter dosya adı ve sınıflandırma veren bir satır yazdırır
Her dosya için bilgi. Bu bir alternatif -b hangi stdin'deki nesneleri listeler.
The -R seçenek, bogofilter'a standartta metin biçiminde bir R veri çerçevesi çıkarmasını söyler
çıktı. Daha fazla ayrıntı için aşağıdaki R ile entegrasyon bölümüne bakın.
KAYIT SEÇENEKLERİ
The -s seçenek, bogofilter'a spam olarak sunulan metni kaydetmesini söyler. veritabanı
yoksa oluşturulur.
The -n seçenek, bogofilter'a spam olmayan olarak sunulan metni kaydetmesini söyler.
Bogofilter, bir mesajın iki kez kaydedilip kaydedilmediğini algılamaz. Bunu yanlışlıkla yaparsanız,
jeton sayısı, gerçekten istediğinizden ve karşılık gelen spam puanlarından 1 azalır
biraz kapalı olacak. Sözcük listesinde çok sayıda belirteç ve mesaj verildiğinde, bu
önemli değil. Sorun yapabilmek kullanılarak düzeltilebilir. -S seçeneği veya -N seçeneği.
The -S seçenek, bogofilter'a aynı mesajın spam olarak önceden kaydını geri almasını söyler.
Bir ileti yanlışlıkla spam olarak girilmişse -s or -u ve onu kaldırmak istiyorsun ve
spam olmayan olarak girin, kullanın -Sn. Eğer -S spam olarak kaydedilmemiş bir ileti için kullanılır,
sayımlar yine de azaltılacak.
The -N seçenek, bogofilter'a aynı mesajın önceki kaydını geri almasını söyler.
spam olmayan. Bir ileti yanlışlıkla spam olmayan olarak girilmişse -n or -u ve sen istiyorum
kaldırın ve spam olarak girin, ardından kullanın -N'ler. Eğer -N olmayan bir mesaj için kullanılır
istenmeyen e-posta olarak kaydedilmemişse, sayımlar yine de azaltılacaktır.
GENEL SEÇENEKLER
The -c Dosya seçenek, bogofilter'a adlı yapılandırma dosyasını okumasını söyler.
The -C seçeneği, bogofilter'ın yapılandırma dosyalarını okumasını engeller.
The -d dir seçeneği, veritabanı için dizini ayarlamanıza izin verir. ÇEVRE GÖRÜN
diğer dizin ayar seçenekleri için bölüm.
The -k önbellek boyutu seçeneği, BerkeleyDB alt sistemi için önbellek boyutunu 1 birim olarak ayarlar
MiB (1,048,576 bayt). Önbelleğin uygun şekilde boyutlandırılması, bogofilter'ın performansını artırır. NS
önerilen boyut, veritabanı dosyasının boyutunun üçte biri kadardır. bogotune'u çalıştırabilirsin
önerilen boyutu belirlemek için komut dosyası (ayar dizininde).
The -l seçenek, bogofilter her çalıştırıldığında sistem günlüğüne bir bilgi satırı yazar.
Günlüğe kaydedilen bilgiler, bogofilter'ın nasıl çalıştırıldığına bağlıdır.
The -L etiket seçeneği, günlüğe kaydedilen bilgilere dahil edilebilecek bir etiket yapılandırır
tarafından -l seçeneği, ancak şimdilik %l dizesini içeren özel bir biçim gerektiriyor.
Bu seçenek şu anlama gelir: -l.
The -I Dosya seçenek, bogofilter'a girdisini belirtilen dosyadan okumasını söyler.
-den daha stdin.
The -O Dosya seçenek, bogofilter'a çıkışını geçiş modunda nereye yazacağını söyler.
Bunun yalnızca -p açıkça verildiğinde çalıştığını unutmayın.
PARAMETRE SEÇENEKLERİ
The -E değer[,değer] seçeneği, sp-esf değerinin ve ns-esf değerinin ayarlanmasına izin verir. İkisiyle
değerleri, hem sp-esf hem de ns-esf ayarlanır. Yalnızca bir değer verilirse, parametreler şu şekilde ayarlanır:
aşağıdaki notta açıklanmıştır.
The -m değer[,değer][,değer] seçeneği min-dev değerinin ayarlanmasına ve isteğe bağlı olarak
robs ve robx değerleri. Üç değerle min-dev, robs ve robx hepsi ayarlanmıştır. daha az ise
değerler verilir, parametreler aşağıdaki notta açıklandığı gibi ayarlanır.
The -o değer[,değer] seçeneği, spam kesme jambon kesme değerlerinin ayarlanmasına izin verir. İkisiyle
hem spam-cutoff hem de jam-cutoff değerleri ayarlanır. Yalnızca bir değer verilirse, parametreler
aşağıdaki notta açıklandığı gibi ayarlanır.
Not: Bu seçeneklerin tümü, daha az değerin sağlanmasına izin verir. Değerler atlanabilir
sadece virgül sınırlayıcı kullanılarak, bu durumda karşılık gelen parametre(ler)
değişti. Yalnızca ilk değer sağlanırsa, yalnızca ilk parametre ayarlanır.
İzleyen değerler atlanabilir, bu durumda ilgili parametreler
değişti. Parametre listesinde virgülden sonra boşluk bırakılamaz.
BİLGİ SEÇENEKLERİ
The -v seçeneği, bogofilter'in girdi analizine ilişkin standart çıktıya bir rapor üretir.
Her ek v çıktının ayrıntı düzeyini maksimum 4'e kadar artıracaktır.
-vv, rapor, ortalama 0.5 ilişkilendirmeden en yüksek sapmaya sahip belirteçleri listeler.
spam ile.
seçenek -y tarih belirteçlere zaman damgası eklenirken geçerli tarihi geçersiz kılmak için kullanılabilir. Bir değer
sıfır (0) zaman damgasını kapatır.
The -D seçenek, hata ayıklama çıktısını stdout'a yönlendirir.
The -x bayraklar seçeneği, hata ayıklama bilgilerini yazdırmak için hata ayıklama bayraklarının ayarlanmasına izin verir. Görmek
Kullanılabilir bayrakların listesi için başlık dosyası debug.h.
YAPILANDIRMA DOSYA SEÇENEKLERİ
GNU longopt'u kullanma -- sözdizimi, bir yapılandırma dosyasının adı = değer deyim bir komut satırı olur
--seçenek=değer. Komutu kullan bogfiltre --yardım et seçeneklerin bir listesi için bkz.
Onlar hakkında daha fazla bilgi için bogofilter.cf.example. Örneğin, X-Bogosity başlığını değiştirmek için
"X-Spam-Header" için şunu kullanın:
--spam-başlık-adı=X-Spam-Başlığı
ÇEVRE
Bogofilter, yapılandırma dosyasında ayarlanabilen bir veritabanı dizini kullanır. ayarlanmazsa
orada, bogofilter değerini kullanacak BOGOFILTER_DIR. Her ikisi de geçersiz kılınabilir -d
dir seçenek. Bunların hiçbiri mevcut değilse, bogofilter $HOME/.bogofilter dizinini kullanır.
YAPILANDIRMA
Bogofilter komut satırı, bogofilter'ın nasıl bogofilter olduğunu belirleyen birçok seçeneğin ayarlanmasına izin verir.
çalışır. /etc/bogofilter.cf dosyası, kendi özelliklerini etkileyen ek parametreleri ayarlamak için kullanılabilir.
operasyon. /etc/bogofilter.cf.example dosyası tüm parametrelerin örneklerine sahiptir. Durum
ve günlük mesajları her site için özelleştirilebilir.
DÖNÜŞ DEĞERLER
spam için 0; 1 spam olmayanlar için; 2 emin değilim; G/Ç veya diğer hatalar için 3.
İkisi de olursa -p ve -e kullanıldığında, dönüş değerleri: spam veya spam olmayanlar için 0; G/Ç için 3 veya
diğer hatalar.
Hata 3 genellikle, bogofilter'ın başlangıçta okumak istediği wordlist dosyasının
eksik veya sabit disk doldurulmuş -p modu.
ENTEGRASYON İLE DİĞER ARAÇLAR
procmail ile kullanın
Aşağıdaki tarif (a) bogfilter'ın spam olarak değerlendirdiği her şeyi spam kutularına atar, (b) kaydeder
spam olarak derecelendirilen mesajlardaki kelimeler ve (c) derecelendirilen mesajlardaki kelimeleri kaydeder
gibi spam olmayan. Bu yapıldığında, normalde yalnızca kullanıcı için gerekli olacaktır.
müdahale etmek (ile -N'ler or -Sn) bogofilter bir şeyi yanlış kategorize ettiğinde.
# postayı bogofilter aracılığıyla filtreleyin, Ham, İstenmeyen Posta veya Emin Değil olarak etiketleyin,
# ve kelime listesini güncelleme
:0fw
| bogfiltre -u -e -p
# bogofilter başarısız olursa, postayı kuyruğa geri gönderin;
# MTA daha sonra teslim etmeyi tekrar deneyecek
# 75, /usr/include/sysexits.h içindeki EX_TEMPFAIL değeridir
:0e
{ ÇIKIŞ KODU=75 SUNUCU }
# eğer spam ise postayı spam-bogofilter'a dosyalayın.
: 0:
* ^X-Bogosity: Spam, testler=bogofilter
spam-bogfiltre
# postayı emin-bogofilter'a dosyalayın
# ne jambon ne de spam değilse.
: 0:
* ^X-Bogosity: Emin değilim, testler=bogofilter
emin-bogofilter
# Bu tarif ile bogofilter boş ile başlayarak çalıştırabilirsiniz.
# kelime listesi. Emin olmayan klasörünüzü düzenli olarak kontrol ettiğinizden emin olun,
# mesaj dışında, bunları jambon (veya spam) olarak sınıflandırın ve
# tren bogofiltresi.
Aşağıdaki procmail kuralı, stdin'deki postaları alacak ve bogofilter ise spam dosyasına kaydedecektir.
spam olduğunu düşünüyor:
:0HB:
* ? bogfiltre
Spam
ve bu benzer kural, belirteçleri postaya göre de kaydedecektir.
bogfiltre sınıflandırması:
:0HB:
* ? bogfiltre -u
Spam
Bogofilter başarısız olursa (3 döndürülürse, mesaj spam olmayan olarak değerlendirilir.
Bu, posta bırakma içindir, postayı otomatik olarak erteler ve daha sonra yeniden dener
xfilter komutu başarısız oluyor, bunu ~/.mailfiltre:
xfilter "bogofilter -u -e -p"
if (/^X-Bogosity: Spam, testler=bogofilter/)
{
"spam-bogofilter" için
}
Aşağıdaki .muttrc satırları, postayı bogofilter'a göndermek için mutt makroları oluşturacaktır.
makro dizini d " wait_key ayarını kaldır\n\
bogfiltre -n\n\
wait_key'i ayarla\n\
" "mesajı spam olmayan olarak sil"
makro dizini \ed " wait_key ayarını kaldır\n\
bogfiltre -s\n\
wait_key'i ayarla\n\
" "mesajı spam olarak sil"
Posta Aktarım Aracısı (MTA) ile Entegrasyon
1. bogofilter, gelen tüm postaları filtrelemek için bir MTA'ya da entegre edilebilir. iken
özel uygulama MTA'ya bağlıdır, genel adımlar aşağıdaki gibidir:
2. Posta sunucusuna bogofilter kurun
3. Bogofilter veritabanlarını bir istenmeyen e-posta ve istenmeyen e-posta olmayan tümce ile hazırlayın. Bogofilter olacağından
daha büyük bir topluluğa hizmet etmek için, onu temsili bir setle hazırlamak önemlidir.
mesajların.
4. MTA'yı her mesajda bogofilter'ı çağıracak şekilde ayarlayın. Bu bir MTA'ya özgü olsa da
adım, muhtemelen kullanmanız gerekecek -p, -u, ve -e seçenekleri.
5. Kullanıcıların istenmeyen/spam olmayan iletileri kaydetmeleri ve bunları düzeltmeleri için bir mekanizma kurun.
yanlış sınıflandırmalar En genel çözüm, takma ad e-posta adresleri ayarlamaktır.
hangi kullanıcıların iletileri geri döndürdüğü.
6. Daha fazla bilgi için belge ve katkı dizinlerine bakın.
Bogofilter hesaplamalarını doğrulamak için R kullanımı
-R seçeneği, bogofilter'a bir R veri çerçevesi oluşturmasını söyler. Veri çerçevesi bir tane içerir
analiz edilen belirteç başına satır. Bu tür her satır, belirteci, "iyi" veritabanının toplamını içerir.
ve "spam" sayıları, "iyi" sayının, kullanılan spam olmayan iletilerin sayısına bölünmesiyle elde edilir.
eğitim veritabanını oluşturun, "spam" sayısı, spam mesaj sayısına bölünür,
Belirteç için Robinson'ın f(w), (1 - f(w)) ve f(w)'nin doğal günlükleri ve bir gösterge
karakter (+ jetonun f(w) değeri 0.5'ten minimum sapmayı aşarsa, -
yapmadım). Tablonun sonunda bir etiket içeren ek bir satır vardır.
jeton alanı, ardından fiilen kullanılan kelimelerin sayısı (+ göstergeli olanlar),
Robinson'ın P, Q, S, s ve x değerleri ve minimum sapma.
R veri çerçevesi bir dosyaya kaydedilebilir ve daha sonra bir R oturumunda okunabilir (bkz. the R
proje Web sitesi[5] matematik paketi R hakkında bilgi için). ile sağlanan
bogofilter dağıtımı, doğrulamak için kullanılabilen basit bir R betiğidir (dosya bogo.R).
bogofilter hesaplamaları. Kullanım talimatları, formdaki komut dosyasına dahil edilmiştir.
yorumların.
LOG MESAJLARI
Bogofilter sistem günlüğüne mesaj yazar. -l seçeneği kullanılır. Ne yazılmış
başka hangi bayrakların kullanıldığına bağlıdır.
Bir sınıflandırma çalışması oluşturulacaktır (tarihi ve ana bilgisayar bölümünü burada göstermiyoruz):
bogofilter[1412]: X-Bogosity: Jambon, spamity=0.000227
bogofilter[1415]: X-Bogosity: Spam, spamity=0.998918
kullanma -u bir mesajı sınıflandırmak ve bir kelime listesini güncellemek için üretecektir (bir tek satır):
bogofilter[1426]: X-Bogosity: Spam, spamity=0.998918,
register -s, 329 kelime, 1 mesaj
Kayıt kelimeleri (-l ve -s, -n, -Sya da -N) üretecek:
bogofilter[1440]: register-n, 255 kelime, 1 mesaj
Bir kayıt çalıştırması (kullanarak -s, -n, -Nya da -S) gibi mesajlar üretecektir:
bogofilter[17330]: register-n, 574 kelime, 3 mesaj
bogofilter[6244]: kayıtlar, 1273 kelime, 4 mesaj
onworks.net hizmetlerini kullanarak bogofilter-bdb'yi çevrimiçi kullanın
 














