Ito ang command ifile na maaaring patakbuhin sa OnWorks free hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
ifile - core executable para sa ifile mail filtering system
SINOPSIS
ifile [-b file] [-q|-Q] [-g] [-k] [-o] [-v num] [lexing pagpipilian] file ...
ifile -c -q|-Q [-T threshold] [-b file] [-g] [-k] [-o] [lexing pagpipilian] file ...
ifile [-b file] [-d folder] [-i folder|-u folder] [-g] [-k] [-o] [-v num] [lexing pagpipilian]
file ...
ifile -r [-b file]
DESCRIPTION
ifile ay isang mail filter client na gumagamit ng machine learning para pag-uri-uriin ang e-mail
mga folder/mail box. Ang algorithm na ginagamit nito ay tinatawag na Naive Bayes. Talaga, walang muwang
Isinasaalang-alang ng bayes ang bawat dokumento bilang isang hindi ayos na koleksyon ng mga salita at inuuri ayon sa pagtutugma
ang pamamahagi ng dokumento na may pinakakatugmang pamamahagi ng folder/mailbox.
Opsyon
-b, --db-file=file
Lokasyon para basahin/imbakin ang database ng ifile. Default ay ~/.idata
-c, --maikli
katumbas ng "ifile -v 0 | ulo -1 | gupitin -f1 -d". Dapat gamitin kasama ng -q or -Q.
-d, --tanggalin=folder
Tanggalin ang mga istatistika para sa bawat isa file mula sa kategorya folder
-f, --folder-calcs=folder
Ipakita ang mga kalkulasyon ng word-probability para sa folder
-g, --log-file
Lumikha at mag-imbak ng impormasyon sa pag-debug sa ~/.ifile.log
-i, --ipasok=folder
Idagdag ang mga istatistika para sa bawat isa sa mga file sa kategorya folder
-k, --panatilihin-madalang
Mag-iwan sa database ng mga salita na madalang na nangyayari (karaniwan ay inihahagis ang mga ito)
-l, --query-loocv=folder
Para sa bawat isa sa mga file, pansamantalang inaalis ang file mula sa folder, gumaganap ng query at
pagkatapos ay muling maglalagay ng file folder. Hindi binago ang database.
-o, --nangyayari
Gumagamit ng representasyon ng bit-vector ng dokumento. Bilangin ang bawat salita nang isang beses sa bawat dokumento.
-q, --tanong
Mga marka ng rating ng output para sa bawat isa sa mga file
-Q, --query-insert
Para sa bawat isa sa mga file, mga marka ng rating ng output at magdagdag ng mga istatistika para sa folder na may
ang pinakamataas na marka
-T, --threshold=threshold
Kapag ginamit sa pareho -c at -q, ilabas ang dalawang kategorya ng pinakamataas na ranggo kung ang kanilang
ang marka ay nagkakaiba sa karamihan threshold / 1000, na maaaring magamit upang makita ang hangganan
kaso. Kapag ginamit sa -q lamang at anuman threshold > 0, ilabas ang pagkakaiba ng marka
porsyento. Halimbawa,
ifile -T1 -q foo.txt
maaaring magresulta sa
spam -15570.48640776
hindi spam -18728.00272369
diff[spam,non-spam](%) 9.21
Kung gayon, kung gayon
ifile -T93 -q -c foo.txt
ay magreresulta sa
foo.txt spam, hindi spam
samantalang
ifile -T92 -q -c foo.txt
ay magreresulta sa
foo.txt spam
-r, --reset-data
Binura ang lahat ng kasalukuyang nakaimbak na impormasyon
-u, --update=folder
Pareho sa 'insert' maliban sa nagdaragdag lamang ng mga istatistika kung folder mayroon na
-v, --verbosity=num
Dami ng output habang tumatakbo: 0=silent, 1=tahimik, 2=progress, 3=verbose, 4=debug
Mga pagpipilian sa Lexing:
-a, --alpha-lexer
Mga lex na salita bilang mga pagkakasunud-sunod ng mga alphabetic na character (default)
-A, --alpha-only-lexer
Tanging lex space-separated character sequence na ganap na binubuo ng
mga character na alpabetiko
-h, --strip-header
Laktawan ang lahat ng mga linya ng header maliban sa Paksa:, Mula: at Para kay:
-m, --max-haba=tangke
Huwag pansinin ang bahagi ng mensahe pagkatapos ng una tangke mga karakter. Gamitin ang buong mensahe kung tangke
itinakda sa 0. Ang default ay 50,000.
-p, --print-token
I-tokenize at i-print lang, huwag gumawa ng anumang iba pang pagproseso. Ang mga dokumento ay ibinalik bilang
isang listahan ng salita, mga pares ng dalas.
-s, --walang-stoplist
Huwag magtapon ng masyadong madalas (stoplist) na mga salita kapag nag-lex
-S, --stemming
Gumamit ng 'Porter' stemming algorithm kapag nag-lex ng mga dokumento
-w, --white-lexer
Mga salitang lex bilang mga pagkakasunud-sunod ng mga character na pinaghihiwalay ng espasyo
Kung walang mga file na tinukoy sa command line, gagamitin ng ifile ang karaniwang input bilang nito
mensahe upang iproseso.
-?, - Tumulong
Ibigay ang listahan ng tulong na ito
--gamit
Magbigay ng maikling mensahe sa paggamit
-V, --bersyon
I-print ang bersyon ng programa
Ang mga mandatory o opsyonal na argumento sa mahahabang opsyon ay mandatoryo o opsyonal din para sa anuman
kaukulang maikling pagpipilian.
Gumamit ng ifile online gamit ang mga serbisyo ng onworks.net