Ini adalah file perintah yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
ifile - inti yang dapat dieksekusi untuk sistem penyaringan email ifile
RINGKASAN
file [-b fillet] [-q|-Q] [-g] [-k] [-o] [-v num] [melenturkan Pilihan] fillet ...
file -c -q|-Q [-T ambang] [-b fillet] [-g] [-k] [-o] [melenturkan Pilihan] fillet ...
file [-b fillet] [-d map] [-i map|-u map] [-g] [-k] [-o] [-v num] [melenturkan Pilihan]
fillet ...
file -r [-b fillet]
DESKRIPSI
file adalah klien filter email yang menggunakan pembelajaran mesin untuk mengklasifikasikan email menjadi
folder/kotak surat. Algoritma yang digunakannya disebut Naive Bayes. Pada dasarnya, naif
bayes menganggap setiap dokumen sebagai kumpulan kata yang tidak berurutan dan mengklasifikasikannya dengan mencocokkan
distribusi dokumen dengan distribusi folder/kotak surat yang paling cocok.
PILIHAN
-b, --file db=fillet
Lokasi untuk membaca/menyimpan database ifile. Standarnya adalah ~/.idata
-c, --ringkas
setara dengan "ifile -v 0 | kepala -1 | memotong -f1 -d". Harus digunakan dengan -q or -Q.
-d, --menghapus=map
Hapus statistik untuk masing-masing arsip dari kategori map
-f, --folder-kalk=map
Tunjukkan perhitungan probabilitas kata untuk map
-g, --file-log
Buat dan simpan informasi debug di ~/.ifile.log
-i, --memasukkan=map
Tambahkan statistik untuk setiap file ke kategori map
-k, --tetap-jarang
Tinggalkan di database kata-kata yang jarang muncul (biasanya dilempar)
-l, --kueri-loocv=map
Untuk setiap file, hapus sementara file dari map, melakukan query dan
kemudian masukkan kembali file di map. Basis data tidak diubah.
-o, --terjadi
Menggunakan representasi bit-vektor dokumen. Hitung setiap kata sekali per dokumen.
-q, --pertanyaan
Skor peringkat keluaran untuk setiap file
-Q, --kueri-masukkan
Untuk setiap file, nilai peringkat keluaran dan tambahkan statistik untuk folder dengan
nilai Tertinggi
-T, --ambang=ambang
Saat digunakan dengan keduanya -c dan -q, keluarkan dua kategori peringkat tertinggi jika mereka
skor berbeda paling banyak ambang / 1000, yang dapat digunakan untuk mendeteksi batas
kasus. Saat digunakan dengan -q hanya dan apa saja ambang > 0, keluarkan selisih skor
persentase. Sebagai contoh,
file -T1 -q foo.txt
mungkin mengakibatkan
spam-15570.48640776
bukan spam -18728.00272369
perbedaan[spam,non-spam](%) 9.21
Jika demikian, maka
file -T93 -q -c foo.txt
akan menghasilkan
foo.txt spam, bukan spam
sedangkan
file -T92 -q -c foo.txt
akan menghasilkan
spam foo.txt
-r, --reset-data
Menghapus semua informasi yang tersimpan saat ini
-u, --memperbarui=map
Sama seperti 'insert' kecuali hanya menambahkan statistik jika map sudah ada
-v, --verbositas=num
Jumlah output saat berjalan: 0=diam, 1=tenang, 2=kemajuan, 3=verbose, 4=debug
Opsi Lexing:
-a, --alfa-lexer
Kata-kata Lex sebagai urutan karakter alfabet (default)
-A, --alpha-only-lexer
Hanya urutan karakter yang dipisahkan oleh ruang lex yang seluruhnya terdiri dari
karakter abjad
-h, --strip-header
Lewati semua baris header kecuali Subjek:, Dari: dan Ke:
-m, --panjang maksimal=tangki
Abaikan bagian pesan setelah pertama tangki karakter. Gunakan seluruh pesan jika tangki
diatur ke 0. Standarnya adalah 50,000.
-p, --print-token
Cukup tokenize dan cetak, jangan lakukan pemrosesan lainnya. Dokumen dikembalikan sebagai
daftar kata, pasangan frekuensi.
-s, --tidak ada daftar berhenti
Jangan membuang kata-kata (stoplist) yang terlalu sering saat lexing
-S, --membendung
Gunakan algoritma stemming 'Porter' saat melonggarkan dokumen
-w, --putih-lexer
Kata-kata lex sebagai urutan karakter yang dipisahkan spasi
Jika tidak ada file yang ditentukan pada baris perintah, ifile akan menggunakan input standar sebagai
pesan untuk diproses.
-?, --membantu
Berikan daftar bantuan ini
--penggunaan
Berikan pesan penggunaan singkat
-V, --Versi: kapan
Cetak versi program
Argumen wajib atau opsional untuk opsi panjang juga wajib atau opsional untuk semua
opsi pendek yang sesuai.
Gunakan ifile online menggunakan layanan onworks.net