To jest polecenie ifile, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS
PROGRAM:
IMIĘ
ifile - podstawowy plik wykonywalny dla systemu filtrowania poczty ifile
STRESZCZENIE
jeśli nie [-b filet] [-q|-Q] [-g] [-k] [-o] [-v num] [leksykać Opcje] filet ...
jeśli nie -c -q|-Q [-T próg] [-b filet] [-g] [-k] [-o] [leksykać Opcje] filet ...
jeśli nie [-b filet] [-d falcówka] [-i falcówka|-u falcówka] [-g] [-k] [-o] [-v num] [leksykać Opcje]
filet ...
jeśli nie -r [-b filet]
OPIS
jeśli nie to klient filtrujący pocztę, który wykorzystuje uczenie maszynowe do klasyfikowania wiadomości e-mail
foldery/skrzynki pocztowe. Algorytm, którego używa, nazywa się Naive Bayes. W zasadzie naiwny
Bayes traktuje każdy dokument jako nieuporządkowany zbiór słów i klasyfikuje je według dopasowania
dystrybucja dokumentu z najbardziej zbliżoną dystrybucją folderu/skrzynki pocztowej.
OPCJE
-b, --db-plik=filet
Lokalizacja do odczytu/zapisu bazy danych ifile. Domyślnie jest ~/.idata
-c, --zwięzły
odpowiednik „ifile -v 0 | głowa -1 | cięcie -f1 -d". Należy używać z -q or -Q.
-d, --kasować=falcówka
Usuń statystyki dla każdego z nich pliki z kategorii falcówka
-f, --folder-calcs=falcówka
Pokaż obliczenia prawdopodobieństwa słów dla falcówka
-g, --plik dziennika
Twórz i przechowuj informacje debugowania w ~/.plik.log
-i, --wstawić=falcówka
Dodaj statystyki dla każdego pliku do kategorii falcówka
-k, --utrzymuj-rzadko
Pozostaw w bazie słowa, które pojawiają się rzadko (zwykle są odrzucane)
-l, --query-loocv=falcówka
Dla każdego z plików tymczasowo usuwa plik z falcówka, wykonuje zapytanie i
następnie ponownie wstawia plik falcówka. Baza danych nie jest modyfikowana.
-o, --zdarzać się
Wykorzystuje reprezentację wektora bitowego dokumentu. Policz każde słowo raz w dokumencie.
-q, --zapytanie
Wyniki oceny wyników dla każdego z plików
-Q, --wstaw zapytanie
Dla każdego pliku uzyskaj ocenę wyników i dodaj statystyki dla folderu z
najwyższy wynik
-T, --próg=próg
W przypadku użycia z obydwoma -c i -q, wypisz dwie kategorie o najwyższym rankingu, jeśli ich
wynik różni się co najwyżej próg / 1000, który może zostać użyty do wykrycia granicy
sprawy. Kiedy używany z -q tylko i jakiekolwiek próg > 0, wyprowadź różnicę punktów
odsetek. Na przykład,
jeśli nie -T1 -q foo.txt
może spowodować
spam -15570.48640776
nie spam -18728.00272369
diff[spam,niespam](%) 9.21
Jeśli tak, to
jeśli nie -T93 -q -c foo.txt
spowoduje
foo.txt spam, nie-spam
natomiast
jeśli nie -T92 -q -c foo.txt
spowoduje
foo.txt spam
-r, --reset danych
Usuwa wszystkie aktualnie zapisane informacje
-u, --aktualizacja=falcówka
To samo co „wstaw”, z tą różnicą, że dodaje statystyki tylko wtedy, gdy falcówka już istnieje
-v, --gadatliwość=num
Ilość danych wyjściowych podczas działania: 0=cichy, 1=cichy, 2=postęp, 3=pełny, 4=debugowanie
Opcje Lexingu:
-a, --alfa-lekser
Słowa Lexa jako ciągi znaków alfabetu (domyślnie)
-A, --alpha-only-lexer
Tylko sekwencje znaków oddzielonych spacjami Lex, które składają się w całości
znaki alfabetyczne
-h, --nagłówek paska
Pomiń wszystkie wiersze nagłówka z wyjątkiem Temat:, Od: i Do:
-m, --maksymalna długość=zwęglać
Najpierw zignoruj część wiadomości zwęglać postacie. Użyj całej wiadomości, jeśli zwęglać
ustawiona na 0. Wartość domyślna to 50,000 XNUMX.
-p, --tokeny drukujące
Po prostu tokenizuj i drukuj, nie wykonuj żadnego innego przetwarzania. Dokumenty zwracane są jako
lista słów i par częstotliwości.
-s, --no-stoplist
Nie wyrzucaj zbyt częstych (stoplist) słów podczas leksykowania
-S, --przybitka
Używaj algorytmu macierzystego „Portera” podczas leksyfikowania dokumentów
-w, --biały-lekser
Słowa Lexa jako ciągi znaków oddzielonych spacjami
Jeśli w wierszu poleceń nie podano żadnych plików, ifile użyje standardowego wejścia
wiadomość do przetworzenia.
-?, --help
Podaj tę listę pomocy
--stosowanie
Podaj krótką wiadomość dotyczącą użytkowania
-V, --wersja
Wydrukuj wersję programu
Obowiązkowe lub opcjonalne argumenty do długich opcji są również obowiązkowe lub opcjonalne dla każdego
odpowiednie krótkie opcje.
Użyj ifile online, korzystając z usług onworks.net