Este es el archivo de comando que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
ifile - ejecutable principal para el sistema de filtrado de correo ifile
SINOPSIS
Ifile [-b presentar] [-q|-Q] [-g] [-k] [-o] [-v número] [lexing opciones] presentar ...
Ifile -c -q|-Q [-T umbral] [-b presentar] [-g] [-k] [-o] [lexing opciones] presentar ...
Ifile [-b presentar] [-d carpeta] [-i carpeta|-u carpeta] [-g] [-k] [-o] [-v número] [lexing opciones]
presentar ...
Ifile -r [-b presentar]
DESCRIPCIÓN
Ifile es un cliente de filtro de correo que utiliza el aprendizaje automático para clasificar el correo electrónico en
carpetas / buzones de correo. El algoritmo que utiliza se llama Naive Bayes. Básicamente, ingenuo
bayes considera cada documento como una colección desordenada de palabras y clasifica haciendo coincidir
la distribución del documento con la distribución de carpeta / buzón más cercana.
CAMPUS
-b, - archivo -db=presentar
Ubicación para leer / almacenar la base de datos de archivos. El valor predeterminado es ~ / .idata
-c, --conciso
equivalente de "ifile -v 0 | cabeza -1 | Corte -f1 -d". Debe utilizarse con -q or -Q.
-d, --Eliminar=carpeta
Eliminar las estadísticas de cada uno de archivos de la categoría carpeta
-f, --carpeta-calcs=carpeta
Muestre los cálculos de probabilidad de palabras para carpeta
-g, --archivo de registro
Cree y almacene información de depuración en ~ / .ifile.log
-i, --insertar=carpeta
Agregue las estadísticas de cada uno de los archivos a la categoría carpeta
-k, --mantenimiento-infrecuente
Deje en la base de datos las palabras que ocurren con poca frecuencia (normalmente se tiran)
-l, --query-loocv=carpeta
Para cada uno de los archivos, elimina temporalmente el archivo de carpeta, realiza consulta y
luego vuelve a insertar el archivo en carpeta. La base de datos no se modifica.
-o, --ocurrir
Utiliza la representación de vectores de bits del documento. Cuente cada palabra una vez por documento.
-q, --consulta
Puntajes de calificación de salida para cada uno de los archivos
-Q, --consulta-insertar
Para cada uno de los archivos, genere puntajes de calificación y agregue estadísticas para la carpeta con
el puntaje más alto
-T, --umbral=umbral
Cuando se usa con ambos -c y -q, generar las dos categorías de clasificación más alta si su
la puntuación difiere como máximo umbral / 1000, que se puede utilizar para detectar bordes
casos. Cuando se usa con -q solo y cualquiera umbral > 0, muestra la diferencia de puntuación
porcentaje. Por ejemplo,
Ifile -T1 -q foo.txt
podría resultar en
correo no deseado -15570.48640776
no spam -18728.00272369
diff [spam, no spam] (%) 9.21
Si es así, entonces
Ifile -T93 -q -c foo.txt
resultará en
foo.txt spam, no spam
mientras
Ifile -T92 -q -c foo.txt
resultará en
spam foo.txt
-r, --reiniciar datos
Borra toda la información almacenada actualmente
-u, --actualizar=carpeta
Igual que 'insertar' excepto que solo agrega estadísticas si carpeta ya existe
-v, --verbosidad=número
Cantidad de salida mientras se ejecuta: 0 = silencioso, 1 = silencioso, 2 = progreso, 3 = detallado, 4 = depuración
Opciones de Lexing:
-a, --alfa-lexer
Palabras Lex como secuencias de caracteres alfabéticos (predeterminado)
-A, --alpha-solo-lexer
Solo las secuencias de caracteres lex separadas por espacios que se componen en su totalidad de
caracteres alfabéticos
-h, --strip-encabezado
Omita todas las líneas de encabezado excepto Asunto :, De: y Para:
-m, --longitud máxima=tanque
Ignorar parte del mensaje después del primero tanque caracteres. Use el mensaje completo si tanque
establecido en 0. El valor predeterminado es 50,000.
-p, - tokens de impresión
Simplemente tokenice e imprima, no realice ningún otro procesamiento. Los documentos se devuelven como
una lista de palabras, pares de frecuencias.
-s, --no-lista de paradas
No arroje palabras demasiado frecuentes (listas cortas) al leer
-S, --despalillado
Utilice el algoritmo de derivación 'Porter' cuando lexing documentos
-w, --blanco-lexer
Palabras Lex como secuencias de caracteres separados por espacios
Si no se especifican archivos en la línea de comando, ifile usará la entrada estándar como su
mensaje a procesar.
-?, --ayuda
Dar esta lista de ayuda
--uso
Dar un breve mensaje de uso
-V, --versión
Versión del programa de impresión
Los argumentos obligatorios u opcionales para opciones largas también son obligatorios u opcionales para cualquier
correspondientes opciones cortas.
Use ifile en línea usando los servicios de onworks.net