Este es el comando wwwstat que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
wwwstat: resume las estadísticas de acceso al servidor WWW (httpd)
SINOPSIS
wwwstat [-F configuración_sistema] [-f usuario_config] [opciones...] [--] [ resumen | archivo de registro | + | -
] ...
DESCRIPCIÓN
wwwstat lee una secuencia de httpd archivos de acceso al formato de archivo de registro común (CLF) y / o
antes wwwstat archivos de resumen de salida y / o la entrada y salidas estándar un resumen de la
estadísticas de acceso en HTML.
Since wwwstat no realiza ningún cambio en los archivos de entrada ni escribe ningún archivo en el
directorios del servidor, puede ser ejecutado por cualquier usuario con acceso de lectura a los archivos de registro de entrada y
archivo (s) de resumen. Esto permite que otras personas, además del webmaster, realicen análisis especializados.
de las cosas que les interesa resumir.
wwwstat proporciona estadísticas de acceso a la World Wide Web (WWW), que no necesariamente
corresponden a estadísticas sobre usuarios individuales. Cuenta el número de HTTP solicitudes
recibidos por el servidor y la cantidad de bytes transmitidos en respuesta a esas solicitudes,
de acuerdo con lo que está en el (los) archivo (s) de registro, y genera esos recuentos como tablas desglosadas por
categoría de solicitud.
wwwstat los resúmenes de salida pueden ser leídos por gwstat para producir gráficos elegantes del resumen
Estadísticas. los registro dividido El programa se puede utilizar para dividir un archivo de registro grande en archivos separados.
por prefijo de entrada o ruta URL.
wwwstat es un perl script, lo que significa que debe tener un perl intérprete para ejecutar el
programa. Ha sido probado con perl versiones 4.036 y 5.002.
Salida Secciones
wwwstatLa salida consta de un conjunto de enlaces de referencia cruzada, la suma total y los promedios
para los datos procesados, y una secuencia de tablas de cantidad por categoría divididas en
secciones. Las categorías de sección se basan en las características evidentes del acceso
solicitud, según lo dispuesto por el formato de archivo de registro común (consulte NOTAS) Éstas incluyen:
Fecha de solicitud, p. Ej., "2 de febrero de 1996"
Solicitar hora, por ejemplo, "00" a "23"
Dominio del cliente El sufijo del nombre de dominio completo (FQDN) que corresponde a un
tipo de organización o nombre del país.
Subdominio invertido El FQDN, generalmente menos el primer componente (nombre de la máquina), y
invertido para que sea más fácil de leer cuando se ordenan.
Agrupación de URL / archivo basada en Request-URI o código de estado de no éxito.
Identity La identidad del usuario basada en el token IdentityCheck o el campo de autorización.
Cada sección se puede habilitar / deshabilitar usando los archivos de configuración o las opciones de la línea de comandos
(consulta: Sección Visualización ).
Salida Tabla Formato
Dentro de cada sección, las estadísticas se presentan como una tabla preformateada.
% Solicitudes% Byte Bytes Solicitudes enviadas tipo de categoría
----- ----- ------------ -------- | ---------------
NN.NN NN.NN NNNNNNNNNNNN NNNNNNNN | valor de categoría
100.0 100.0 NNNNNNNNNNNN NNNNNNNN | valor de categoría
Solicitudes Solicitudes recibidas para este valor de categoría.
Bytes enviados Bytes transmitidos para este valor de categoría.
% Requerimientos ( / ) * 100.
% Byte ( / ) * 100.
La tabla se puede ordenar por categoría-valor (-clasificar clave), número de solicitudes recibidas (-clasificar
req), o el número de bytes recibidos (-clasificar byte). También puede limitarse a -parte superior N
entradas.
OPCIONES
Configuration
Estas opciones definen cómo wwwstat debe establecer valores predeterminados e interpretar la línea de comandos.
-F nombre de archivo
Obtenga los valores predeterminados de configuración del sistema del archivo dado. Si se usa, este deben ser la
primer argumento en la línea de comandos, ya que debe interpretarse antes de la
otras opciones de comando. El archivo wwwstat.rc se incluye con la distribución como un
ejemplo de este archivo; contiene perl código fuente que establece directamente el control
y opciones de visualización proporcionadas por wwwstat. Si nombre de archivo no es un nombre de ruta, el
incluir ruta (ver ARCHIVOS) se busca nombre de archivo. Una cadena vacía como nombre de archivo
desactivará esta función. [-F "wwwstat.rc"]
-f nombre de archivo
Obtenga los valores predeterminados de configuración del usuario del archivo dado. Si se usa, este deben ser la
primer argumento en la línea de comandos después -F (Si alguna). El archivo tiene el mismo formato
En cuanto a -F opción (ver wwwstat.rc) Si nombre de archivo no es un nombre de ruta, la inclusión
camino (ver ARCHIVOS) se busca nombre de archivo. Una cadena vacía como nombre de archivo will
desactivar esta función. [-f ".wwwstatrc"]
-- Última opción (los argumentos restantes se tratan como archivos de entrada).
Diagnóstico
Estas opciones proporcionan información sobre wwwstat uso o sobre algunos aspectos inusuales de la
archivo (s) de registro en proceso.
-h Ayuda: muestra información de uso en STDERR y luego sale.
-v Visualización detallada a STDERR de cada entrada de registro procesada.
-x Muestre a STDERR todas las solicitudes que resulten en respuestas de error HTTP.
-e Mostrar a STDERR todas las entradas de registro no válidas. Pueden producirse entradas de registro no válidas si
El servidor está escribiendo mal o sobrescribiendo su propio registro, si la solicitud la realiza un
cliente o proxy, o si un atacante malintencionado está tratando de obtener acceso privilegiado a
tu sistema. Por este último motivo, el webmaster debe ejecutar wwwstat con este
opción de forma regular.
Visualización
Estas opciones modifican el formato de salida.
-H cadena
Utilice la cadena dada como título HTML y encabezado para la salida.
-X cadena
Utilice la cadena proporcionada como URL de referencia cruzada al último resultado de resumen. Alguna
la aparición de los caracteres "% M" o "% Y" se sustituyen por el mes y el año,
respectivamente, del mes anterior a la primera fecha de entrada del registro. La cuerda vacía
excluirá cualquier referencia cruzada.
-R Muestra la tabla de estadísticas diarias ordenada al revés. Esta opción es principalmente para usar
con el gwstat programa para producir gráficos de la salida.
-l
-L Hacer (-l) o no (-L) muestra el nombre de host DNS completo de los clientes en su dominio local
(que está determinado por el valor configurado de $ AppendToLocalhost) en la sección
sobre estadísticas de subdominios. El valor por defecto [-L] es quitar el nombre de la máquina de local
Direcciones.
-o
-O Hacer (-o) o no (-O) muestra el nombre de host DNS completo de los clientes fuera de su local
dominio en la sección de estadísticas de subdominios. El valor por defecto [-O] es desnudar el
nombre de la máquina de direcciones externas.
-u
-U Hacer (-u) o no (-U) muestra la dirección IP de los clientes con dominio sin resolver
nombres en la sección de estadísticas de subdominios. los -dns La opción se puede utilizar para
resolver algunos nombres, pero no todos los hosts IP tienen un nombre DNS (conexiones SLIP / PPP) y
a veces, el servicio DNS de un host es inaccesible. El valor por defecto [-U] es agrupar todo
tales direcciones en la categoría "No resuelto".
-dns
-asiente Hacer (-dns) o no (-asiente) utilizar las funciones de búsqueda de nombre de host del sistema para encontrar el
Nombre de host DNS asociado con cualquier dirección IP no resuelta. Buscar un nombre DNS puede
be Y mucho lento, especialmente cuando los resultados son negativos (sin nombre DNS), que es
por qué también se incluye una capacidad de almacenamiento en caché. [-asiente]
-cache nombre de archivo
Utilice la base de datos DBM dada como caché de DNS persistente de lectura / escritura (el .dir y
Las extensiones .pag se agregan automáticamente). Entradas en caché (incluidas las negativas
resultados) se eliminan una vez que expira el tiempo configurado para $ DNS [dos meses]. No
el almacenamiento en caché se realiza si nombre de archivo es la cadena vacía, que puede ser necesaria si su
El sistema no admite la funcionalidad DBM o NDBM. Corriendo -dns sin un
No se recomienda la caché persistente. [-cache "dnscache"]
-trunc N
Truncar las URL enumeradas en la sección de archivo después de la Enésimo nivel jerárquico. Esta
La opción se usa comúnmente para reducir el tamaño de salida y los requisitos de memoria de
wwwstat agrupando las solicitudes por árbol de directorio en lugar de enumerar cada URL.
El valor por defecto [-trunc 0] es mostrar todas las URL solicitadas.
-archivos
-sin archivos
Hacer (-archivos) o no (-sin archivos) incluyen el último componente de una URL (normalmente el
nombre de archivo) en la sección de archivo. Esta opción se usa comúnmente para reducir la salida
requisitos de tamaño y memoria de wwwstat agrupando las solicitudes por directorio
en lugar de enumerar todas las URL. El valor por defecto [-archivos] es mostrar todo el
URL solicitada.
-enlace
-No hay enlace
Hacer (-enlace) o no (-No hay enlace) agregue un enlace de hipertexto alrededor de cada URL de archivo. Esta
La opción es útil para el mantenimiento local, pero no se recomienda su publicación.
de los resultados HTML (a menudo da como resultado enlaces a
recursos, y lleva a las personas / robots a recursos que podrían no ser públicamente
disponible). [-No hay enlace]
-cgi
-nocgi Hacer (-cgi) o no (-nocgi) prefija la salida resumida con campos de encabezado CGI
apropiado para su uso con la interfaz de puerta de enlace común HTTP. Utilizando wwwstat como CGI
no se recomienda la secuencia de comandos; por lo general, es mejor simplemente ejecutar el programa wwwstat
periódicamente y sirva el archivo de salida estático. [-nocgi]
Sección Visualización
Estas opciones cambian la visualización de secciones enteras (a diferencia de las entradas dentro
esas secciones). Permiten al usuario habilitar o deshabilitar una sección completa, configurar el
método de clasificación para esa sección, y limitar el número de entradas mostradas para esa
sección. Estas opciones son sensibles al contexto y se procesan en el orden indicado.
-todas
-No todo Incluir (-todas) o excluir (-No todo) todas las secciones de visualización. los -No todo opción
se usa comúnmente justo antes de una o más de las otras opciones de sección, de modo que
solo se muestran las secciones enumeradas.
-diario
-nodamente
Incluir (-diario) o excluir (-nodamente) la sección de estadísticas por fecha de solicitud
y establecer el alcance para más tarde -clasificar y -parte superior opciones a esta sección.
-cada hora
-nohoras
Incluir (-cada hora) o excluir (-nohoras) la sección de estadísticas por hora de solicitud
y establecer el alcance para más tarde -clasificar y -parte superior opciones a esta sección.
-dominio
-nodominio
Incluir (-dominio) o excluir (-nodominio) la sección de estadísticas por parte del cliente
Dominio de Internet y establecer el alcance para más adelante -clasificar y -parte superior opciones a esta sección.
-subdominio
-nosubdominio
Incluir (-subdominio) o excluir (-nosubdominio) la sección de estadísticas de la
subdominio de Internet del cliente (invertido para mostrar) y establezca el alcance para más tarde
-clasificar y -parte superior opciones a esta sección.
-archivo
-noarchivo
Incluir (-archivo) o excluir (-noarchivo) la sección de estadísticas por solicitado
URL / archivo y establezca el alcance para más tarde -clasificar y -parte superior opciones a esta sección.
-r
-identificador
-noident
Incluir (-r or -identificador) o excluir (-noident) la sección de estadísticas de la
identidad del usuario (si IdentityCheck está activado) o el ID de usuario de autenticación (si
suministrado) y establezca el alcance para más tarde -clasificar y -parte superior opciones a esta sección. DO
PUBLICAR esta información, ya que revelaría identidades relacionadas con la seguridad y
ser una violación de la privacidad. Esta opción se proporciona con fines administrativos.
solamente.
-clasificar (clave | byte | req)
Ordene esta sección por su clave principal, el número de bytes transmitidos o el
número de solicitudes recibidas. [-clasificar clave]
-parte superior N Muestra solo las N entradas principales para esta sección. Esta opción asume que el -clasificar
La opción se ha establecido en bytes o solicitudes.
-ambos Muestre las dos N entradas principales para esta sección [10, ordenadas por solicitudes] y luego
la sección completa (todas las entradas) ordenadas por clave.
Buscar
Estas opciones se utilizan para limitar el análisis a las solicitudes que coinciden con un patrón. El patrón
se suministra en forma de perl regular expresión, excepto que los caracteres "+" y
"." se escapan automáticamente a menos que el -no hay escapatoria se da la opción. Adjuntar el patrón
entre comillas simples para evitar que el shell de comandos interprete algunos caracteres especiales.
Varias apariciones de la misma opción dan como resultado un OR de las expresiones regulares.
Las opciones de búsqueda solo se aplican a las entradas del archivo de registro; cualquier entrada de archivos de resumen debe haber sido
creado con las mismas opciones de búsqueda.
-a regexp
-A regexp
Incluir (-a) o excluir (-A) todas las solicitudes que contienen una coincidencia de nombre de host / dirección IP
la expresión regular de Perl dada.
-c regexp
-C regexp
Incluir (-c) o excluir (-C) todas las solicitudes que resulten en una HTTP coincidencia de código de estado
la expresión regular de Perl dada.
-d regexp
-D regexp
Incluir (-d) o excluir (-D) todas las solicitudes que se produzcan en una fecha (p. ej., "2 de febrero de 1994")
coincidir con la expresión regular de Perl dada.
-t regexp
-T regexp
Incluir (-t) o excluir (-T) todas las solicitudes que ocurren durante la hora (por ejemplo, "23" es
11 p.m. - 12 p.m.) que coincida con la expresión regular de perl dada.
-m regexp
-M regexp
Incluir (-m) o excluir (-M) todas las solicitudes que utilizan un método HTTP (por ejemplo, "HEAD")
coincidir con la expresión regular de Perl dada.
-n regexp
-N regexp
Incluir (-n) o excluir (-N) todas las solicitudes en una URL (nombre de archivo) que coincida con el
dada la expresión regular de perl.
-no hay escapatoria
No omita los caracteres especiales ("+" y ".") En las opciones de búsqueda restantes.
ENTRADA
Después de analizar las opciones, los argumentos restantes en la línea de comandos se tratan como
argumentos de entrada y se leen en el orden indicado. Si no se dan argumentos de entrada, el
se lee el archivo de registro predeterminado configurado [+].
- Leer desde la entrada estándar (STDIN).
+ Lea el archivo de registro predeterminado. [como configurado]
nombre de archivo...
Lea el archivo dado y determine desde la primera línea si es un archivo anterior.
resumen de salida o un archivo de registro CLF. Si el nombre de archivoLa extensión de 'indica que es
comprimido (gz | z | Z), luego canalícelo a través del programa de descompresión configurado
[pistolas -c] primero. Los archivos de resumen deben haber sido creados con el mismo (o similar)
opciones de configuración y línea de comandos como el programa que se está ejecutando actualmente; que no,
sucederán cosas raras.
USO
wwwstat se utiliza para muchos propósitos:
o como una utilidad de diagnóstico para medir la actividad del servidor, encontrar una URL incorrecta
referencias y detección de intentos de uso indebido del servidor;
o como una herramienta de relaciones públicas para medir la transferencia de tecnología o información (es decir,
¿Se está difundiendo el mensaje? ¿A las personas adecuadas?);
o como una herramienta de archivo para rastrear el uso de la web a lo largo del tiempo sin almacenar todo
archivo de registro; y,
o más a menudo, como un mecanismo fácil para justificar todo el arduo trabajo que se llevó a cabo
creando el contenido web que la gente está solicitando.
En la mayoría de los casos, wwwstat se ejecuta de forma periódica (todas las noches, semanalmente y / o mensualmente) por un
programa de envoltura como crontab entrada poco después de la medianoche, normalmente junto con
rotando el archivo de registro actual. La salida generalmente se dirige a un archivo temporal que
luego se puede mover a una ubicación publicada. El archivo temporal es necesario para evitar
borrar su archivo publicado durante el procesamiento de wwwstat (lo que se vería muy extraño si
alguien intentó OBTENERlo de su web).
wwwstat se puede ejecutar como un script CGI (-cgi), pero eso no se recomienda a menos que la entrada
logfile es muy pequeño.
Todas las opciones de la línea de comandos y algunas opciones que no están disponibles en
línea de comandos, se puede cambiar dentro de los archivos de configuración del usuario y del sistema (consulte
wwwstat.rc). Estos archivos son en realidad perl módulos de biblioteca que se ejecutan como parte de
inicialización del programa. El ejemplo proporcionado con la distribución incluye
documentación completa sobre qué variables se pueden establecer y su rango de valores.
Perl Regular Expresiones
Las opciones de búsqueda y muchos de los ajustes del archivo de configuración permiten el uso completo de perl.
expresiones regulares (con la excepción de que las opciones -a, -A, -n y -N tratan '+' y
'.' caracteres como caracteres alfabéticos normales a menos que estén precedidos por el -no hay escapatoria
opción). La mayoría de las personas solo necesitan conocer los siguientes caracteres especiales:
^ al inicio del patrón, significa "comienza con el patrón".
$ al final del patrón, significa "termina con el patrón".
(...) agrupa los elementos del patrón como un solo elemento.
? coincide con el elemento anterior cero o una vez.
* coincide con el elemento anterior cero o más veces.
+ coincide con el elemento anterior una o más veces.
. coincide con cualquier carácter.
[...] denota una clase de caracteres para que coincida. [^ ...] niega la clase. Dentro de una clase
'-' indica un rango de caracteres.
(A | B | C) coincide si A o B o C coincide.
Dependiendo de su shell de comandos, es posible que algunos caracteres especiales deban escaparse en el
línea de comandos o entre comillas simples para evitar la interpretación del shell.
EJEMPLOS
Resume las solicitudes de dominios comerciales.
wwwstat -a '.com $'
Resumir las solicitudes del host kiwi.ics.uci.edu
wwwstat -a '^ kiwi.ics.uci.edu $'
Resumir solicitudes que no provengan de kiwi.ics.uci.edu
wwwstat -A '^ kiwi.ics.uci.edu $'
Resumir las solicitudes que generan redireccionamientos temporales
wwwstat -c '302'
Resumir las solicitudes que generan errores en el servidor
wwwstat -c '^ 5'
Resumir solicitudes fallidas
wwwstat -C '^ 2' -C '304'
Resumir solicitudes en la primera semana del mes
wwwstat -d ' [1 7-] '
Resumir solicitudes en la segunda semana del mes
wwwstat -d ' ([89] | 1 [0-4]) '
Resumir solicitudes en la tercera semana del mes
wwwstat -d ' (1[5-9]|2[01]) '
Resumir solicitudes en la cuarta semana del mes
wwwstat -d ' 2 [2-8] '
Resumir las solicitudes en los días restantes del mes
wwwstat -d ' (29 | 30 | 31) '
Resumir solicitudes en febrero
wwwstat -d 'Feb'
Resumir solicitudes en el año 1994
wwwstat -d '1994'
Resumir solicitudes no en abril
wwwstat -D 'Abr'
Resumir solicitudes entre la medianoche y la 1 a. M.
wwwstat -t '00'
Resumir las solicitudes no recibidas entre el mediodía y la 1:XNUMX p. M.
wwwstat -T '12'
Resumir solicitudes con una extensión gif
wwwstat -n '.gif $'
Resumir las solicitudes en la URL del usuario
wwwstat -n '^ / ~ usuario /'
Resumir las solicitudes que no se encuentren en rutas "ocultas"
wwwstat -N '/oculto/'
MEDIO AMBIENTE
INICIO Ubicación del directorio de inicio del usuario, ubicado en la ruta INC.
LOGDIR Se usa en lugar de HOME si este último no está definido.
PERLLIB Una lista de directorios separados por dos puntos en los que buscar incluir y
Archivos de configuración.
Utilice wwwstat en línea utilizando los servicios de onworks.net
