GoGPT Best VPN GoSearch

OnWorks 网站图标

wwwstat - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 wwwstat

这是 wwwstat 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


wwwstat - 汇总 WWW 服务器 (httpd) 访问统计信息

概要


万维网统计 [-F 系统配置[-f 用户配置[选项...] [--[ 摘要 | 日志文件 | + | -
] ...

商品描述


万维网统计 读取一个序列 httpd的 通用日志文件格式 (CLF) access_log 文件和/或
万维网统计 输出摘要文件和/或标准输入和输出摘要
HTML 中的访问统计信息。

建立 万维网统计 不对输入文件进行任何更改或将任何文件写入
服务器目录,它可以由任何对输入日志文件和
摘要文件。 这允许网站管理员以外的人运行专门的分析
只是他们有兴趣总结的事情。

万维网统计 提供万维网 (WWW) 访问统计信息,这不一定
对应于个人用户的统计数据。 它计算的数量 HTTP 要求
服务器接收到的字节数以及响应这些请求而传输的字节数,
根据日志文件中的内容,并将这些计数输出为表
请求的类别。

万维网统计 可以通过以下方式读取输出摘要 统计数据 生成汇总的精美图表
统计数据。 这 拆分日志 程序可用于将大型日志文件拆分为单独的文件
通过条目前缀或 URL 路径。

万维网统计 是一个 perl的 脚本,这意味着你需要有一个 perl的 解释器运行
程序。 它已经过测试 perl的 版本 4.036 和 5.002。

输出
万维网统计的输出由一组交叉引用链接、总和和平均值组成
对于处理过的数据,以及一系列按类别划分的表
部分。 部分类别基于访问权限中明显的特征
请求,由通用日志文件格式提供(请参阅 附注)。 这些包括:

请求日期,例如“2 年 1996 月 XNUMX 日”

请求时间,例如“00”到“23”

客户端域 完全限定域名 (FQDN) 后缀,对应于
组织类型或国家名称。

反向子域 FQDN,通常减去第一个(机器名称)组件,以及
颠倒,以便在排序时更容易阅读。

基于请求 URI 或非成功状态代码的 URL/归档分组。

身份 基于 IdentityCheck 令牌或授权字段的用户身份。

可以使用配置文件或命令行选项启用/禁用每个部分
(见 部分 屏 显: 可选项).

输出 格式
在每个部分中,统计信息以预先格式化的表格形式呈现。

%Reqs %Byte 字节发送请求 类别类型
----- ----- ------------ -------- |----------------
NN.NN NN.NN NNNNNNNNNNNN NNNNNNNN | 类别值
100.0 100.0 NNNNNNNNNNNNNNNNNNNN | 类别值

Requests 收到的此类别值的请求。
Bytes Sent 为此类别值传输的字节数。
%请求 ( / )*100。
%字节 ( / )*100。

该表可以按类别值(-种类 ), 收到的请求数 (-种类
REQ),或接收到的字节数 (-种类 字节)。 也可以限制在 -最佳 N
条目。

配置


配置 可选项
这些选项定义了如何 万维网统计 应该建立默认值并解释命令行。

-F 文件名
从给定文件中获取系统配置默认值。 如果使用,这 必须
命令行上的第一个参数,因为它需要在
其他命令选项。 文件 wwwstat.rc 包含在发行版中作为
此文件的示例; 它包含了 perl的 直接设置控件的源代码
和显示选项提供 万维网统计。 如果 文件名 不是路径名,
包含路径(见 FILES) 被搜索 文件名. 一个空字符串作为 文件名
将禁用此功能。 [-F “wwwstat.rc”]

-f 文件名
从给定文件中获取用户配置默认值。 如果使用,这 必须
后命令行上的第一个参数 -F (如果有的话)。 文件格式相同
至于 -F 选项(见 wwwstat.rc)。 如果 文件名 不是路径名,包含
路径(见 FILES) 被搜索 文件名. 一个空字符串作为 文件名
禁用此功能。 [-f ".wwwstatrc"]

-- 最后一个选项(其余参数被视为输入文件)。

诊断 可选项
这些选项提供有关 万维网统计 用法或关于某些不寻常的方面
正在处理的日志文件。

-h 帮助 - 向 STDERR 显示使用信息,然后退出。

-v 详细显示每个已处理日志条目的 STDERR。

-x 向 STDERR 显示导致 HTTP 错误响应的所有请求。

-e 向 STDERR 显示所有无效的日志条目。 如果出现以下情况,可能会出现无效的日志条目
服务器正在错误写入或覆盖自己的日志,如果请求是由损坏的
客户端或代理,或者如果恶意攻击者试图获得对
你的系统。 对于后一个原因,网站管理员应该运行 万维网统计 与此
定期选择。

屏 显: 可选项
这些选项修改输出格式。

-H 绳子
使用给定的字符串作为 HTML 标题和输出标题。

-X 绳子
使用给定的字符串作为最后一个摘要输出的交叉引用 URL。 任何
出现的字符 "%M" 或 "%Y" 被月份和年份替换,
分别为第一个日志条目日期之前的月份。 空字符串
将排除任何交叉引用。

-R 显示反向排序的每日统计表。 这个选项主要是为了使用
统计数据 用于生成输出图形的程序。

-l
-L 来自-l) 或不要 (-L) 显示本地域中客户端的完整 DNS 主机名
(由 $AppendToLocalhost 的配置值决定)在部分
关于子域统计。 默认 [-L] 是从本地剥离机器名称
地址。

-o
-O 来自-o) 或不要 (-O) 显示本地外部客户端的完整 DNS 主机名
域在子域统计部分。 默认 [-O] 是剥离
来自外部地址的机器名称。

-u
-U 来自-u) 或不要 (-U) 显示未解析域的客户端的 IP 地址
子域统计部分中的名称。 这 -DNS 选项可用于
解析一些名称,但并非所有 IP 主机都有 DNS 名称(SLIP/PPP 连接)和
有时无法访问主机的 DNS 服务。 默认 [-U] 是将所有
“未解决”类别下的此类地址。

-DNS
-点头 来自-DNS) 或不要 (-点头) 使用系统的主机名查找工具来查找
与任何未解析的 IP 地址相关联的 DNS 主机名。 查找 DNS 名称可能
be 非常 慢,特别是当结果为负时(没有 DNS 名称),这是
为什么还包括缓存功能。 [-点头]

-缓存 文件名
使用给定的 DBM 数据库作为读/写持久 DNS 缓存(.dir 和
.pag 扩展名会自动附加)。 缓存条目(包括否定
结果)在为 $DNSexpires [两个月] 配置的时间后被删除。 不
如果执行缓存 文件名 是空字符串,如果您的
系统不支持 DBM 或 NDBM 功能。 跑步 -DNS 没有
不推荐持久缓存。 [-缓存 “DNS缓存”]

-截断 N
截断存档部分中列出的 URL 第N个 层级。 这个
选项通常用于减少输出大小和内存要求
万维网统计 通过按目录树对请求进行分组而不是列出每个 URL。
默认 [-截断 0] 是显示每个请求的 URL。

文件
-没有文件
来自文件) 或不要 (-没有文件) 包括 URL 的最后一个组件(通常是
文件名)在存档部分。 此选项通常用于减少输出
大小和内存要求 万维网统计 通过按目录对请求进行分组
而不是列出每个 URL。 默认 [文件] 是显示整个
请求的网址。

-链接
-无链接
来自-链接) 或不要 (-无链接) 在每个存档 URL 周围添加超文本链接。 这个
选项对于本地维护很有用,但不推荐用于发布
HTML 结果(通常会导致链接到临时或不存在的
资源,并将人/机器人引导到可能不公开的资源
可用的)。 [-无链接]

-cgi
-诺吉 来自-cgi) 或不要 (-诺吉) 使用 CGI 头字段作为摘要输出的前缀
适用于 HTTP 公共网关接口。 使用 万维网统计 作为 CGI
不推荐使用脚本 - 通常最好运行 wwwstat 程序
定期并提供静态输出文件。 [-诺吉]

部分 屏 显: 可选项
这些选项会更改整个部分的显示(而不是其中的条目)
那些部分)。 它们允许用户启用或禁用整个部分,设置
该部分的排序方法,并限制显示的条目数
部分。 这些选项是上下文相关的,并按照给定的顺序进行处理。

-all
-诺尔 包括 (-all) 或排除 (-诺尔) 所有显示部分。 这 -诺尔 选项
通常在一个或多个其他部分选项之前使用,例如
仅显示列出的部分。

-日常
-没有每日
包括 (-日常) 或排除 (-没有每日) 按请求日期统计的部分
并为以后设置范围 -种类-最佳 本节的选项。

-每小时
-每小时
包括 (-每小时) 或排除 (-每小时) 按请求小时统计的部分
并为以后设置范围 -种类-最佳 本节的选项。

-领域
-无域
包括 (-领域) 或排除 (-无域) 客户的统计部分
Internet 域并为以后设置范围 -种类-最佳 本节的选项。

-子域
-无子域
包括 (-子域) 或排除 (-无子域) 统计部分
客户端的 Internet 子域(反转显示)并设置范围以供以后使用
-种类-最佳 本节的选项。

-档案
-无存档
包括 (-档案) 或排除 (-无存档) 要求的统计部分
URL/归档并为以后设置范围 -种类-最佳 本节的选项。

-r
-身份
-noident
包括 (-r or -身份) 或排除 (-noident) 统计部分
用户的身份(如果 IdentityCheck 为 ON)或身份验证用户 ID(如果
提供)并为以后设置范围 -种类-最佳 本节的选项。 DO
不是 发布 此信息,因为这将揭示与安全相关的身份和
是对隐私的侵犯。 提供此选项用于管理目的
只。

-种类 (键|字节|请求)
按其主键、传输的字节数或
收到的请求数。 [-种类 ]

-最佳 N 仅显示此部分的前 N ​​个条目。 此选项假定 -种类
选项已设置为字节或请求。

-两个都 显示此部分的前 N ​​个条目 [10,按请求排序],然后
按关键字排序的完整部分(所有条目)。

搜索 可选项
这些选项用于将分析限制为与模式匹配的请求。 图案
以一种形式提供 perl的 定期 表达,除了字符“+”和
“。” 会自动转义,除非 -无处可逃 给出了选项。 附上图案
在单引号中,以防止命令 shell 解释某些特殊字符。

多次出现相同的选项会导致正则表达式的 OR 运算。
搜索选项仅适用于日志文件条目; 任何摘要文件输入都必须是
使用相同的搜索选项创建。

-a 正则表达式
-A 正则表达式
包括 (-a) 或排除 (-A) 包含主机名/IP 地址匹配的所有请求
给定的 perl 正则表达式。

-c 正则表达式
-C 正则表达式
包括 (-c) 或排除 (-C) 导致的所有请求 HTTP 状态码匹配
给定的 perl 正则表达式。

-d 正则表达式
-D 正则表达式
包括 (-d) 或排除 (-D) 发生在某个日期的所有请求(例如,“2 年 1994 月 XNUMX 日”)
匹配给定的 perl 正则表达式。

-t 正则表达式
-T 正则表达式
包括 (-t) 或排除 (-T) 一小时内发生的所有请求(例如,“23”是
11pm - 12pm) 匹配给定的 perl 正则表达式。

-m 正则表达式
-M 正则表达式
包括 (-m) 或排除 (-M) 所有使用 HTTP 方法的请求(例如,“HEAD”)
匹配给定的 perl 正则表达式。

-n 正则表达式
-N 正则表达式
包括 (-n) 或排除 (-N) 与 URL(存档名称)匹配的所有请求
给定 perl 正则表达式。

-无处可逃
不要对其余搜索选项中的特殊字符(“+”和“.”)进行转义。

INPUT


解析选项后,命令行上的剩余参数被视为
输入参数并按给定的顺序读取。 如果没有给出输入参数,则
读取配置的默认日志文件 [+].

- 从标准输入 (STDIN) 读取。

+ 读取默认日志文件。 [按配置]

文件名...
读取给定的文件并从第一行确定它是否是前一个
输出摘要或 CLF 日志文件。 如果 文件名的扩展名表明是
压缩 (gz|z|Z),然后通过配置的解压程序管道它
[拉链 -c] 第一的。 摘要文件必须使用相同(或相似)的
配置和命令行选项作为当前运行的程序; 如果不,
奇怪的事情会发生。

用法


万维网统计 用于多种用途:

o 作为测量服务器活动的诊断实用程序,查找不正确的 URL
引用,并检测尝试滥用服务器;

o 作为衡量技术或信息传输的公共关系工具(即,
消息传出去了吗? 给合适的人?);

o 作为一种存档工具,用于随时间跟踪 Web 使用情况,而无需存储整个
日志文件; 和,

o 大多数情况下,作为一种简单的机制来证明所有辛勤工作的合理性
创建人们请求的网络内容。

在多数情况下, 万维网统计 由定期(每晚、每周和/或每月)运行
包装程序作为 crontab中 午夜后不久进入,通常与
旋转当前日志文件。 输出通常被定向到一个临时文件,该文件
以后可以移动到发布的位置。 临时文件是必要的,以避免
在 wwwstat 的处理过程中删除您发布的文件(如果
有人试图从您的网站上获取它)。

万维网统计 可以作为 CGI 脚本运行(-cgi),但不建议这样做,除非输入
日志文件非常小。

所有命令行选项,以及一些无法从
命令行,可以在用户和系统配置文件中更改(请参阅
wwwstat.rc)。 这些文件实际上是 perl的 作为一部分执行的库模块
程序的初始化。 随发行版提供的示例包括
关于可以设置哪些变量及其值范围的完整文档。

Perl的 原价 表达式
搜索选项和许多配置文件设置允许充分利用 perl
正则表达式(除了 -a、-A、-n 和 -N 选项处理“+”和
'.' 字符作为正常的字母字符,除非它们前面有 -无处可逃
选项)。 大多数人只需要知道以下特殊字符:

^ 在模式的开始,意思是“以模式开始”。
$ 在模式结束时,表示“以模式结束”。
(......) 将模式元素分组为单个元素。
? 匹配前面的元素零次或一次。
* 匹配前面的元素零次或多次。
+ 匹配前面的元素一次或多次。
. 匹配任何单个字符。
[...] 表示要匹配的一类字符。 [^...] 否定类。 一个班级里面,
'-' 表示一个字符范围。
(A|B|C) 如果 A 或 B 或 C 匹配,则匹配。

根据您的命令外壳,某些特殊字符可能需要在
命令行或用单引号括起来以避免 shell 解释。

示例


总结来自商业领域的请求。
万维网统计 -a '.com$'

汇总来自主机 kiwi.ics.uci.edu 的请求
万维网统计 -a '^kiwi.ics.uci.edu$'

总结不是来自 kiwi.ics.uci.edu 的请求
万维网统计 -A '^kiwi.ics.uci.edu$'

汇总导致临时重定向的请求
万维网统计 -c '302'

汇总导致服务器错误的请求
万维网统计 -c '^5'

总结不成功的请求
万维网统计 -C '^2' -C '304'

每月第一周汇总请求
万维网统计 -d ' [1-7] '

每月第二周汇总请求
万维网统计 -d ' ([89]|1[0-4]) '

每月第三周汇总请求
万维网统计 -d ' (1[5-9]|2[01]) '

每月第四周汇总请求
万维网统计 -d ' 2[2-8] '

总结当月剩余天数的请求
万维网统计 -d ' (29|30|31) '

总结二月的请求
万维网统计 -d '二月'

总结 1994 年的请求
万维网统计 -d '1994'

总结不在四月的请求
万维网统计 -D '四月'

总结午夜到凌晨 1 点之间的请求
万维网统计 -t '00'

汇总中午到下午 1 点之间未收到的请求
万维网统计 -T '12'

使用 gif 扩展名汇总请求
万维网统计 -n '.gif$'

汇总用户 URL 下的请求
万维网统计 -n '^/~用户/'

汇总不在“隐藏”路径下的请求
万维网统计 -N '/隐/'

环境


主页 用户主目录的位置,放在 INC 路径上。

日志目录 如果后者未定义,则使用代替 HOME。

珍珠棉 以冒号分隔的目录列表,在其中查找 include 和
配置文件。

使用 onworks.net 服务在线使用 wwwstat


免费服务器和工作站

下载 Windows 和 Linux 应用程序

Linux 命令

Ad




×
广告
❤️在这里购物、预订或购买——免费,有助于保持服务免费。