这是 qsf 命令,可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
qsf - 快速垃圾邮件过滤器
概要
过滤: s [-snrAtav[-d DB[-g DB]
[-L LVL[-S SUBJ[-H 标记[-Q 民]
[-X 民]
测试: s -T 垃圾邮件 非垃圾邮件 [最大回合[-d DB]
再培训: s -[米|米[-d DB[-w 重量[-ayN]
数据库: s -[p|D|R|O[-d DB]
数据库合并: s -E 其他数据库 [-d DB]
许可名单查询: s -e 邮箱地址 [-m|-M|-t[-d DB[-g DB]
拒绝名单查询: s -y -e 邮箱地址 [-m -m|-M -M|-t[-d DB[-g DB]
帮助: s -[小时|V]
商品描述
s 在标准输入上读取一封电子邮件,默认情况下在标准输出上输出。
如果该电子邮件被确定为垃圾邮件,则会添加一个额外的标题(“X-Spam: YES”),
并且可以选择在主题行前面加上“[SPAM]”。
s 旨在用于 程序邮件(1) 配方,在这样的规则集中:
:0 工作人员
| qsf-ra
:0 小时:
* X-垃圾邮件:是
$HOME/邮件/垃圾邮件
有关更多示例,包括示例 程序邮件(1) 食谱,见 示例 以下部分。
培训
申请早于 s 可以正确使用,需要训练。 一个很好的训练方式 s 是
将所有电子邮件的副本收集到两个文件夹中 - 一个用于垃圾邮件,一个用于非垃圾邮件。
完成此操作后,您可以使用训练功能,如下所示:
qsf -aT 垃圾邮件文件夹非垃圾邮件文件夹
这将生成一个可供使用的数据库 s 猜测是否收到电子邮件
未来是不是垃圾邮件。 请注意,此初始训练运行可能需要很长时间,但是
你应该只需要做一次。
标记一个 单 消息 as 垃圾邮件, 管道它 s 与 --标记垃圾邮件 or -m (“标记为
spam") 选项。这将相应地更新数据库并丢弃电子邮件。
标记一个 单 消息 as 非垃圾邮件, 管道它 s 与 --标记非垃圾邮件 or -M (“标记
作为非垃圾邮件”)选项。同样,这将丢弃电子邮件。
如果消息被错误标记,只需将其发送至 s 作为相反的类型,即如果它
被错误地标记为垃圾邮件,通过管道将其发送到 s --标记非垃圾邮件 --权重=2 添加它
到数据库的非垃圾邮件端,权重是通常的两倍。
配置
这个 s 下面列出了选项。
-d, - 数据库 [类型:]文件
使用 VHDL 语言编写 文件 作为垃圾邮件/非垃圾邮件数据库。 默认是使用 /var/lib/qsfdb 和,
如果它不可用或只读, $HOME/.qsfdb. 这个选项也可以
如果有系统范围的数据库但您不想使用它,则很有用 -
在此处指定您自己的将覆盖默认值。
如果您在文件名前加上 型, 形式 btree:$HOME/.qsfdb,然后这个
将指定什么样的数据库 文件 是,比如 名单, 树, 数据库, 轻石 和
很快。 检查输出 s -V 查看哪些数据库后端可用。
默认是自动检测类型,或者,如果文件不存在,使用
名单。 注意 型 不区分大小写。
-G, - 全球的 [类型:]文件
使用 VHDL 语言编写 文件 作为默认的全局数据库,而不是 /var/lib/qsfdb. 如果你也
指定一个数据库 -d, 那么这个“全局”数据库将以只读方式使用
模式与指定的读写数据库一起使用 -d。 该 -g 选项
可以再次使用以指定第三个数据库,该数据库也将用于
只读模式。 同样,文件名可以选择性地以 型 这
指定数据库类型。
-P, --普通地图 文件
维护所有数据库令牌到它们的非散列对应物的映射 文件,
每行一个令牌。 如果您希望能够列出内容,这会很有用
稍后您的数据库,例如获取电子邮件地址列表
您的允许列表。 请注意,使用此选项可能会变慢 s 下来,只有条目
当此选项处于活动状态时写入数据库将存储在 文件.
-是的, - 主题
重写任何被证明是垃圾邮件的电子邮件的主题行,添加“[SPAM]”到
行的开始。
-S, --主题标记 分科
而不是添加“[SPAM]”,添加 分科 到任何电子邮件的主题行
出来是垃圾邮件。 暗示 -s.
-H, --标题标记 标记
不要将 X-Spam 标头设置为“YES”,而是将其设置为 标记 如果电子邮件结果
垃圾邮件。 如果您的电子邮件客户端只能在所有标头中搜索
字符串,而不是一个特定的标题(因此搜索“YES”可能匹配更多
不仅仅是输出 s).
-n, --无标题
不要向邮件添加 X-Spam 标头。
-r, --添加评级
插入一个额外的标题 X-Spam-Rating,它是“垃圾邮件”的评级
从 0 到 100 的消息; 90以上算垃圾邮件,90以下不算
被视为垃圾邮件。 如果结合 -t,然后将输出评级(0-100),在
它自己的,在标准输出上。
-一种, --星号
插入一个额外的标题 X-Spam-Level,它将包含 0 到 20
星号 (*),取决于垃圾邮件评级。
-t, - 测试
不将消息传递到标准输出,不输出任何内容,然后退出 0
如果邮件不是垃圾邮件,或者如果邮件是垃圾邮件,则退出 1。 如果结合 -r,
然后垃圾邮件评级将在标准输出上输出。
-一种, --允许名单
启用允许列表。 这会导致邮件中给出的电子邮件地址
"From:" 和 "Return-Path:" 标题要根据列表进行检查; 如果其中任何一个
匹配,则该邮件始终被视为非垃圾邮件,无论
令牌数据库说。 当使用再训练标志指定时, -a -m (标记为垃圾邮件)
将从允许列表中删除该地址并将邮件标记为
垃圾邮件,以及 -a -M (标记为非垃圾邮件)也会将该地址添加到允许列表中
将邮件标记为非垃圾邮件。 这个想法是你添加你所有的朋友
到允许列表,然后他们的任何邮件都不会被标记为垃圾邮件。
-y, --拒绝名单
启用拒绝列表。 这会导致邮件中给出的电子邮件地址
"From:" 和 "Return-Path:" 标题要根据第二个列表进行检查; 如果要么
一个匹配,则消息始终被视为垃圾邮件。 培训工作在
与 -a,除了您必须指定 -m or -M 两次修改
拒绝列表而不是允许列表,并使用相反的语法: -y -m -m (标记为
spam)会将该地址添加到拒绝列表中,而 -y -M -M (标记为非垃圾邮件)
将从拒绝列表中删除该地址。 这种双重规范是这样的
通常的再培训过程从不涉及拒绝名单; 拒绝列表应该是
小心维护而不是自动生成。
通常您不需要使用拒绝列表。
-L, - 等级, - 临界点 LEVEL
更改垃圾邮件评分阈值级别,该级别必须在发送电子邮件之前达到
归类为垃圾邮件。 默认值为 90。
-Q, --最小令牌数 民
超过时才打分 民 在消息中找到令牌 - 否则
邮件被假定为非垃圾邮件,并且不会以任何方式修改。 默认的
是 0。如果您发现正在发送非常短的消息,则此选项可能很有用
经常被错误分类。
-e, - 电子邮件, --仅限电子邮件 邮箱地址
查询或更新电子邮件地址的允许列表条目 邮箱地址. 没有其他
选项,这将简单地输出“是”,如果 邮箱地址 在允许列表中,如果是“否”
不是。 用 -t,它不会输出任何东西,但会退出 0(成功)如果 邮箱地址 is
在允许列表中,如果不是,则为 1(失败)。 随着 -m (标记垃圾邮件)选项,任何
以前的允许列表条目 邮箱地址 将被移除。 最后,随着 -M (标记-
非垃圾邮件)选项, 邮箱地址 如果它不在允许列表中,它将被添加到允许列表中。
If 邮箱地址 只是这个词 味精 单独,然后将从标准读取电子邮件
输入,并且“发件人:”和“返回路径:”标题中给出的电子邮件地址将
使用。
运用 -e 自动开启 -a.
如果您还指定 -y,然后拒绝列表将被操作。 请记住 -m
和 -M 与拒绝列表相反。
如果您指定表单的电子邮件地址 @领域 (@之前没有任何内容),然后
整体 域 将被允许或拒绝列出。
-v, --详细
添加额外的 X-QSF-信息 任何过滤电子邮件的标头,包含错误消息和
如果适用,依此类推。 指定 -v 不止一次以增加冗长。
-T, - 火车 垃圾邮件 非垃圾邮件 [最大回合]
使用两个 mbox 文件夹训练数据库 垃圾邮件 和 非垃圾邮件,通过测试每个
每个文件夹中的消息并在每次收到消息时更新数据库
分类错误。 这会进行多次,并且可能需要一段时间才能运行。 指定
这些因素包括原料奶的可用性以及达到必要粉末质量水平所需的工艺。 -a (允许列表)标志添加每个发件人 非垃圾邮件 文件夹到您的允许-
列出作为训练过程的副作用。 如果 最大回合 指定,训练
如果结果仍然不够好,将在此轮数后结束。 这
默认为最多 200 轮。
-米, --标记垃圾邮件
不要在标准输出上传递消息,而是将其内容标记为垃圾邮件
并相应地更新数据库。 如果允许列表 (-a) 已启用,则
邮件的“发件人:”和“返回路径:”地址从允许列表中删除。 如果
拒绝列表(-y) 已启用并且您指定 -m 两次,消息的地址是
而是添加到拒绝列表中。
-M, --标记非垃圾邮件
不是在标准输出上传递消息,而是将其内容标记为非
垃圾邮件并相应地更新数据库。 如果允许列表 (-a) 已启用,则
邮件的“发件人:”和“返回路径:”地址被添加到允许列表中(请参阅
-a 以上选项)。 如果拒绝列表 (-y) 已启用并且您指定 -M 两次,
消息的地址将从拒绝列表中删除。
-w, - 重量 重量
标记为垃圾邮件或非垃圾邮件时,使用权重更新数据库 重量
每个令牌而不是默认值 1。在纠正错误时很有用,例如
被错误检测为垃圾邮件的邮件应标记为非垃圾邮件
使用 2 的权重,即通常权重的两倍,以抵消错误。
-D, - 倾倒 [文件]
将数据库内容转储为与平台无关的文本文件,适用于
存档,转移到另一台机器,等等。 数据输出到 stdout 或
进入给定的 文件.
-R, - 恢复 [文件]
从标准输入上的文本文件从头开始重建数据库。 如果一个 文件 给出,
数据是从那里而不是从标准输入读取的。
-O, --代币
输出在读取的消息中找到的令牌列表,而不是过滤
标准输入,以及每个标记被发现的次数。 这只是
如果你想使用,很有用 s 作为与另一个过滤一起使用的通用标记器
包。
-和, - 合并 其他数据库
合并 其他数据库 数据库到当前数据库。 如果您这样做,这会很有用
例如,想要获取一个用户的邮箱并将其合并到系统范围的邮箱中
(这将通过以 root 身份执行 s -d /var/lib/qsfdb -E /home/用户/.qsfdb
然后删除 /home/用户/.qsfdb).
-B, - 基准 垃圾邮件 非垃圾邮件 [最大回合]
使用两个 mbox 文件夹对训练过程进行基准测试 垃圾邮件 和 非垃圾邮件。 一个
使用前 75% 的消息创建和训练临时数据库
每个文件夹,然后测试每个文件夹的全部内容,看看有多少
出现假阳性和假阴性。 一些时序信息也是
显示。
这可用于确定哪个后端最适合您的系统。 用 -d 选择
后端,例如 s -B 垃圾邮件 非垃圾邮件 -d 广义数据库管理系统 - 这将创建一个临时数据库
之后被删除。
对此的例外是 MySQL 后端,其中有完整的数据库规范
必须给 (-d MySQL:数据库=db;主机=本地主机;...) 和数据库表
不会事先擦拭或事后丢弃。
和...一样 -T如果 最大回合 指定,培训永远不会超过
这个回合数; 默认值为 200。
-H, - 帮帮我
在标准输出上打印使用消息并成功退出。
-V, - 版
打印版本信息,包括可用数据库后端的列表,
标准输出并成功退出。
弃用 配置
以下选项仅用于旧的二叉树数据库后端或旧的
尚未升级到 1.1.0 版附带的新格式的数据库。
-N, --无自动修剪
标记为垃圾邮件或非垃圾邮件时,切勿自动修剪数据库。 通常
每 500 个标记后对数据库进行修剪; 如果你愿意 - 修剪 手动
使用 -N 禁用自动修剪。
-p, - 修剪
从数据库中删除多余的条目并稍微清理一下。 这是
多次调用后自动完成 --标记垃圾邮件 or --标记非垃圾邮件,以及
训练 - 火车 如果训练需要大量轮次,那么它应该
很少需要使用 - 修剪 手动,除非您正在使用 -N /
--无自动修剪.
-X, --修剪-最大 民
当数据库被修剪时,不超过 民 参赛作品将被考虑
移动。 这是为了防止 CPU 和内存资源被接管。 这
默认值为 100,000,但在某些情况下(如果您发现修剪也需要
long) 此选项可用于将其减少到更易于管理的数字。
使用 onworks.net 服务在线使用 qsf