这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 ifile,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
ifile - ifile 邮件过滤系统的核心可执行文件
概要
文件 [-b 文件[-q|-Q[-g[-k[-o[-v NUM[词法 选项] 文件 ...
文件 -c -q|-Q [-T 门槛[-b 文件[-g[-k[-o[词法 选项] 文件 ...
文件 [-b 文件[-d 夹[-i 夹|-u 夹[-g[-k[-o[-v NUM[词法 选项]
文件 ...
文件 -r [-b 文件]
商品描述
文件 是一个邮件过滤客户端,它使用机器学习将电子邮件分类为
文件夹/邮箱。 它使用的算法称为朴素贝叶斯。 基本上,天真
贝叶斯将每个文档视为一个无序的单词集合,并通过匹配进行分类
与文件夹/邮箱分布最匹配的文档分布。
配置
-b, --db-文件=文件
读取/存储文件数据库的位置。 默认是 〜/.idata
-c, - 简洁的
相当于“ifile -v 0 | 头 -1 | 切 -f1 -d". 必须与 -q or -Q.
-d, - 删除=夹
删除每个的统计信息 档 从类别 夹
-f, --文件夹计算=夹
显示单词概率计算 夹
-g, --日志文件
创建和存储调试信息 〜/.ifile.log
-i, - 插入=夹
将每个文件的统计信息添加到类别中 夹
-k, --保持不频繁
将不常出现的词留在数据库中(通常它们会被扔掉)
-l, --查询-locv=夹
对于每个文件,临时从 夹, 执行查询和
然后重新插入文件 夹. 数据库没有被修改。
-o, - 发生
使用文档位向量表示。 每个文档计算每个单词一次。
-q, - 询问
输出每个文件的评分
-Q, --查询插入
对于每个文件,输出评分并为文件夹添加统计信息
最高分
-T, - 临界点=门槛
与两者一起使用时 -c 和 -q, 输出排名最高的两个类别,如果它们
分数最多相差 门槛 / 1000,可用于检测边界
案件。 当与 -q 只有和任何 门槛 > 0,输出分数差
百分比。 例如,
文件 -T1 -q 文件.txt
可能会导致
垃圾邮件 -15570.48640776
非垃圾邮件 -18728.00272369
差异[垃圾邮件,非垃圾邮件](%) 9.21
如果是这样的话
文件 -T93 -q -c 文件.txt
将导致
foo.txt 垃圾邮件,非垃圾邮件
而
文件 -T92 -q -c 文件.txt
将导致
foo.txt 垃圾邮件
-r, --重置数据
擦除所有当前存储的信息
-u, - 更新=夹
与“插入”相同,但仅在以下情况下添加统计信息 夹 已经存在
-v, --冗长=NUM
运行时的输出量:0=silent, 1=quiet, 2=progress, 3=verbose, 4=debug
Lexing 选项:
-a, --alpha-词法分析器
Lex 单词作为字母字符序列(默认)
-A, --alpha-only-词法分析器
只有完全由 lex 空格分隔的字符序列
字母字符
-h, --条带标题
跳过除主题:、发件人:和收件人之外的所有标题行:
-m, - 最长长度=坦克
在第一次之后忽略消息的一部分 坦克 人物。 使用整个消息,如果 坦克
设置为 0。默认值为 50,000。
-p, --打印令牌
只是标记和打印,不要做任何其他处理。 文档返回为
单词、频率对的列表。
-s, --无非索引字表
词法分析时不要扔掉过于频繁(停止列表)的词
-S, --词根
对文档进行词法分析时使用“Porter”词干算法
-w, --white-词法分析器
Lex 单词作为空格分隔字符的序列
如果命令行上没有指定文件,ifile 将使用标准输入作为它的
要处理的消息。
-?, - 帮帮我
给出这个帮助列表
- 用法
给出简短的使用信息
-V, - 版
打印程序版本
长选项的强制性或可选参数对于任何
相应的短选项。
使用 onworks.net 服务在线使用 ifile