英语法语西班牙语

Ad


OnWorks 网站图标

mailtoe - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 mailtoe

这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令 mailtoe,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器

程序:

您的姓名


mailtoe - 与 dbacl 一起使用的错误训练模拟器。

概要


脚趾 命令 [ 命令参数 ]

商品描述


脚趾 自动化测试电子邮件过滤和分类程序的任务,例如
数据库(1). 给定一组分类文档,mailtoe 启动测试运行以估计
分类错误,从而允许微调参数
分类器。

错误训练 (TOE) 是一种有时被提倡用于电子邮件的学习方法
分类器。 给定传入的电子邮件流,该方法包括重用一组固定的
类别数据库,直到发生第一次错误分类。 那个时候,冒犯
电子邮件用于重新学习相关类别,直到下一次错误分类。 在这
方式,类别仅在发生错误时更新。 这直接模拟了某些
在实践中使用电子邮件分类器。

TOE 的错误率直接取决于查看电子邮件的顺序。 一个小小的改变
在订购中,由于网络延迟可能会发生,可能会对订单产生很大的影响
错误分类的数量。 最后, 脚趾 没有给出有意义的结果,
除非仔细选择示例电子邮件。 但是,由于这种方法是常用的
通过垃圾邮件过滤器,仍然值得计算以促进比较。 其他方法(见
邮递员(1)邮脚(1)) 尝试捕捉分类错误的行为
其他方法。

为了改进和稳定错误率计算, 脚趾 执行 TOE 模拟
在稍微重新排序的电子邮件流上多次,并对结果求平均值。 这
通过以随机顺序多路复用来自每个类别邮箱的电子邮件来进行重新排序。
因此,如果有三个类别,则从分类的第一封电子邮件中随机选择
每种类型的示例电子邮件流的前面。 第二封邮件也是随机选择的
在这三种类型中,从前面
删除第一封电子邮件后的流。 当所有样本流都完成时,模拟停止
累。

脚趾 执行时使用环境变量 MAILTOE_FILTER,它允许
模拟任意滤波器,前提是它们满足兼容性条件
在下面的环境部分中说明。

为了方便, 脚趾 实现一个 测试套件 带有预定义包装器的框架
几个开源分类器。 这允许直接比较 数据库(1)与
同一组电子邮件样本上的竞争分类器。 请参阅下面的用法部分。

在准备过程中, 脚趾 在当前工作中建立一个名为 mailtoe.d 的子目录
目录。 所有需要的计算都在这个子目录中执行。

退出 状态


脚趾 成功时返回 0,出现问题时返回 1。

指令


准备 尺寸
在当前工作目录中准备一个名为 mailtoe.d 的子目录,以及
用空子目录填充它 尺寸 子集。

类别 [ 文件 ] ...
从以下任一方获取一组电子邮件 文件 如果指定,或 STDIN,并将它们关联起来
类别. 内电子邮件的排序 文件 被保留下来,然后
文件s 附加到每个类别中的第一个。 这个命令可以重复
多次,但应至少执行一次。

清洁 删除目录 mailtoe.d 及其所有内容。

运行 从之前添加的电子邮件流中随机多路复用,并重新学习类别
仅当发生错误分类时。 重复模拟 尺寸 倍。

总结
打印模拟的平均错误率。

情节 [ ps | 对数 ] ...
绘制模拟时间内的错误数量。 “ps”选项,如果有的话,
将绘图写入目录 mailtoe/plots 中的 postscript 文件,而不是
显示在屏幕上。 “logscale”选项(如果存在)会导致绘图开启
两个纵坐标的对数刻度。

检讨 真猫 捕食者
扫描上次运行的统计信息并提取属于的所有消息
类别 真猫 但已被归入类别 捕食者. 提取的
消息被复制到目录 mailtoe.d/评论 细读。

测试套件 名单
显示可以选择的可用过滤器/包装器脚本列表。

测试套件 选择 [ FILTER ] ...
准备名为的过滤器 FILTER 用于模拟。 过滤器名称是
位于目录中的包装器脚本的名称 /usr/share/dbacl/测试套件.
每个过滤器都有一个刚性界面记录如下,以及选择它的行为
将其复制到 mailtoe.d/过滤器 目录。 仅使用位于那里的过滤器
在模拟中。

测试套件 取消选择 [ FILTER ] ...
从目录中删除命名过滤器 mailtoe.d/过滤器 所以他们是
模拟中未使用。

测试套件 运行 [ ]
对先前添加的数据集调用每个选定的过滤器,并计算
误分类率。 如果存在“plots”选项,则每个过滤器模拟
被绘制为目录中的 postscript 文件 mailtoe.d/情节.

测试套件 状态
描述预定的模拟。

测试套件 总结
显示所有过滤器的交叉验证结果。 之后才有意义 运行
命令。

用法


正常的使用模式如下:首先,您应该将电子邮件分开
收集到几个类别(手动或以其他方式)。 每个类别应该是
与一个或多个文件夹相关联,但每个文件夹不应包含多个
类别。 接下来,您应该决定使用多少次运行,比如 10。您使用的运行次数越多,
预测错误率越高。 然而,更多的运行需要更多的时间。 现在你可以输入

% mailtoe 准备 10

接下来,对于每个类别,您必须添加与该类别关联的每个文件夹。 认为
你有三个类别命名 垃圾邮件, 工作, 与 mbox 相关联
垃圾邮件.mbox, 工作.mbox播放.mbox 分别。 你会输入

% mailtoe 添加垃圾邮件 spam.mbox
% mailtoe 添加工作 work.mbox
% mailtoe 添加播放 play.mbox

您应该针对每个类别中相似数量的电子邮件,作为随机多路复用
否则会失衡。 每个电子邮件消息的顺序 *.mbox 文件是
重要,并在每次模拟期间保留。 如果重复添加相同的
类别,后面的邮箱将被附加到第一个,保留隐含的
排序。

您现在可以根据需要执行任意数量的 TOE 模拟。 多路复用的电子邮件是
通过执行环境中给出的命令,一次分类和学习一个
变量 MAILTOE_FILTER。 如果未设置,则使用默认值。

% mailtoe 运行
% mailtoe 总结

testsuite 命令旨在简化上述步骤并允许比较
广泛的电子邮件分类器,包括但不限于 数据库. 分类器是
通过包装脚本支持,这些脚本位于 /usr/share/dbacl/测试套件
目录。

使用测试套件的第一阶段是决定要比较哪些分类器。 你
可以通过键入以下内容查看可用包装器的列表:

% mailtoe 测试套件列表

请注意,包装脚本不是实际的电子邮件分类器,它必须是
由您的系统管理员或其他方式单独安装。 完成此操作后,您
可以通过键入为模拟选择一个或多个包装器,例如:

% mailtoe testsuite 选择 dbaclA ifile

如果在系统上找不到某些选定的分类器,则不会选择它们。
另请注意,某些包装器可以具有硬编码的类别名称,例如,如果分类器
只支持二分类。 注意警告信息。

剩下的只是运行模拟。 请注意,这可能需要很长时间(几个小时
取决于分类器)。

% mailtoe 测试套件运行
% mailtoe testsuite 总结

完成所有操作后,您可以通过键入删除工作文件、日志文件等

% mailtoe 干净

SCRIPT 接口


脚趾 测试套件 负责学习和分类您准备好的电子邮件语料库
每个选定的分类器。 由于分类器具有广泛变化的接口,这只是
可以通过将这些接口单独包装成可以使用的标准形式
by 脚趾 测试套件.

每个包装器脚本都是一个命令行工具,它接受单个命令后跟零
或更多可选参数,以标准形式:

包装器命令 [参数]...

每个包装器脚本还以明确定义的方式使用 STDIN 和 STDOUT。 如果不
行为被描述,则不应使用任何输出或输入。 可能的命令是
如下面所描述的:

filter 在这种情况下,STDIN 上需要一封电子邮件,以及一个类别文件名列表
预计在 $2、$3 等中。脚本写入对应的类别名称
STDOUT 上的输入电子邮件。 不需要或预期没有尾随换行符。

在这种情况下,STDIN 上需要标准 mbox 流,而合适的
类别文件名预计为 2 美元。 没有输出写入 STDOUT。

在这种情况下,一个目录预计为 $2,用于检查旧数据库
信息。 如果找到任何旧数据库,它们将被清除或重置。 没有输出是
写入标准输出。

描述
在这种情况下,将一行文本写入 STDOUT,描述过滤器的
功能。 线路应保持较短,以防止线路缠绕在
终奌站。

引导
在这种情况下,目录预计为 $2。 包装器脚本首先检查
其相关分类器的存在,以及其他先决条件。 如果支票
成功,然后包装器被克隆到提供的目录中。 礼貌
应在 STDOUT 上给出通知以表示成功或失败。 也是
允许给出更长的描述警告。

toe 在这种情况下,类别列表预计为 $3、$4 等。每一个可能的
必须列出类别。 在此列表之前,真正的类别以 $2 给出。

脚 使用者 邮脚(1)。

环境


加载后, 脚趾 读取 $HOME 目录中的隐藏文件 .mailtoerc,如果
它存在,因此这将是为环境定义自定义值的好地方
变量。

MAILTOE_FILTER
该变量包含一个shell命令,在运行过程中需要重复执行
阶段。 该命令应该接受 STDIN 上的电子邮件消息并输出结果
分类名称。 在命令行上,它还应该首先接受真正的类别
name,然后是所有可能的类别文件名的列表。 如果输出类别
与真实类别不匹配,则假定相关类别已被
默默更新/重新学习。 如果 MAILTOE_FILTER 未定义, 脚趾 使用默认值
计算值。

临时目录
导出此目录是为了包装脚本。 需要的脚本
创建临时文件应将它们放置在 TEMPDIR 中给出的位置。

附注


子目录mailtoe.d 可以变得非常大。 它包含培训的完整副本
语料库,以及学习文件 尺寸 时间所有添加的类别,以及各种
日志文件。

而 TOE 模拟为 数据库(1) 可用于与其他分类器比较,TOE
不应用于现实世界的分类。 这是因为,与许多其他
过滤器 数据库(1) 以非线性方式学习证据权重,不保留
令牌之间的相对权重,即使在新电子邮件中没有看到这些令牌。

警告


由于添加邮箱中的电子邮件顺序很重要,因此估计误差
从客观意义上讲,费率没有明确定义,甚至没有意义。 然而,如果
示例电子邮件代表用户收到的电子邮件的实际快照,然后是错误
费率有点意思。 然后可以将模拟解释为替代
给定分类器拦截传入邮件的现实。


该程序最新版本的源代码可在以下位置获得
地点:

http://www.lbreyer.com/gpl.html
http://dbacl.sourceforge.net

使用 onworks.net 服务在线使用 mailtoe


免费服务器和工作站

下载 Windows 和 Linux 应用程序

  • 1
    括号
    括号
    Brackets 是一个免费的现代开源软件
    专为 Web 打造的文本编辑器
    发展。 用 HTML、CSS 和
    带有专注可视化工具的 JavaScript 和
    准备...
    下载支架
  • 2
    免费的pascal编译器
    免费的pascal编译器
    一个 32/64/16 位 Pascal 编译器,用于
    Win32/64/CE、Linux、Mac OS X/iOS、
    Android、FreeBSD、OS/2、Game Boy
    Advance、任天堂 NDS 和 DOS;
    语义兼容...
    下载免费的 Pascal 编译器
  • 3
    佳能 EOS 数码信息
    佳能 EOS 数码信息
    佳能没有快门计数
    包含在一个的EXIF信息中
    图像文件,而不是尼康和
    宾得。 没有基于佳能的官方
    应用 ...
    下载佳能 EOS 数码信息
  • 4
    EFInd
    EFInd
    rEFInd 是 rEFIt 引导的一个分支
    经理。 像 rEFIt 一样,rEFInd 可以
    自动检测您安装的 EFI 启动
    loaders,它提供了一个漂亮的 GUI
    启动选项菜单...
    下载 rEFInd
  • 5
    快递卢克GSI
    快递卢克GSI
    这个 SourceForge 下载页面是为了
    授权用户下载我构建的源代码
    GSI,基于 phhusson 的伟大
    工作。 我构建了 Android Pie 和
    安卓 1...
    下载 ExpressLuke GSI
  • 6
    音乐播音员
    音乐播音员
    Music Caster 是一个托盘音乐播放器
    可以让您将本地音乐投射到
    Google Cast 设备。 在第一次运行时,
    你需要点击你的箭头
    塔...
    下载音乐播音员
  • 更多 ”

Linux 命令

Ad