英语法语西班牙语

运行服务器 | Ubuntu > | Fedora > |


OnWorks 网站图标

icombine - 云端在线

通过 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器在 OnWorks 免费托管服务提供商中运行 icombin

这是可以使用我们的多个免费在线工作站之一(例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器)在 OnWorks 免费托管服务提供商中运行的命令 icombin

程序:

名称


ispell、buildhash、munchlist、findaffix、tryaffix、icombine、ijoin - 交互式拼写
检查

概要


伊斯佩尔 [通用标志[-M|-N[-L上下文] [-V] 文件
伊斯佩尔 [通用标志] -l
伊斯佩尔 [通用标志[-f 文件] [-s[-a|-A]
伊斯佩尔 [-d 文件[-w 字符] -c
伊斯佩尔 [-d 文件[-w 字符] -e[e]
伊斯佩尔 [-d 文件] -D
伊斯佩尔 -v[v]

通用标志:
[-t[-n[-H[-o[-b[-x[-B[-C[-P[-m[-S[-d 文件[-p 文件[-w
字符[-W n[-T 类型[-k姓名 名单[-F 程序]

辅助程序:

构建哈希 [-s] 字典文件 词缀文件 哈希文件
构建哈希 -s 词缀文件

清单 [-l aff文件[-c 转换文件[-T 后缀]
[-s 哈希文件[-D[-v[-w 字符[]

查找词缀 [-p|-s[-f[-c[-m 分钟[-M 最大[-e 我的手]
[-t 标签字符[-l []

尝试添加 [-p|-s] [-c] 扩展文件 词缀 [+添加]

结合 [-T 类型[-w 字符[aff文件]

我加入 [-s|-u] 加入选项 file1 file2

商品描述


斯佩尔 是在 拼写 来自 ITS 的程序(称为 伊斯佩尔 在 Twenex 系统上。)
最常见的用法是“ispell 文件名”。 在这种情况下, 伊斯佩尔 将显示每个单词
它不会出现在屏幕顶部的字典中,并允许您更改
它。 如果字典中有“未遂”(仅相差一个词的词)
一个字母、一个缺失或多余的字母、一对换位的字母、或一个缺失的空格或
连字符),然后它们也会显示在以下行中。 除了“险些未遂”,
ispell 可能会显示从已知词根生成单词的其他猜测,每个
猜测前面加问号。 最后,包含单词和上一个的行
行打印在屏幕底部。 如果你的终端可以反向显示
视频中,该词本身被突出显示。 您可以选择替换单词
完全,或选择建议的词之一。 命令是单个字符作为
如下(忽略大小写):

R 完全替换拼写错误的单词。

空间 这次只接受这个词。

A 接受这个词的其余部分 伊斯佩尔 会议。

我接受这个词,在文件中大写,并更新私人
字典。

U 接受这个词,并添加一个未大写(实际上都是小写)的版本
到私人词典。

0-n 替换为建议的单词之一。

l 在系统词典中查词(由WORDS编译控制
选项)。

X 写入此文件的其余部分,忽略拼写错误,然后开始下一个文件。

Q 立即退出并保持文件不变。

! 壳逃生。

^L 重绘屏幕。

^Z 暂停 ispell。

? 提供帮助屏幕。

如果 -M 开关被指定,屏幕底部的单行小菜单将
总结这些选项。 相反,该 -N 开关可用于抑制迷你菜单。
(默认情况下会显示小菜单,如果 伊斯佩尔 是用 MINIMENU 选项编译的,但是
这两个开关将始终覆盖默认值)。

如果 -L 给定标志,指定的数字用作上下文的行数
显示在屏幕底部(默认是计算上下文的数量为
屏幕尺寸的一定百分比)。 上下文的数量受制于一个系统——
施加的限制。

如果 -V 给出标志,不在 7 位 ANSI 可打印字符集中的字符
将始终以“cat -v”的样式显示,即使 伊斯佩尔 认为这些
字符在您的系统上是合法的 ISO Latin-1。 这在与较老的人一起工作时很有用
终端。 没有这个开关, 伊斯佩尔 如果它们有,将“按原样”显示 8 位字符
被定义为所选文件类型的字符串字符。

“正常”模式,以及 -l, -a-A 选项和交互模式(见下文)也
在命令行上接受以下“通用”标志:

-t 输入文件为 TeX 或 LaTeX 格式。

-n 输入文件采用 nroff/troff 格式。

-H 输入文件为 SGML/HTML 格式。 (这真的应该是 -s, 但对于
该标志已被采用的历史原因。)

-o 输入文件应被视为普通文本。 (这可以用来
覆盖 DEFTEXFLAG。)

-g 输入文件采用 Debian 控制文件格式。 Ispell 会忽略
说明之外的所有内容。

-b 通过将“.bak”附加到输入文件的名称来创建备份文件。

-x 拼写检查完成后删除备份文件。

-B 将缺少空格的连在一起的单词报告为拼写错误。

-C 将连在一起的词视为合法复合词。

-P 不要生成额外的词根/词缀组合。

-m 使字典中没有的词根/词缀组合成为可能。

-S 按可能的正确性对猜测列表进​​行排序。

-d 文件
指定备用字典文件。 例如,使用 -d 英国的 选择
/usr/lib/ispell/british.{aff|hash} 而不是默认的 ispell
字典。

-p 文件
指定备用个人词典。

-w 字符
指定可以作为单词一部分的附加字符。

-W n 指定始终合法的单词长度。

-T 类型
假设所有文件都有给定的格式化程序类型。

冥界 -H, -n, -t-o 选项选择是否 伊斯佩尔 在 HTML (-H), nroff/troff (-n),
特克斯/乳胶(-t),或普通文本 (-o) 输入模式。 模式。 (默认模式是控制
通过 DEFTEXFLAG 安装选项,但对于历史记录通常是 nroff/troff 模式
原因。)除非被模式选择开关之一覆盖,否则 TeX/LaTeX 模式是
如果输入文件的扩展名为“.tex”,并且 HTML 模式为
如果输入文件的扩展名为“.html”或“.htm”,则自动选择。

在 HTML 模式下,以 <> 符号分隔的 HTML 标签将被跳过,除了“ALT=”
如果在等号周围没有空格,则结构被识别,并且文本
里面是拼写检查。

在 TeX/LaTeX 模式下,只要找到反斜杠(“\”), 伊斯佩尔 将跳到下一个
空格或 TeX/LaTeX 分隔符。 某些命令包含不应包含的参数
已检查,例如在 \cite 命令中找到的标签和参考键,因为它们
包含任意的非单词参数。 在数学中拼写检查也被抑制
模式。 因此,例如,给定

\chapter {这是一个 Ckapter} \cite{SCH86}

伊斯佩尔 会找到“Ckapter”而不是“SCH”。 这 -t 选项无法识别 TeX
注释字符“%”,所以注释也经过拼写检查。 它还假定正确的 LaTeX
句法。 不常用命令的参数和一些可选参数有时是
进行了不必要的检查。 参考书目将不会被检查,如果 伊斯佩尔 被编译
忽略 定义。 否则,将检查参考书目,但参考键将
不是。

参考资料 TIB (如果在您的系统上可用), 书目系统,即文本
``[.'' 或 ``<.'' 和 ``.]'' 或 ``.>'' 之间的字符在 TeX/LaTeX 模式下将始终被忽略。

冥界 -b-x 选项控制是否 伊斯佩尔 为每个输入留下一个备份 (.bak) 文件
文件。 .bak 文件包含预先更正的文本。 如果有文件打开/写入
错误,.bak 文件可能会保留用于恢复目的,即使 -x 选项。 该
此选项的默认设置由 DEFNOBACKUPFLAG 安装选项控制。

冥界 -B-C 选项控制如何 伊斯佩尔 处理连在一起的词,例如“notthe”
“不是”。 如果 -B 被指定,这样的词将被视为错误,并且 伊斯佩尔
列出带有插入空格或连字符的变体作为可能的替换。 如果 -C is
指定的,连在一起的词将被认为是合法的复合词,只要两者
组件在字典中,每个组件至少和一种语言一样长——
从属最低(3 个字符,默认情况下)。 这对德语等语言很有用
和挪威语,其中许多复合词是通过连接形成的。 (注意
由三个或更多词根组成的复合词仍将被视为错误)。 这
此选项的默认值取决于语言; 在多语言安装中默认
可能会因您选择的词典而异。 警告: 练习 -C 选项可能导致
伊斯佩尔 识别非单词和拼写错误。 谨慎使用!

冥界 -P-m 选项控制何时 伊斯佩尔 自动生成建议的根/词缀
组合可能添加到您的个人词典。 (这些是条目
前面有问号的“猜测”列表。)如果 -P 被指定,这样的猜测
仅在以下情况下显示 伊斯佩尔 无法产生与当前匹配的任何可能性
字典。 如果 -m 指定,这样的猜测总是显示。 这可能很有用,如果
字典有一个有限的词表,或者是一个很少有后缀的词表。 然而,你
使用这个选项时应该小心,因为它会产生产生非法的猜测
字。 此选项的默认值由使用的字典文件控制。

冥界 -S 选项抑制 伊斯佩尔对可能的列表进行排序的正常行为
替换词。 有些人可能更喜欢这个,因为它在某种程度上增强了
正确单词编号较低的概率。

冥界 -d 选项用于指定替代散列字典文件,而不是
默认。 如果文件名不包含“/”,则默认为库目录
字典文件是前缀; 因此,要使用本地目录中的字典“-d
./xxx.hash" 必须使用。这对于允许替代语言的字典很有用。
与之前的版本不同 伊斯佩尔, 字典 的/ dev / null的 是非法的,因为
字典包含词缀表。 如果您需要一个有效的空字典,请创建
带有不太可能的字符串(例如,“qqqqq”)的单条目列表。

冥界 -p 选项用于指定备用个人字典文件。 如果文件名
不以“/”开头,$HOME 是前缀。 此外,可以设置 shell 变量 WORDLIST,
以相同的方式重命名个人字典。 命令行覆盖任何
词表设置。 如果既不 -p switch 和 WORDLIST 环境变量是
给定, 伊斯佩尔 将在当前目录和
$HOME,如果没有找到,则在 $HOME 中创建一个。 首选名称由
将“.ispell_”附加到哈希文件的基本名称。 例如,如果您使用
英语词典,您的个人词典将命名为“.ispell_english”。 然而,
如果文件“.ispell_words”存在,它将被用作个人字典,不管
选择的语言哈希文件。 此功能主要用于向后
兼容性。

如果 -p 选项是 不能 指定的, 伊斯佩尔 将在两个目录中查找个人词典
当前目录和主目录。 如果两个地方都存在字典,它们将
合并。 如果将任何单词添加到个人词典中,它们将被写入
当前目录(如果该位置已存在字典); 否则他们会
写入主目录中的字典。

冥界 -w 选项可用于指定字母以外的字符,这些字符也可以
出现在文字中。 例如, -w "&" 将允许 "AT&T" 被选中。 下划线是
在许多技术文档中很有用。 在这个选项中有一个公认的粗略规定
对于 8 位国际字符。 非打印字符可以在通常的
通过插入反斜杠后跟八进制字符代码的方式; 例如,“\014”用于表单
喂养。 或者,如果字符串中出现“n”,则(最多)三个字符
以下是字符的十进制代码 0 - 255。 例如,要包括铃铛
并用你的话来填表(公认的愚蠢的事情,但不是最有教育意义的
例子):

n007n012

除了后面三个“n”之外的数字只是数字字符。 用于
“n”不与任何内容冲突,因为实际的字母没有意义——
字母已被接受。 斯佩尔 通常与来自文件的输入一起使用,
这意味着可以为输入文本中可能的 8 位字符保留奇偶校验。
如果您指定 -l 选项,并实际从终端输入文本,这可能会创建
如果您的 stty 设置保持奇偶校验,则会出现问题。

无法使用 -w 带有某些字符。 特别是旗标
语言的字符(在词缀文件中定义,但通常是“/”)永远不能被创建
成一个字。

冥界 -W 选项可用于更改单词的长度 伊斯佩尔 总是接受为
合法的。 一般, 伊斯佩尔 将接受所有 1 个字符的单词作为合法的,这是等效的
指定“-W 1.”(这个开关的默认值实际上是由MINWORD控制的
安装选项,因此它可能会因您的安装而异。)如果您希望所有单词都
对照字典进行检查,无论长度如何,您可能都希望指定“-W 0."
另一方面,如果您的文档指定了很多三个字母的首字母缩略词,您会
指定 ”-W 3" 接受三个字母或更少的所有单词。无论设置如何
这个选项, 伊斯佩尔 只会按照建议生成字典中的单词
词的替代品; 这可以防止列表变得太长。 显然,这
选项可能非常危险,因为可能会遗漏短拼写错误。 如果你使用这个
选项很多,您可能应该在没有它的情况下进行最后一次发布,然后再发布
文档,以保护自己免受错误的影响。

冥界 -T 选项用于指定用于生成字符串的默认格式化程序类型
人物。 此开关会覆盖根据文件名确定的默认类型。 这
类型 参数可以是语言词缀文件中定义的唯一名称之一
(例如, 恩罗夫) 或包含点的文件后缀(例如, .tex)。 如果不 -T 选项出现
并且不能从文件名中确定类型,默认字符串字符类型
将使用在语言词缀文件中声明的。

冥界 -k 选项用于增强某些变形器的行为。 这 姓名 参数
给出 deformatter 关键字集的名称(见下文),以及 名单 参数给出一个
要特别处理的一个或多个关键字的列表。 如果 名单 从加号开始
(+) 号,它被添加到现有的关键字; 否则它会替换现有的关键字
列表。 例如, -ktexskip1 +书目风格 向 TeX 添加“书目风格”
跳过 1 列表,而 -khtml忽略 预,强 用“pre”替换 HTML 忽略列表
“强的”。 可用的列表是:

texskip1
带有不应进行拼写检查的单个参数的 TeX/LaTeX 命令,
例如“书目风格”。 默认为 "end", "vspace", "hspace", "cite",
"ref", "parbox", "label", "input", "nocite", "include", "includeonly",
"documentstyle", "documentclass", "usepackage", "selectlanguage", "pagestyle",
“pagenumbering”、“hyphenation”、“pageref”和“psfig”,在某些情况下还加上“bibliography”
装置。 这些关键字区分大小写。

texskip2
带有两个不应进行拼写检查的参数的 TeX/LaTeX 命令,例如
作为“设定长度”。 默认为“规则”、“setcounter”、“addtocounter”、“setlength”、
“addtolength”和“settowidth”。 这些关键字区分大小写。

html忽略
分隔文本的 HTML 标记,在匹配结束之前不应进行拼写检查
标签已到达。 默认为“code”、“samp”、“kbd”、“pre”、“listing”和
“地址”。 这些关键字不区分大小写。 (注意里面的内容
HTML 标记,例如 HREF=,通常不会被检查。)

html检查
即使在 HTML 标签内也应该进行拼写检查的子字段。 默认是
“alt”,以便 IMG 标签的 ALT= 部分将进行拼写检查。 这些关键词
不区分大小写。

上述所有关键字列表也可以通过名称的环境变量进行修改
与上面相同,除了大写,例如 TEXSKIP1。 这 -k 开关覆盖(或
添加到)环境变量,并且环境变量覆盖或添加到
内置默认值。

冥界 -F switch 指定一个外部的 deformatter 程序。 这个程序应该读取数据
从其标准输入并写入其标准输出。 该程序 必须 生产
每个输入字符正好输出一个字符,否则 ispell 将丢失
同步并损坏输出文件。 空白字符(尤其是空格、
制表符和换行符)和应该进行拼写检查的字符应该通过
不变。 不应进行拼写检查的字符应转换为空格或
其他非单词字符。 例如,HTML deformatter 可能会将所有 HTML 标记转换为
空白,并且还清除所有由“代码”或“kbd”等标签分隔的文本。

冥界 -F switch 是为 ispell 变形文件的首选方法,最终将
成为唯一的出路。

If 伊斯佩尔 在没有任何文件名或模式切换的情况下调用,它进入交互模式
旨在让用户检查单个单词的拼写。 节目反复
用“word:”提示标准输出,并用“ok”(可能用
评论)、“未找到”或“怎么样”后跟建议列表。

冥界 -l 或“列表”选项 伊斯佩尔 用于生成拼写错误的单词列表
标准输入。

冥界 -a 选项旨在通过管道从其他程序中使用。 在这种模式下,
伊斯佩尔 打印一行版本标识消息,然后开始阅读
输入。 对于每个输入行,每个单词的标准输出中写入一行
检查拼写就行了。 如果在主词典中找到该词,或者您的
个人字典,则该行只包含一个“*”。 如果这个词是通过
词缀删除,则该行包含一个“+”、一个空格和词根。 如果这个词是
通过复合形成(两个词的串联,由 -C
选项),则该行仅包含一个“-”。

如果该词不在字典中,但有未遂事件,则该行包含一个
'&', 一个空格, 拼错的单词, 一个空格, 未命中数, 数
行首和拼错单词首之间的字符,a
冒号、另一个空格以及由逗号和空格分隔的未遂事件列表。
在未遂事件之后(并且仅通过未遂事件的计数来识别),如果单词
可以通过向已知词根添加(非法)词缀来形成,是建议的列表
派生词,再次用逗号和空格分隔。 如果完全没有差错的话,
行格式相同,只是'&' 被'?' 代替(和差点错过
计数始终为零)。 未遂事件后的建议推导在
形成:

[前缀+] 根 [-prefix] [-suffix] [+suffix]

(例如,“re+fry-y+ies”得到“refries”)其中每个可选 xSFX 是一个字符串。
此外,每个未遂或猜测都与输入词大写相同,除非这样
大写是非法的; 在后一种情况下,每个未遂事件都正确地大写
根据字典。

最后,如果这个词没有出现在字典中,并且没有未遂事件,那么
该行包含一个“#”、一个空格、拼错的单词、一个空格和字符偏移
从行的开头。 文本输入的每个句子都以
额外的空行,表示 伊斯佩尔 已完成处理输入行。

这些输出行可以总结如下:

好的: *

根:+

复合:
-

错过: & : , , ..., , ...

猜测: ? 0 : , , ...

没有任何: #

例如,包含单词“fray”、“Frey”、“fry”和“refried”的虚拟词典
可能会对命令“echo 'frqy refries | ispell -a -m -d”产生以下响应
./test.hash”:
(#) 国际 Ispell 版本 3.0.05(测试版),08/10/91
& frqy 3 0: 弗莱, 弗莱, 弗莱
& refries 1 5: refried, re+fry-y+ies

这种模式也适合当你想弄清楚拼写时的交互使用
一个词。

冥界 -A 选项就像 -a, 除非一行以字符串开头
"&Include_File&", 其余行作为文件名进一步读取
字。 当包含文件用完时,输入返回到原始文件。 包容
最多可以嵌套五层。 密钥字符串可能会随着环境而改变
变量 INCLUDE_STRING (必须包括和号,如果有的话)。

当在 -a 模式, 伊斯佩尔 还将接受以任何前缀为前缀的单字行
'*'、'&'、'@'、'+'、'-'、'~'、'#'、'!'、'%'、'`'或'^'。 以“*”开头的行告诉
伊斯佩尔 将单词插入到用户的字典中(类似于 I 命令)。 一条线
以'&'开头告诉 伊斯佩尔 将单词的全小写版本插入
用户字典(类似于 U 命令)。 以“@”开头的行导致 伊斯佩尔
以后接受这个词(类似于A命令)。 以“+”开头的一行,
紧随其后的是 TEX or 恩罗夫 会引发 伊斯佩尔 解析未来的输入
该格式化程序的语法。 仅由“+”组成的行将放置 伊斯佩尔 in
TeX/LaTeX 模式(类似于 -t 选项) 和 '-' 返回 伊斯佩尔 到 nroff/troff 模式(但
这些命令已过时)。 但是,字符串字符类型是 不能 改变了; '~'
必须使用命令来执行此操作。 以“~”开头的行导致 伊斯佩尔 设置内部
基于给定文件名的参数(特别是默认的字符串字符类型)
在该行的其余部分。 (文件后缀就足够了,但必须包括句点。
代替文件名或后缀,语言后缀文件中列出的唯一名称可能
被指定。)但是,格式化程序解析是 不能 改变了; '+' 命令必须是
用于更改格式化程序。 以“#”为前缀的行将导致个人字典
被拯救。 以 '!' 为前缀的行将开启 简洁 模式(见下文)和一行
以 '%' 为前缀的将返回 伊斯佩尔 到正常(非简洁)模式。 以“`”为前缀的行
将打开详细更正模式(见下文); 此模式只能通过以下方式禁用
使用 '%' 打开简洁模式。

任何跟在前缀字符 '+'、'-'、'#'、'!'、'%' 或 '`' 后面的输入都将被忽略,因为
是“~”行上文件名之后的任何输入。 允许对行进行拼写检查
以这些字符开头,以 '^' 开头的行将删除该字符
在它被传递到拼写检查代码之前。 建议程序化
接口在每条数据线前面加上一个向上箭头,以保护自己免受未来的影响
改变在 伊斯佩尔.

总结这些:

* 添加到个人词典

@接受单词,但不在字典中

# 保存当前个人字典

~ 根据文件名设置参数

+ 进入 TeX 模式

- 退出 TeX 模式

! 进入简洁模式

% 退出简洁模式

` 进入详细更正模式

^ 剩余行的拼写检查

In 简洁 模式, 伊斯佩尔 不会打印以“*”、“+”或“-”开头的行,所有这些
表示正确的词。 这显着提高了驾驶时的运行速度
无论如何,程序都会忽略正确的单词。

In 详细更正 模式, 伊斯佩尔 包括紧跟在后面的原始单词
输出行中以“*”、“+”和“-”开头的指示符,简化了
一些程序的交互。

冥界 -s 选项仅与 -a or -A 选项,并且仅在 BSD-
派生系统。 如果指定, 伊斯佩尔 将停止自己 SIGTSTP 每个信号后
输入行。 它不会读取更多的输入,直到它收到 信号控制 信号。 这可能
对于与某些文本编辑器的握手很有用。

冥界 -f 选项仅与 -a or -A 选项。 如果 -f 被指定,
伊斯佩尔 将其结果写入给定文件,而不是标准输出。

冥界 -v 选择原因 伊斯佩尔 在标准上打印其当前版本标识
输出并退出。 如果开关加倍, 伊斯佩尔 还将打印它是的选项
编译与。

冥界 -c, -e[1-5],和 -D 选项 伊斯佩尔, 主要供 清单
外壳脚本。 这 -c switch 导致从标准输入读取单词列表。
对于每个单词,可能的词根和词缀的列表将写入标准
输出。 一些根词将是非法的,必须从输出中过滤掉
其他方式; 这 清单 脚本就是这样做的。 例如,命令:

回声打扰 | ispell -c

生产:

麻烦 两个/R 两个/R

冥界 -e 开关是相反的 -c; 它扩展词缀标志以生成单词列表。
例如,命令:

回声 BOTH/R | ispell -e

生产:

两个都麻烦

还可以指定可选的扩展级别。 等级 1 (-e1) 是相同的 -e
独自的。 级别为 2 会导致原始词根/词缀组合被添加到
线:

两个/R 两个都麻烦

级别为 3 会导致输出多行,每个生成的单词对应一行,其中
原始词根/词缀组合后跟它创建的单词:

两者/R 两者
两个/R 麻烦

级别 4 导致浮点数附加到级别 3 的每一行,
给出根的长度与所有生成的总长度之间的比率
包括词根的词:

两个/R 两个 2.500000
BOTH/R 麻烦 2.500000

级别为 5 会导致输出多行,每个生成的单词对应一行。 如果
生成的词没有使用任何词缀,行就是那个词。 如果一个或多个
使用了词缀,原始词根和实际使用的词缀被打印出来,由
一个加号; 然后打印生成的单词:


BOTH+R 麻烦

最后,该 -D 标志导致字典文件中的词缀表被转储到
标准输出。

斯佩尔 知道字典和您的单词的正确大小写
个人词典。 以及识别必须大写的单词(例如,George)
和必须全部大写的单词(例如,NASA),它还可以处理带有“不寻常”的单词
大写(例如,“ITCorp”或“TeX”)。 如果单词大写错误,则列表
可能性将包括所有可接受的大小写。 (超过一个
大写可能是可以接受的; 例如,我的字典列出了“ITCorp”和
“ITcorp”。)

通常,此功能不会给您带来惊喜,但有一种情况您
需要注意。 如果您使用“I”将一个单词添加到您的字典中,该单词位于
句子的开头(例如,如果“通常”不在本段的第一个词
字典),它将被标记为“需要大写”。 后续使用
这个没有大写的词(例如,上句中引用的词)将是
被认为是拼写错误 伊斯佩尔,它会建议大写版本。 你必须
然后通过眼睛比较实际拼写,然后键入“I”以添加未大写的
个人字典的变体。 您可以通过使用“U”添加
原始词,而不是“我”。

大小写规则如下:

(1) 任何单词都可以出现在所有大写字母中,例如在标题中。

(2) 字典中任何一个全小写形式的单词都可能出现在
小写或大写(如在句子的开头)。

(3) 任何具有“funny”大写的单词(即,它包含两种情况并且有
除第一个之外的大写字符)必须与字典中的完全相同,
除非规则 (1) 允许。 如果单词可以接受全小写,则它
因此必须出现在字典条目中。

构建哈希
冥界 构建哈希 程序构建散列字典文件供以后使用 拼写。 原始的
单词列表(带有词缀标志)在 字典文件, 并且词缀标志由
词缀文件. 散列输出被写入 哈希文件. 两种输入格式
文件描述在 伊斯佩尔(5)。 该 -s (silent) 选项抑制通常的状态
写入标准错误设备的消息。

清单
冥界 清单 shell 脚本用于减小字典文件的大小,主要是
个人词典文件。 它还能够结合来自各种字典
来源。 给定的 读取(如果没有给出参数,则为标准输入),减少到
一组最小的词根和词缀将匹配相同的单词列表,并写入
标准输出。

munchlist 的输入包含原始词(例如来自您的个人词典文件)或
根和词缀组合(可能在早期的 munchlist 运行中生成)。 每个字或
词根/词缀组合必须在单独的行上。

冥界 -D (debug) 选项将临时文件保留在标准名称下而不是
删除它们,以便可以调试脚本。 警告:在多用户系统上,这
可能是一个安全漏洞。 为避免可能破坏重要文件,请不要运行
以 root 身份编写脚本,并将 MUNCHDEBUGDIR 设置为只有您可以访问的目录的名称。

冥界 -v (verbose) 选项会导致向 stderr 报告进度消息,因此您不会得到
紧张那 清单 挂了。

如果 -s (strip) 选项被指定,在指定的单词 哈希文件 ,那恭喜你,
从单词列表中删除。 这对个人词典很有用。

冥界 -l 选项可用于指定替代 词缀文件 用于咀嚼字典
英语以外的语言。

冥界 -c 选项可用于转换使用旧词缀构建的词典
文件,没有意外引入意外词缀组合的风险
字典。

冥界 -T 选项允许将字典转换为规范的字符串字符格式。
指定的后缀在后缀文件(-l 开关)来确定字符串-
用于输入文件的字符格式; 输出始终使用规范字符串-
字符格式。 例如,从 TeX 源文件收集的字典可能是
通过指定转换为规范格式 -T TEX.

冥界 -w 选项传递给 伊斯佩尔.

查找词缀
冥界 查找词缀 shell 脚本可以帮助编写新语言描述的作者选择
词缀。 给定的字典 (如果没有给出标准输入)被检查
可能的前缀 (-p 开关)或后缀(-s 开关,默认)。 每个通常——
出现的词缀连同它出现的次数和一个
估计将保存在字典哈希文件中的字节数,如果它是
添加到语言表。 只有产生合法词根的词缀(在
原始输入)被列出。

如果未给出“-c”选项,则输出行采用以下格式:

条带/添加/计数/字节

哪里 剥离 是在添加之前应该从根词中剥离的字符串
词缀, 是要添加的词缀, 是这个次数的计数
剥离/ 组合出现,并且 字节 是对可能的字节数的估计
如果将此组合添加到词缀文件中,则将保存在原始字典文件中。 这
输出中的字段分隔符将是由 -t 转变; 这
默认是斜杠(“/”)。

如果 -c ("clean output") 选项,输出的外观是视觉化的
通过将其更改为更清洁(但更难后期处理):

-条+添加数数字节

哪里 剥离, , 字节 和以前一样,并且 表示 ASCII 选项卡
字符。

用于生成可能词缀的方法也会生成更长的词缀
常见的标题或预告片。 例如,“moth”和“mother”这两个词会生成
不仅是明显的替换“+er”,还有“-h+her”和“-th+ther”(可能还有
甚至更长的,取决于价值 分钟)。 为了防止输出混乱
这样的词缀,任何共享一个公共标头的词缀对(或者,对于前缀,尾部)
字符串长于 我的手 字符(默认 1)将被抑制。 你可能想设置
如果您的语言有字符串字符,则将“elim”设置为大于 1 的值; 通常需要
当你检查你的输出时,这个参数会变得很明显 查找词缀 运行。

通常,词缀根据保存的字节数进行排序。 这 -f 开关
可用于使词缀按出现频率排序。

为了节省输出文件空间,出现少于10次的词缀被淘汰; 这个
限制可能会随着 -l 转变。 这 -M 开关指定最大词缀长度
(默认 8)。 超过此长度的词缀将不会被报告。 (这可以节省临时
磁盘空间并使脚本运行得更快。)

生成短于 3 个字符的词干的词缀被抑制。 (茎是
之后的词 剥离 字符串已被删除,并且在 已添加字符串。)
这减少了运行时间和输出文件的大小。 这个限制可能是
随着 -m 转变。 如果您有一个
很多 空闲时间和磁盘空间(在许多天和数百兆字节的范围内)。

冥界 查找词缀 脚本需要一个非空白的字段分隔符供内部使用。
通常,这个字符是一个斜杠(“/”),但如果斜杠作为一个字符出现在
输入单词列表,可以指定不同的字符 -t 开关。

Ispell 词典在被提供给之前应该被扩展 查找词缀; 此外,
不在英文字母表中的字符(如果有)应翻译为
小写。

尝试添加
冥界 尝试添加 shell 脚本用于估计提议的前缀(-p
开关)或后缀(-s 开关,默认)具有给定的 扩展文件. 只有一个词缀可以
每次执行时都要尝试 尝试添加,虽然可以使用多个参数
描述相同词缀标志的不同形式(例如, D 英语标志可以添加
D or ED 取决于尾随 E 是否已经存在)。 展开的每一个字
以所选后缀(或前缀)结尾(或开始)的字典具有该后缀
(前缀)已删除; 然后在字典中搜索与剥离的词匹配的词根
单词。 通常,所有匹配的根都会写入标准输出,但如果 -c (数数)
给出标志,只写入结果的统计摘要。 给出的统计数据
是词缀可能适用的词的数量和估计的数量
使用词缀的标志将保存的字典字节。 估计会很高,如果
flag 生成当前由其他词缀标记生成的单词(例如,在英语中,
泳客 可以由任一生成 浴/X or 沐浴者/S).

字典文件, 扩展文件, 必须已经展开(使用 -e 开关
伊斯佩尔) 并进行排序,如果大写字母已折叠为
用'tr'降低。

冥界 词缀 参数是要从字典文件中删除以产生试验的东西
词根:对于英语, (前缀)和 博士开发的技术萃取的 (后缀)是例子。 这 增加 的一部分
参数是在添加词缀之前从词根中删除的字母。
例如,英语中的词缀 博士开发的技术萃取的 通常带 e 对于以该字母结尾的单词
(例如, 喜欢 成为 喜欢) 所以我们可以运行:

尝试添加 ing+e

涵盖这两种情况。

所有的 shell 脚本在开头都包含文档作为注释; 有时
这些注释包含超出本手册范围的有用信息。

可以安装 伊斯佩尔 以这样的方式只支持 ASCII 范围文本,如果
想要的。

结合
冥界 结合 程序是一个帮手 清单. 它读取字典中的单词列表
从标准输入格式化(根加标志),并在标准上产生一个简化的列表
输出结合了在相邻条目上找到的公共根。 具有相同根
不同的标志将组合它们的标志,并且具有不同的根
大写将以仅保留重要大写的方式组合
信息。 可选的 aff文件 指定定义字符的语言文件
使用的集合和各种标志的含义。 这 -T 开关可用于选择
在替代字符串字符类型中,通过给出一个可以在
替代字符串类型 陈述。 这 -w 开关与相同的开关相同 伊斯佩尔.

我加入
冥界 我加入 程序是重新实现 加入(1) 处理长行和 8 位
字符正确。 这 -s 开关指定 分类(1) 用于编写的程序
输入到 我加入 对 8 位字符使用有符号比较; 这 -u 开关指定
分类(1) 使用无符号比较。 所有其他选项和行为 加入(1) 是
根据手册页尽可能准确地复制,除了 我加入 不会
将换行符作为字段分隔符处理。 见 加入(1) 手册页了解更多信息。

环境


字典
要使用的默认字典,如果没有 -d 标志给出。

ISPELL_CHARSET
要使用的格式化程序类型或字符编码,如果标志选项没有选择。

词汇表
个人词典文件名

INCLUDE_STRING
文件包含的代码 -A 选项

TMPDIR 目录,用于一些 munchlist 的临时文件

孟德比迪尔
用于保存 munchlists' 输出的目录 -D 选项。

TEXSKIP1
单参数 TeX 关键字列表 伊斯佩尔 应该忽略。

TEXSKIP2
包含两个参数的 TeX 关键字列表 伊斯佩尔 应该忽略。

HTML 忽略
分隔不应进行拼写检查的文本的 HTML 关键字列表。

网页检查
应始终进行拼写检查的 HTML 字段列表,即使在标签内也是如此。

使用 onworks.net 服务在线使用 icombine


Ad


Ad