这是可以使用我们的多个免费在线工作站之一在 OnWorks 免费托管服务提供商中运行的命令索引器,例如 Ubuntu Online、Fedora Online、Windows 在线模拟器或 MAC OS 在线模拟器
程序:
您的姓名
indexer - Sphinxsearch 全文索引生成器
概要
索引器 [--配置 配置文件] [--旋转] [--noprogress | --quiet] [--all | 指数 | ...]
索引器 --buildstops 输出文件 COUNT个 [--配置 配置文件] [--noprogress | - 安静的]
[--全部 | 指数 | ...]
索引器 - 合并 主索引 德尔塔索引 [--配置 配置文件] [--旋转] [--noprogress |
- 安静的]
商品描述
Sphinx 是一系列旨在提供高质量全文搜索的程序。
索引器 是 Sphinx 的两个主要工具中的第一个。 从任一调用
直接命令行,或作为较大脚本的一部分, 索引器 全权负责
收集可搜索的数据。
indexer的调用语法如下:
$ indexer [选项] [indexname1 [indexname2 [...]]]
本质上,您将列出不同的可能索引(您稍后将在
可在 sphinx.conf 中搜索),因此在调用时 索引器,至少你需要
告诉它您想要索引的索引(或索引)。
如果 sphinx.conf 包含 2 个索引的详细信息, 我的大索引 和 我的小索引,你可以做
执行以下操作:
$ 索引器 mybigindex
$ 索引器 mysmallindex mybigindex
作为配置文件 sphinx.conf 的一部分,您可以为您的文件指定一个或多个索引
数据。 你可能会打电话 索引器 重新索引其中之一,即席,或者您可以告诉它进行处理
所有索引 - 您不仅可以只调用一个索引,也可以一次调用所有索引,您可以随时选择
可用索引的某种组合。
配置
大多数选项为 索引器 在配置文件中给出,但是有
您可能还需要在命令行上指定一些选项,因为它们会影响
索引操作是如何执行的。 这些选项是:
- 全部
告诉 索引器 更新 sphinx.conf 中列出的每个索引,而不是列出
个别索引。 这在小型配置、cron 类型或
整个索引集将每天或每周重建的维护工作,或
无论哪个时期最好。
用法示例:
$ 索引器 --config /home/myuser/sphinx.conf --all
--buildstops 输出文件.txt 民
查看索引源,就好像它正在索引数据一样,并生成一个列表
正在编入索引的术语。 换句话说,它生成所有可搜索的列表
成为索引一部分的术语。 笔记; 它不会更新索引
问题,它只是简单地处理数据“好像”它正在编制索引,包括运行
查询定义为 sql_query_pre or sql_query_post. outputfile.txt 将包含
单词列表,每行一个,按频率排序,最频繁的排在第一位,以及 民
指定将列出的最大单词数; 如果足够大
包含索引中的每个单词,只会返回那么多单词。 这样一个
字典列表可用于围绕“您的意思是...”的客户端应用程序功能
功能,通常与 --buildfreqs下文。
计费示例:
$ 索引器 myindex --buildstops word_freq.txt 1000
这将在当前目录中生成一个文档 word_freq.txt,其中包含 1,000
'myindex' 中最常用的词,按最常用的顺序排列。 请注意,该文件将
与使用多个索引指定时索引的最后一个索引有关,或 - 全部 (即
配置文件中列出的最后一个)
--buildfreqs
配对使用 --buildstops (如果 --buildstops 未指定)。 作为
--buildstops 提供索引中使用的单词列表, --buildfreqs 添加
指数中存在的数量,这将有助于确定某些
如果词太普遍,则应将其视为停用词。 它也将有助于
开发“您的意思是……”功能,您可以在其中了解给定单词的常见程度
与另一个相似的相比。
计费示例:
$ 索引器 myindex --buildstops word_freq.txt 1000 --buildfreqs
这将产生如上的 word_freq.txt,但是在每个单词之后将是
它在相关索引中出现的次数。
--配置 配置, -c 配置文件
使用给定的文件作为配置。 通常,它会在文件中查找 sphinx.conf
安装目录(例如/usr/local/sphinx/etc/sphinx.conf 如果安装到
/usr/local/sphinx),后跟调用索引器时所在的当前目录
从外壳。 这在二进制文件所在的共享环境中最常用
安装在 /usr/local/sphinx/ 之类的地方,但您想为用户提供
能够制作自己的自定义 Sphinx 设置,或者如果您想运行多个
单个服务器上的实例。 在这种情况下,您可以允许他们创建自己的
自己的 sphinx.conf 文件并将它们传递给 索引器 使用此选项。
例如:
$ 索引器 --config /home/myuser/sphinx.conf myindex
--转储行 文件
将 SQL 源获取的行转储到指定的文件中,在 MySQL 兼容
句法。 结果转储是索引器接收到的数据的精确表示
并帮助重复索引时间问题。
- 合并 夏令时指数 索引
将两个索引物理合并在一起。 例如,如果您有一个 main+delta 方案,
其中主索引很少变化,但delta索引经常重建,并且
- 合并 将用于将两者结合起来。 操作从右向左移动 -
的内容 索引 进行检查并与内容进行物理结合
夏令时指数 结果留在 夏令时指数. 可以用伪代码表示
如: 夏令时指数 += 索引
一个例子:
$索引器--合并主增量--旋转
在上面的例子中,main是master,很少修改index,delta
是较少修改的,您可以使用上面的调用 索引器 至
将 delta 的内容合并到主索引中并旋转索引。
--merge-dst-范围 空中交通管制 闵 最大
运行合并时给出的过滤器范围。 具体来说,当合并应用于
目的地索引(作为的一部分 - 合并, 如果 - 合并 未指定),
索引器 还将过滤以目标索引结尾的文档,并且仅
文档将通过给定的过滤器,最终会出现在最终索引中。 这个
例如,可以在有“已删除”属性的索引中使用,其中 0
表示“未删除”。 这样的索引可以与:
$ indexer --merge main delta --merge-dst-range 删除 0 0
任何标记为已删除(值为 1)的文档都将从新合并的文档中删除
目的地索引。 可以多次添加到命令行,添加
合并的连续过滤器,必须满足所有这些条件才能使文档
成为最终索引的一部分。
--合并杀戮列表, --合并 klists
配对使用 - 合并. 通常在合并时 索引器 使用源索引的kill-list
(即,被合并的那个)作为过滤器来消除匹配的文档
目标索引。 同时目的地本身的kill-list不是
一点都不感动。 使用时 --合并杀戮列表,(或者更短的形式 --合并 klists)的
索引器 不会使用 src-index killlist 过滤 dst-index 文档,但它会合并
他们的kill-lists在一起,所以最终的结果索引会有kill-list
包含合并的源终止列表。
- 没有进展
不要在发生时显示进度详细信息; 相反,最终状态详细信息(例如
作为索引的文档,索引速度等仅在完成时报告
索引。 在脚本没有在控制台(或“tty”)上运行的情况下,这
将默认开启。
用法示例:
$ 索引器 --rotate --all --noprogress
--打印查询
打印出索引器发送到数据库的 SQL 查询以及 SQL 连接
和断开连接事件。 这对于诊断和修复 SQL 问题很有用
源。
- 安静的
告诉 索引器 不输出任何东西,除非有错误。 同样,最常用于
cron 类型,或其他输出无关或不必要的脚本作业,除非
如果出现某种错误。
用法示例:
$ 索引器 --rotate --all --quiet
--旋转
用于旋转索引。 除非你有可以进行搜索的情况
在不打扰用户的情况下离线运行,您几乎肯定需要保持
搜索在索引新文档的同时运行。 --旋转 创建第二个索引,
与第一个平行(在同一个地方,只需在文件名中包含 .new)。
一旦完成, 索引器 通知 搜索 通过发送 签到 信号,和 搜索
将尝试重命名索引(重命名现有索引以包含 .old 和
重命名 .new 以替换它们),然后从较新的文件开始提供服务。
根据设置 无缝旋转, 可能会有轻微的延迟
搜索较新的索引。
用法示例:
$ 索引器 --rotate --all
--sighup-每个
当您重建许多大索引并希望每个索引都旋转到
搜索 尽早。 和 --sighup-每个, 索引器 将发送一个 签到 发信号给
搜索 在成功完成每个索引的工作后。 (默认行为是
寄单 签到 在建立所有索引之后。)
--详细
保证导致索引问题(重复、零或缺失)的每一行
文件编号; 或文件字段IO问题; 等)将被报告。 默认情况下,此选项
已关闭,并且可能会报告问题摘要。
使用 onworks.net 服务在线使用索引器