这是一个名为 WordSegment 的 Linux 应用程序,其最新版本可以下载为 wordseg_demo.zip。 它可以在工作站的免费托管服务提供商 OnWorks 中在线运行。
使用 OnWorks 免费下载并在线运行这个名为 WordSegment 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
词段
Ad
商品描述
wordseg 项目是一个用 C# 实现的词段模块。 它用于将文本分割为标记,并通过前最大匹配和 CRF 算法根据其上下文和语义标记标记的属性。
以下是一些需要分词的句子:
张晓晨和付仲恺河一起坐在家里(西坝东里社区)里的沙发上看非诚勿打扰。
百度公司的名字叫“众里寻他千百度”这首诗句。
上面的句子用wordseg切分后,每个句子的结果如下:
张晓晨[PER]和付仲恺[PER]一起坐在家里(西坝河东里社区[LOC])里的沙发[PDT]上看非诚勿扰。
百度公司[ORG]的名字叫“众里寻他千百度”这句诗句。
在上面,如果一个token有一些属性,属性结果会被附加到“[]”内的对应token中。
由于 wordseg 引入了统计模型来按上下文对文本进行分割,对于不同上下文中的相同子串,dif
目的
信息技术、科学/研究、教育、高级最终用户、开发人员、工程
用户界面
控制台/终端,命令行
程式语言
C#
分类
这是一个也可以从 https://sourceforge.net/projects/wordseg/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。