这是名为 StringZilla 的 Linux 应用程序,其最新版本可以下载为 stringzilla_shared_windows_x86_4.0.6.tar。它可以在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费下载并使用 OnWorks 在线运行名为 StringZilla 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
SCREENSHOTS
Ad
斯特林齐拉
商品描述
StringZilla 是字符串库中的哥斯拉,可以对大型文本数据集进行分割、排序和洗牌。 StringZilla 使用的启发式方法非常简单,几乎是愚蠢的……但它确实有效。 它将单词的前几个字母与超标量代码相匹配,以实现 memcpy 速度。 该实现适合单个 C 99 头文件,并在旧平台上使用不同的 SIMD 风格和 SWAR。 Str 旨在替换长 Python str 字符串并包装我们的 C 级 API。 另一方面,文件从持久内存中内存映射文件,而不将其副本加载到 RAM 中。 该文件的内容将保持不变,并且映射可以由多个 Python 进程同时共享。 标准数据集预处理用例是将像 Common Crawl 这样的大型文本数据集映射到内存中,生成子进程,并在它们之间拆分作业。
功能
- 集合级操作
- 低级 Python API
- 字符串库、分割、排序和洗牌大型文本数据集
- JavaScript 文档
- Python 文档
- 子串搜索
程式语言
C + +中
分类
这是一个也可以从 https://sourceforge.net/projects/stringzilla.mirror/ 获取的应用程序。 它已托管在 OnWorks 中,以便从我们的免费操作系统之一以最简单的方式在线运行。