这是名为 DocWire SDK 的 Linux 应用程序,其最新版本可下载为 2025.06.29sourcecode.tar.gz。它可在免费的工作站托管服务提供商 OnWorks 上在线运行。
免费下载并在线运行这个名为 DocWire SDK 和 OnWorks 的应用程序。
请按照以下说明运行此应用程序:
- 1. 在您的 PC 中下载此应用程序。
- 2. 在我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX 中输入您想要的用户名。
- 3. 在这样的文件管理器中上传这个应用程序。
- 4. 从此网站启动OnWorks Linux online 或Windows online emulator 或MACOS online emulator。
- 5. 从您刚刚启动的 OnWorks Linux 操作系统,使用您想要的用户名转到我们的文件管理器 https://www.onworks.net/myfiles.php?username=XXXXX。
- 6. 下载应用程序,安装并运行。
DocWire SDK
Ad
商品描述
DocWire SDK 是一款出色的 C++20AI 驱动数据处理工具,曾荣获 SourceForge 大奖,并获得微软的强力支持。它支持近百种文件类型,能够高效提取文本、网页数据和文档分析。
对于企业而言,转向 DocWire SDK 意味着一次飞跃。它承诺提供全面的文档格式支持,并能够利用尖端的人工智能从邮箱、数据库和网站中提取有价值的洞察。
DocWire SDK 旨在扩展其功能,专注于多功能数据提取、平台支持以及与各种系统的无缝集成。
DocWire SDK 致力于简化数据处理,缩短开发时间和降低成本,并充分发挥 AI 的潜力。与前身 DocToText 相比,它的改进将带来更卓越的体验。
特性
- 能够提取/导入和导出文本、图像、格式和元数据以及注释
- 数据可以在导入和导出之间转换(过滤、聚合等)
- 配备多个导入器:Microsoft Office 新 Office Open XML(OOXML):DOCX、XLSX、PPTX 文件,Microsoft Office 旧二进制格式:DOC、XLS、XLSB、PPT 文件,OpenOffice/LibreOffice 开放文档格式(ODF):ODT、ODS、ODP 文件,可移植文档格式:PDF 文件,网页:HTML、HTM 和 CSS 文件,富文本格式:RTF 文件,带附件的电子邮件格式:EML 文件,MS Outlook PST、OST 文件,图像格式:JPG、JPEG、JFIF、BMP、PNM、PNG、TIFF、具有 OCR 功能的 WEBP,Apple iWork:PAGES、NUMBERS、KEYNOTE 文件、ODFXML(FODP、FODS、FODT)、档案(ZIP、TAR、RAR、GZ、BZ2、XZ)、脚本和源代码:ASM、ASP、ASPX、BAS、BAT、C、CC、CMAKE、CSS, CPP、CXX、D、F、FPP、FS、GO、H、HPP、HXX、JAVA、JS、JSP、LUA、PAS、PHP、PL、PERL、PY、R、SH、TCL、VB、VBS、WS 文件、XML 格式系列:XML、XSD、XSL 文件、逗号分隔值:CSV 文件、其他结构化文本格式:JSON、YML、YAML、RSS、CONF 文件、其他非结构化文本格式:MD、LOG 文件、DICOM(DCM)作为附加商业插件
- 配备多种导出工具:纯文本:轻松提取和导出文本内容。HTML:以 HTML 格式导出内容以供网页使用。CSV:将数据导出为逗号分隔值格式。XLSX 及更多导出格式即将推出:适用于各种用例的更多导出格式。
- 促进与外部 HTTP API 或服务的无缝通信,实现与外部系统的数据交换和集成
- 与 OpenAI API 集成:TranslateTo:将文本翻译成不同的语言。Summarize:从较长的文本中生成摘要内容。ExtractEntities:从文本中提取实体和关键信息。Classify:执行文本分类和归类。ExtractKeywords:从文本中识别和提取关键词。DetectSentiment:分析和检测文本中的情绪。AnalyzeData:对文本内容进行数据分析。Chat:进行基于聊天的互动和对话。
- 配备高级、可编写脚本且可训练的 OCR,具有基于 LSTM 神经网络的字符识别功能
- 增量解析一旦数据可用就返回数据
- 跨平台:Linux、Windows、MacOSX(以及更多即将推出)
- 可以嵌入到您的应用程序(SDK)中
- 可以与其他数据挖掘和数据分析应用程序集成
- 通过用管道连接对象,可以轻松设计解析过程 | 运营商进入链
- 基于Boost Signals的链元通信解析
- 可以添加自定义解析链元素(导入器、转换器、导出器)
- 小二进制文件、快速本机 C++ 代码
目的
高级最终用户、开发人员、最终用户/桌面
用户界面
命令行
程式语言
C + +中
分类
此应用程序也可从 https://sourceforge.net/projects/docwire/ 获取。它已托管在 OnWorks 中,以便通过我们的免费操作系统之一以最便捷的方式在线运行。