Это приложение Linux под названием DocWire SDK, последний релиз которого можно загрузить как 2025.08.13sourcecode.tar.gz. Его можно запустить онлайн на бесплатном хостинг-провайдере OnWorks для рабочих станций.
Загрузите и запустите онлайн это приложение под названием DocWire SDK с OnWorks бесплатно.
Следуйте этим инструкциям, чтобы запустить это приложение:
- 1. Загрузил это приложение на свой компьютер.
- 2. Введите в нашем файловом менеджере https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 3. Загрузите это приложение в такой файловый менеджер.
- 4. Запустите онлайн-эмулятор OnWorks Linux или Windows или онлайн-эмулятор MACOS с этого веб-сайта.
- 5. В только что запущенной ОС OnWorks Linux перейдите в наш файловый менеджер https://www.onworks.net/myfiles.php?username=XXXXX с желаемым именем пользователя.
- 6. Скачайте приложение, установите его и запустите.
DocWire SDK
ОПИСАНИЕ:
DocWire SDK, выдающийся инструмент обработки данных на основе C++20AI, получил награду от SourceForge и мощную поддержку от Microsoft. Он обрабатывает около 100 типов файлов, обеспечивая эффективное извлечение текста, извлечение веб-данных и анализ документов.
Для предприятий переход на DocWire SDK означает скачок вперед. Он обещает комплексную поддержку форматов документов и возможность извлекать ценную информацию из почтовых ящиков, баз данных и веб-сайтов с использованием передового ИИ.
DocWire SDK нацелен на расширение своих возможностей, уделяя особое внимание универсальному извлечению данных, поддержке платформ и бесшовной интеграции с различными системами.
DocWire SDK предназначен для оптимизации обработки данных, сокращения времени и затрат на разработку и использования потенциала ИИ. Его усовершенствования обещают превосходный опыт по сравнению с его предшественником DocToText.
Особенности
- Возможность извлечения/импорта и экспорта текста, изображений, форматирования и метаданных вместе с аннотациями.
- Данные можно преобразовывать между импортом и экспортом (фильтрация, агрегация и т. д.)
- Оснащен несколькими импортерами: Microsoft Office новый Office Open XML (OOXML): файлы DOCX, XLSX, PPTX, старые двоичные форматы Microsoft Office: файлы DOC, XLS, XLSB, PPT, OpenOffice/LibreOffice Open Document Format (ODF): файлы ODT, ODS, ODP, Portable Document Format: файлы PDF, веб-страницы: файлы HTML, HTM и CSS, Rich Text Format: файлы RTF, форматы электронной почты с вложениями: файлы EML, файлы MS Outlook PST, OST, форматы изображений: JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP с возможностями OCR, Apple iWork: файлы PAGES, NUMBERS, KEYNOTE, ODFXML (FODP, FODS, FODT), архивы (ZIP, TAR, RAR, GZ, BZ2, XZ), скрипты и исходные коды: ASM, ASP, ASPX, BAS, Файлы BAT, C, CC, CMAKE, CS, CPP, CXX, D, F, FPP, FS, GO, H, HPP, HXX, JAVA, JS, JSP, LUA, PAS, PHP, PL, PERL, PY, R, SH, TCL, VB, VBS, WS, Семейство форматов XML: файлы XML, XSD, XSL, Значения, разделенные запятыми: файлы CSV, Другие структурированные текстовые форматы: файлы JSON, YML, YAML, RSS, CONF, Другие неструктурированные текстовые форматы: файлы MD, LOG, DICOM (DCM) как дополнительный коммерческий плагин
- Оснащен несколькими экспортерами: Обычный текст: легко извлекайте и экспортируйте текстовый контент. HTML: экспортируйте контент в формате HTML для использования в Интернете. CSV: экспортируйте данные в формат значений, разделенных запятыми. XLSX и другие в разработке: дополнительные форматы экспорта для различных вариантов использования.
- Обеспечить бесперебойную связь с внешними HTTP API или службами, обеспечивая обмен данными и интеграцию с внешними системами
- Интеграция с API OpenAI: TranslateTo: перевод текста на разные языки. Summarize: создание обобщенного контента из длинных текстов. ExtractEntities: извлечение сущностей и ключевой информации из текста. Classify: выполнение классификации и категоризации текста. ExtractKeywords: определение и извлечение ключевых слов из текста. DetectSentiment: анализ и обнаружение настроений в тексте. AnalyzeData: выполнение анализа данных по текстовому контенту. Chat: проведение взаимодействий и бесед в чате.
- Оснащен высококачественным, программируемым и обучаемым устройством оптического распознавания символов с распознаванием символов на основе нейронных сетей LSTM.
- Инкрементный анализ, возвращающий данные, как только они станут доступны.
- Кроссплатформенность: Linux, Windows, MacOSX (и скоро)
- Можно встроить в ваше приложение (SDK)
- Может быть интегрирован с другими приложениями для интеллектуального анализа и анализа данных.
- Процесс разбора можно легко спроектировать, соединив объекты трубой | оператор в цепочку
- Анализ связи элементов цепочки на основе сигналов Boost
- Могут быть добавлены пользовательские элементы цепочки синтаксического анализа (импортеры, преобразователи, экспортеры).
- Небольшие двоичные файлы, быстрый собственный код C++.
Аудитория
Опытные конечные пользователи, разработчики, конечные пользователи / рабочий стол
Интерфейс пользователя
Командная строка
Язык программирования
C + +
Категории
Это приложение, которое также можно загрузить с https://sourceforge.net/projects/docwire/. Оно размещено в OnWorks для того, чтобы его можно было запустить онлайн самым простым способом из одной из наших бесплатных операционных систем.