Il s'agit de l'application Linux appelée DocWire SDK, dont la dernière version est téléchargeable sous le numéro 2025.08.13sourcecode.tar.gz. Elle peut être exécutée en ligne sur l'hébergeur gratuit OnWorks pour postes de travail.
Téléchargez et exécutez en ligne gratuitement cette application nommée DocWire SDK avec OnWorks.
Suivez ces instructions pour exécuter cette application :
- 1. Téléchargé cette application sur votre PC.
- 2. Entrez dans notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous voulez.
- 3. Téléchargez cette application dans ce gestionnaire de fichiers.
- 4. Démarrez l'émulateur en ligne OnWorks Linux ou Windows en ligne ou l'émulateur en ligne MACOS à partir de ce site Web.
- 5. Depuis le système d'exploitation OnWorks Linux que vous venez de démarrer, accédez à notre gestionnaire de fichiers https://www.onworks.net/myfiles.php?username=XXXXX avec le nom d'utilisateur que vous souhaitez.
- 6. Téléchargez l'application, installez-la et exécutez-la.
Kit de développement logiciel (SDK) DocWire
Ad
DESCRIPTION
DocWire SDK, un outil de traitement de données performant basé sur C++20AI, a été récompensé par SourceForge et bénéficie du soutien de Microsoft. Il gère près de 100 types de fichiers, permettant une extraction de texte efficace, l'extraction de données web et l'analyse de documents.
Pour les entreprises, le passage au SDK DocWire représente un véritable bond en avant. Il promet une prise en charge complète des formats de documents et la possibilité d'extraire des informations précieuses des boîtes e-mail, des bases de données et des sites web grâce à une IA de pointe.
DocWire SDK vise à étendre ses capacités, en se concentrant sur l'extraction de données polyvalente, la prise en charge de la plate-forme et l'intégration transparente avec divers systèmes.
Le SDK DocWire vise à optimiser le traitement des données, à réduire les délais et les coûts de développement et à exploiter le potentiel de l'IA. Ses avancées promettent une expérience supérieure à celle de son prédécesseur, DocToText.
Caractéristiques
- Capable d'extraire/importer et d'exporter du texte, des images, du formatage et des métadonnées ainsi que des annotations
- Les données peuvent être transformées entre l'importation et l'exportation (filtrage, agrégation, etc.)
- Équipé de plusieurs importateurs : Microsoft Office nouveau Office Open XML (OOXML) : fichiers DOCX, XLSX, PPTX, anciens formats binaires Microsoft Office : fichiers DOC, XLS, XLSB, PPT, OpenOffice/LibreOffice Open Document Format (ODF) : fichiers ODT, ODS, ODP, Portable Document Format : fichiers PDF, Pages Web : fichiers HTML, HTM et CSS, Rich Text Format : fichiers RTF, Formats d'e-mail avec pièces jointes : fichiers EML, MS Outlook PST, fichiers OST, Formats d'image : JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP avec capacités OCR, Apple iWork : fichiers PAGES, NUMBERS, KEYNOTE, ODFXML (FODP, FODS, FODT), Archives (ZIP, TAR, RAR, GZ, BZ2, XZ), Scripts et codes sources : ASM, ASP, ASPX, BAS, BAT, C, CC, CMAKE, CS, CPP, CXX, D, F, Fichiers FPP, FS, GO, H, HPP, HXX, JAVA, JS, JSP, LUA, PAS, PHP, PL, PERL, PY, R, SH, TCL, VB, VBS, WS, famille de formats XML : fichiers XML, XSD, XSL, valeurs séparées par des virgules : fichiers CSV, autres formats de texte structuré : fichiers JSON, YML, YAML, RSS, CONF, autres formats de texte non structuré : fichiers MD, LOG, DICOM (DCM) comme plug-in commercial supplémentaire
- Équipé de plusieurs exportateurs : Texte brut : extrayez et exportez facilement du contenu texte. HTML : exportez du contenu au format HTML pour une utilisation Web. CSV : exportez des données au format de valeurs séparées par des virgules. XLSX et plus encore à venir : formats d'exportation supplémentaires pour divers cas d'utilisation.
- Faciliter la communication transparente avec les API ou services HTTP externes, permettant l'échange de données et l'intégration avec des systèmes externes
- Intégration avec l'API OpenAI : TranslateTo : Traduisez du texte dans différentes langues. Summarize : Générez du contenu résumé à partir de textes plus longs. ExtractEntities : Extrayez des entités et des informations clés du texte. Classify : Effectuez la classification et la catégorisation du texte. ExtractKeywords : Identifiez et extrayez des mots-clés du texte. DetectSentiment : Analysez et détectez les sentiments dans le texte. AnalyzeData : Effectuez une analyse de données sur le contenu du texte. Chat : Menez des interactions et des conversations par chat.
- Équipé d'un OCR de haute qualité, scriptable et entraînable, doté d'une reconnaissance de caractères basée sur les réseaux neuronaux LSTM
- Analyse incrémentielle renvoyant les données dès qu'elles sont disponibles
- Multiplateforme : Linux, Windows, MacOSX (et bien d'autres à venir)
- Peut être intégré dans votre application (SDK)
- Peut être intégré à d’autres applications d’exploration de données et d’analyse de données
- Le processus d'analyse peut être facilement conçu en connectant des objets avec un tuyau | opérateur dans une chaîne
- Analyse de la communication des éléments de la chaîne basée sur les signaux Boost
- Des éléments de chaîne d'analyse personnalisés peuvent être ajoutés (importateurs, transformateurs, exportateurs)
- Petits binaires, code C++ natif rapide
Audience
Utilisateurs finaux avancés, développeurs, utilisateurs finaux/bureau
Interface utilisateur
Ligne de commande
Langage de programmation
C + +
Catégories
Cette application peut également être téléchargée depuis https://sourceforge.net/projects/docwire/. Elle est hébergée sur OnWorks afin de pouvoir être exécutée en ligne plus facilement depuis l'un de nos systèmes d'exploitation gratuits.