Questa è l'app Windows denominata DocWire DocToText la cui ultima versione può essere scaricata come doctotext-5.0.9-msvc.zip. Può essere eseguito online nel provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online questa app denominata DocWire DocToText con OnWorks gratuitamente.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avvia qualsiasi emulatore online OS OnWorks da questo sito Web, ma migliore emulatore online Windows.
- 5. Dal sistema operativo OnWorks Windows che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione e installala.
- 7. Scarica Wine dai repository software delle tue distribuzioni Linux. Una volta installato, puoi quindi fare doppio clic sull'app per eseguirli con Wine. Puoi anche provare PlayOnLinux, un'interfaccia fantasiosa su Wine che ti aiuterà a installare programmi e giochi Windows popolari.
Wine è un modo per eseguire il software Windows su Linux, ma senza Windows richiesto. Wine è un livello di compatibilità Windows open source in grado di eseguire programmi Windows direttamente su qualsiasi desktop Linux. Essenzialmente, Wine sta cercando di re-implementare abbastanza Windows da zero in modo che possa eseguire tutte quelle applicazioni Windows senza effettivamente bisogno di Windows.
DocWire DocToText
Ad
DESCRIZIONE
DocToText di DocWire: un toolkit di sviluppo software per l'estrazione di dati poliedrico che converte tutti i tipi di file in testo normale e html. Scritto in C++, questo strumento di estrazione dati ha un parser in grado di convertire file PST e OST insieme a una nuovissima API per una migliore elaborazione dei file.
Per migliorare la sua utilità, DocToText, come strumento di estrazione dei dati, può essere integrato con altre applicazioni di data mining e analisi dei dati. È dotato di un OCR di alta qualità, programmabile e addestrabile con riconoscimento dei caratteri basato su reti neurali LSTM. Questo analizzatore di documenti è in grado di estrarre metadati insieme ad annotazioni e supporta un elenco di formati che include: DOC, XLS, XLSB, PPT, RTF, ODF (ODT, ODS, ODP),
OOXML (DOCX, XLSX, PPTX), iWork (PAGINE, NUMERI, KEYNOTE),
ODFXML (FODP, FODS, FODT), PDF, EML, HTML, Outlook (PST, OST),
Immagine (JPG, JPEG, JFIF, BMP, PNM, PNG, TIFF, WEBP)
Disponibile con licenza GNU General Public License versione 2.0 (GPLv2) e licenza commerciale.
Caratteristiche
- Possibilità di estrarre/importare ed esportare testo, immagini, formattazione e metadati insieme alle annotazioni
- I dati possono essere trasformati tra importazione ed esportazione (filtraggio, aggregazione, ecc.)
- Dotato di più importatori
- Dotato di più esportatori
- Dotato di un OCR di alta qualità, programmabile e addestrabile con riconoscimento dei caratteri basato su reti neurali LSTM
- Analisi incrementale che restituisce i dati non appena sono disponibili
- Multipiattaforma: Linux, Windows, MacOSX (e altro in arrivo)
- Può essere incorporato nell'applicazione (SDK)
- Può essere integrato con altre applicazioni di data mining e analisi dei dati
- Il processo di analisi può essere facilmente progettato collegando gli oggetti con pipe | operatore in una catena
- Analisi della comunicazione degli elementi della catena basata su segnali di boost
- È possibile aggiungere elementi della catena di analisi personalizzata (importatori, trasformatori, esportatori)
- Binari piccoli, codice C++ nativo veloce
Pubblico
Utenti finali avanzati, sviluppatori, utenti finali/desktop
Interfaccia utente
Riga di comando
Linguaggio di programmazione
C++, C
Categorie
Questa è un'applicazione che può essere scaricata anche da https://sourceforge.net/projects/doctotext/. È stato ospitato in OnWorks per essere eseguito online nel modo più semplice da uno dei nostri sistemi operativi gratuiti.