این برنامه ویندوز با نام DocWire DocToText است که آخرین نسخه آن را می توان با عنوان doctotext-5.0.9-msvc.zip دانلود کرد. می توان آن را به صورت آنلاین در ارائه دهنده میزبانی رایگان OnWorks برای ایستگاه های کاری اجرا کرد.
این اپلیکیشن با نام DocWire DocToText را با OnWorks به صورت آنلاین دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. هر شبیه ساز آنلاین OS OnWorks را از این وب سایت راه اندازی کنید، اما شبیه ساز آنلاین ویندوز بهتر است.
- 5. از OnWorks Windows OS که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. برنامه را دانلود و نصب کنید.
- 7. Wine را از مخازن نرم افزار توزیع لینوکس خود دانلود کنید. پس از نصب، می توانید روی برنامه دوبار کلیک کنید تا آنها را با Wine اجرا کنید. همچنین می توانید PlayOnLinux را امتحان کنید، یک رابط کاربری فانتزی بر روی Wine که به شما کمک می کند برنامه ها و بازی های محبوب ویندوز را نصب کنید.
Wine راهی برای اجرای نرم افزار ویندوز بر روی لینوکس است، اما بدون نیاز به ویندوز. Wine یک لایه سازگار با ویندوز منبع باز است که می تواند برنامه های ویندوز را مستقیماً بر روی هر دسکتاپ لینوکس اجرا کند. اساساً، Wine در تلاش است تا به اندازه کافی از ویندوز را از ابتدا مجدداً پیاده سازی کند تا بتواند همه آن برنامه های ویندوز را بدون نیاز به ویندوز اجرا کند.
DocWire DocToText
Ad
شرح
DocToText DocWire - یک مجموعه ابزار توسعه نرم افزار استخراج داده چند وجهی که انواع فایل ها را به متن ساده و html تبدیل می کند. این ابزار استخراج داده که به زبان C++ نوشته شده است، دارای تجزیه کننده ای است که می تواند فایل های PST و OST را به همراه یک API کاملاً جدید برای پردازش بهتر فایل تبدیل کند.
برای افزایش کاربرد آن، DocToText، به عنوان یک ابزار استخراج داده، می تواند با سایر برنامه های داده کاوی و تجزیه و تحلیل داده ادغام شود. مجهز به یک OCR درجه بالا، قابل برنامهنویسی و آموزش است که دارای تشخیص کاراکتر مبتنی بر شبکههای عصبی LSTM است. این تجزیه کننده اسناد قادر به استخراج ابرداده به همراه حاشیه نویسی است و لیستی از فرمت ها را پشتیبانی می کند که عبارتند از: DOC، XLS، XLSB، PPT، RTF، ODF (ODT، ODS، ODP)،
OOXML (DOCX، XLSX، PPTX)، iWork (PAGES، NUMBERs، KEYNOTE)،
ODFXML (FODP، FODS، FODT)، PDF، EML، HTML، Outlook (PST، OST)،
تصویر (JPG، JPEG، JFIF، BMP، PNM، PNG، TIFF، WEBP)
تحت مجوز عمومی عمومی گنو نسخه 2.0 (GPLv2) و مجوز تجاری موجود است.
امکانات
- امکان استخراج/وارد کردن و صادرات متن، تصاویر، قالب بندی و ابرداده به همراه حاشیه نویسی
- داده ها را می توان بین واردات و صادرات (فیلتر کردن، تجمیع و غیره) تبدیل کرد.
- مجهز به چند واردکننده
- مجهز به صادرکنندگان متعدد
- مجهز به یک OCR درجه بالا، قابل اسکریپت و آموزش پذیر است که دارای تشخیص کاراکتر مبتنی بر شبکه های عصبی LSTM است.
- تجزیه افزایشی داده ها را به محض در دسترس بودن برمی گرداند
- پلتفرم متقابل: لینوکس، ویندوز، MacOSX (و موارد دیگر در راه است)
- قابل جاسازی در برنامه شما (SDK)
- می تواند با سایر برنامه های داده کاوی و تجزیه و تحلیل داده ادغام شود
- فرآیند تجزیه را می توان به راحتی با اتصال اجسام با لوله | طراحی کرد اپراتور در یک زنجیره
- ارتباط عناصر زنجیره تجزیه بر اساس سیگنال های تقویتی
- عناصر زنجیره تجزیه سفارشی را می توان اضافه کرد (واردکنندگان، ترانسفورماتورها، صادرکنندگان)
- باینری های کوچک، کد بومی C++ سریع
مخاطبان
کاربران نهایی پیشرفته، توسعه دهندگان، کاربران نهایی / دسکتاپ
رابط کاربری
خط فرمان
زبان برنامه نویسی
C++، C
دسته بندی ها
این برنامه ای است که می تواند از https://sourceforge.net/projects/doctotext/ نیز دریافت شود. در OnWorks میزبانی شده است تا به آسانی از یکی از سیستم عامل های رایگان ما به صورت آنلاین اجرا شود.