این برنامه لینوکس با نام tika-python است که آخرین نسخه آن را می توان با نام ApacheTika2.6.0Release.zip دانلود کرد. می توان آن را به صورت آنلاین در ارائه دهنده میزبانی رایگان OnWorks برای ایستگاه های کاری اجرا کرد.
این اپلیکیشن به نام tika-python را با OnWorks به صورت آنلاین دانلود و اجرا کنید.
برای اجرای این برنامه این دستورالعمل ها را دنبال کنید:
- 1. این برنامه را در رایانه شخصی خود دانلود کنید.
- 2. در فایل منیجر ما https://www.onworks.net/myfiles.php?username=XXXXX نام کاربری مورد نظر خود را وارد کنید.
- 3. این برنامه را در چنین فایل منیجر آپلود کنید.
- 4. OnWorks Linux آنلاین یا شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MACOS را از این وب سایت راه اندازی کنید.
- 5. از سیستم عامل لینوکس OnWorks که به تازگی راه اندازی کرده اید، به مدیر فایل ما https://www.onworks.net/myfiles.php?username=XXXXX با نام کاربری که می خواهید بروید.
- 6. اپلیکیشن را دانلود کرده، نصب و اجرا کنید.
عکس ها
Ad
tika-python
شرح
یک پورت پایتون از کتابخانه Apache Tika که Tika را با استفاده از سرور Tika REST در دسترس قرار می دهد. این باعث می شود Apache Tika به عنوان یک کتابخانه پایتون قابل نصب از طریق Setuptools، Pip و نصب آسان باشد. برای استفاده از این کتابخانه، باید جاوا 7+ را روی سیستم خود نصب کنید زیرا tika-python سرور Tika REST را در پسزمینه راهاندازی میکند. برای اینکه این کار در یک محیط قطع شده کار کند، یک فایل سرور tika را دانلود کنید (هم tika-server.jar و هم tika-server.jar.md5 که در اینجا یافت می شود) و متغیر محیطی TIKA_SERVER_JAR را روی TIKA_SERVER_JAR="file://قرار دهید. //tika-server.jar" که با موفقیت به python-tika می گوید که این فایل را "دانلود" کند و آن را به /tmp/tika-server.jar منتقل کند و به عنوان یک فرآیند پس زمینه اجرا شود. این تنها راه برای اجرای python-tika بدون دسترسی به اینترنت است. بدون این مجموعه، پیش فرض این است که نسخه tika را بررسی کنید و هر بار آخرین نسخه را از آپاچی بکشید.
امکانات
- واسط تجزیه کننده (سازگار با عقب قبل از REST)
- رابط تجزیه کننده متن و ابرداده را با استفاده از رابط /rmeta استخراج می کند
- به صورت اختیاری، میتوانید URL سرور Tika را به همراه تماسی که برای اجرای چند نمونه مفید است ارسال کنید.
- فرمت خروجی را در XHTML مشخص کنید
- واسط باز کردن بسته بندی، هم فراداده و هم استخراج متن را در یک تماس انجام می دهد
- به صورت داخلی، تاربالی از متادیتا و ورودیهای متنی را که در داخل بستهبندی نشده است، برمیگرداند
زبان برنامه نویسی
پــایتــون
دسته بندی ها
این برنامه ای است که می تواند از https://sourceforge.net/projects/tika-python.mirror/ نیز دریافت شود. در OnWorks میزبانی شده است تا به آسانی از یکی از سیستم عامل های رایگان ما به صورت آنلاین اجرا شود.