यह tika-python नाम का Linux ऐप है जिसकी नवीनतम रिलीज़ को ApacheTika2.6.0Release.zip के रूप में डाउनलोड किया जा सकता है। इसे वर्कस्टेशन के लिए मुफ्त होस्टिंग प्रदाता ऑनवर्क्स में ऑनलाइन चलाया जा सकता है।
टिका-पाइथन नाम के इस ऐप को ऑनवर्क्स के साथ मुफ्त में डाउनलोड करें और चलाएं।
इस ऐप को चलाने के लिए इन निर्देशों का पालन करें:
- 1. इस एप्लिकेशन को अपने पीसी में डाउनलोड करें।
- 2. हमारे फ़ाइल प्रबंधक में https://www.onworks.net/myfiles.php?username=XXXXX उस उपयोगकर्ता नाम के साथ दर्ज करें जो आप चाहते हैं।
- 3. इस एप्लिकेशन को ऐसे फाइल मैनेजर में अपलोड करें।
- 4. इस वेबसाइट से ऑनवर्क्स लिनक्स ऑनलाइन या विंडोज ऑनलाइन एमुलेटर या मैकोज़ ऑनलाइन एमुलेटर शुरू करें।
- 5. ऑनवर्क्स लिनक्स ओएस से आपने अभी शुरुआत की है, हमारे फाइल मैनेजर को https://www.onworks.net/myfiles.php?username=XXXXX उस यूजरनेम के साथ जाएं जो आप चाहते हैं।
- 6. एप्लिकेशन डाउनलोड करें, इसे इंस्टॉल करें और इसे चलाएं।
स्क्रीनशॉट
Ad
टीका-अजगर
वर्णन
Apache Tika लाइब्रेरी का एक Python पोर्ट जो Tika REST सर्वर का उपयोग करके Tika को उपलब्ध कराता है। यह Apache Tika को Python लाइब्रेरी के रूप में उपलब्ध कराता है, जिसे Setuptools, Pip के माध्यम से इंस्टॉल किया जा सकता है और इंस्टॉल करना आसान है। इस लाइब्रेरी का उपयोग करने के लिए, आपको अपने सिस्टम पर Java 7+ इंस्टॉल करना होगा क्योंकि tika-python बैकग्राउंड में Tika REST सर्वर शुरू करता है। डिस्कनेक्ट किए गए वातावरण में इसे काम करने के लिए, एक टीका सर्वर फ़ाइल (दोनों tika-server.jar और tika-server.jar.md5, जो यहां मिल सकती है) डाउनलोड करें और TIKA_SERVER_JAR पर्यावरण चर को TIKA_SERVER_JAR="file:// पर सेट करें। //tika-server.jar" जो इस फ़ाइल को "डाउनलोड" करने के लिए python-tika को सफलतापूर्वक बताता है और इसे /tmp/tika-server.jar पर ले जाता है और पृष्ठभूमि प्रक्रिया के रूप में चलाता है। बिना इंटरनेट एक्सेस के अजगर-टीका चलाने का यही एकमात्र तरीका है। इस सेट के बिना, डिफ़ॉल्ट टीका संस्करण की जांच करना और अपाचे से हर बार नवीनतम खींचना है।
विशेषताएं
- पार्सर इंटरफ़ेस (REST से पहले बैकवर्ड कॉम्पिटिटर)
- पार्सर इंटरफ़ेस /rmeta इंटरफ़ेस का उपयोग करके टेक्स्ट और मेटाडेटा निकालता है
- वैकल्पिक रूप से, आप टीका सर्वर यूआरएल को कॉल के साथ पास कर सकते हैं जो बहु-आवृत्ति निष्पादन के लिए उपयोगी है
- एक्सएचटीएमएल के लिए आउटपुट स्वरूप निर्दिष्ट करें
- अनपैक इंटरफ़ेस एक कॉल में मेटाडेटा और टेक्स्ट निष्कर्षण दोनों को संभालता है
- आंतरिक रूप से अनपैक्ड मेटाडेटा और पाठ प्रविष्टियों का एक टैरबॉल आंतरिक रूप से वापस लौटाता है
प्रोग्रामिंग भाषा
अजगर
श्रेणियाँ
यह एक ऐसा एप्लिकेशन है जिसे https://sourceforge.net/projects/tika-python.mirror/ से भी प्राप्त किया जा सकता है। इसे हमारे निःशुल्क ऑपरेटिव सिस्टम में से किसी एक से आसान तरीके से ऑनलाइन चलाने के लिए ऑनवर्क्स में होस्ट किया गया है।