ഇതാണ് tika-python എന്ന് പേരിട്ടിരിക്കുന്ന Linux ആപ്പ്, ഇതിന്റെ ഏറ്റവും പുതിയ പതിപ്പ് ApacheTika2.6.0Release.zip ആയി ഡൗൺലോഡ് ചെയ്യാം. വർക്ക്സ്റ്റേഷനുകൾക്കായുള്ള സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവായ OnWorks-ൽ ഇത് ഓൺലൈനായി പ്രവർത്തിപ്പിക്കാം.
tika-python എന്ന് പേരിട്ടിരിക്കുന്ന ഈ ആപ്പ് OnWorks-നൊപ്പം സൗജന്യമായി ഡൗൺലോഡ് ചെയ്ത് ഓൺലൈനായി പ്രവർത്തിപ്പിക്കുക.
ഈ ആപ്പ് പ്രവർത്തിപ്പിക്കുന്നതിന് ഈ നിർദ്ദേശങ്ങൾ പാലിക്കുക:
- 1. നിങ്ങളുടെ പിസിയിൽ ഈ ആപ്ലിക്കേഷൻ ഡൗൺലോഡ് ചെയ്തു.
- 2. ഞങ്ങളുടെ ഫയൽ മാനേജറിൽ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിൽ നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമം നൽകുക.
- 3. അത്തരം ഫയൽമാനേജറിൽ ഈ ആപ്ലിക്കേഷൻ അപ്ലോഡ് ചെയ്യുക.
- 4. ഈ വെബ്സൈറ്റിൽ നിന്ന് OnWorks Linux ഓൺലൈനോ Windows ഓൺലൈൻ എമുലേറ്ററോ MACOS ഓൺലൈൻ എമുലേറ്ററോ ആരംഭിക്കുക.
- 5. നിങ്ങൾ ഇപ്പോൾ ആരംഭിച്ച OnWorks Linux OS-ൽ നിന്ന്, നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമത്തോടുകൂടിയ ഞങ്ങളുടെ ഫയൽ മാനേജർ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിലേക്ക് പോകുക.
- 6. ആപ്ലിക്കേഷൻ ഡൌൺലോഡ് ചെയ്യുക, അത് ഇൻസ്റ്റാൾ ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
സ്ക്രീൻഷോട്ടുകൾ
Ad
ടിക-പൈത്തൺ
വിവരണം
Tika REST സെർവർ ഉപയോഗിച്ച് Tika ലഭ്യമാക്കുന്ന Apache Tika ലൈബ്രറിയുടെ ഒരു പൈത്തൺ പോർട്ട്. ഇത് അപ്പാച്ചെ ടിക്കയെ ഒരു പൈത്തൺ ലൈബ്രറിയായി ലഭ്യമാക്കുന്നു, സെറ്റപ്ടൂളുകൾ, പിപ്പ് എന്നിവ വഴി ഇൻസ്റ്റാൾ ചെയ്യാവുന്നതും ഇൻസ്റ്റാൾ ചെയ്യാൻ എളുപ്പവുമാണ്. ഈ ലൈബ്രറി ഉപയോഗിക്കുന്നതിന്, പശ്ചാത്തലത്തിൽ tika-python Tika REST സെർവർ ആരംഭിക്കുന്നതിനാൽ നിങ്ങളുടെ സിസ്റ്റത്തിൽ Java 7+ ഇൻസ്റ്റാൾ ചെയ്യേണ്ടതുണ്ട്. ഇത് വിച്ഛേദിക്കപ്പെട്ട പരിതസ്ഥിതിയിൽ പ്രവർത്തിക്കുന്നതിന്, ഒരു ടിക്ക സെർവർ ഫയൽ ഡൗൺലോഡ് ചെയ്യുക (tika-server.jar, tika-server.jar.md5 എന്നിവയും ഇവിടെ കാണാം) കൂടാതെ TIKA_SERVER_JAR എൻവയോൺമെന്റ് വേരിയബിളിനെ TIKA_SERVER_JAR="file:// എന്നതിലേക്ക് സജ്ജമാക്കുക. //tika-server.jar" ഈ ഫയൽ "ഡൗൺലോഡ്" ചെയ്യാനും /tmp/tika-server.jar-ലേക്ക് നീക്കാനും ഒരു പശ്ചാത്തല പ്രക്രിയയായി പ്രവർത്തിപ്പിക്കാനും പൈത്തൺ-ടികയോട് വിജയകരമായി പറയുന്നു. ഇന്റർനെറ്റ് ആക്സസ് ഇല്ലാതെ പൈത്തൺ-ടിക്ക പ്രവർത്തിപ്പിക്കാനുള്ള ഒരേയൊരു മാർഗ്ഗമാണിത്. ഈ സെറ്റ് കൂടാതെ, ടിക്ക പതിപ്പ് പരിശോധിച്ച് അപ്പാച്ചെയിൽ നിന്ന് ഓരോ തവണയും ഏറ്റവും പുതിയത് വലിക്കുക എന്നതാണ് ഡിഫോൾട്ട്.
സവിശേഷതകൾ
- പാർസർ ഇന്റർഫേസ് (REST-ന് മുമ്പുള്ള ബാക്ക്വേർഡ് കോംപാറ്റ്)
- /rmeta ഇന്റർഫേസ് ഉപയോഗിച്ച് പാഴ്സർ ഇന്റർഫേസ് ടെക്സ്റ്റും മെറ്റാഡാറ്റയും എക്സ്ട്രാക്റ്റ് ചെയ്യുന്നു
- ഓപ്ഷണലായി, മൾട്ടി-ഇൻസ്റ്റൻസ് എക്സിക്യൂഷന് എന്ത് ഉപയോഗപ്രദമാണ് എന്ന കോൾ സഹിതം നിങ്ങൾക്ക് ടിക്ക സെർവർ URL കൈമാറാം
- XHTML-ലേക്ക് ഔട്ട്പുട്ട് ഫോർമാറ്റ് വ്യക്തമാക്കുക
- അൺപാക്ക് ഇന്റർഫേസ് ഒരൊറ്റ കോളിൽ മെറ്റാഡാറ്റയും ടെക്സ്റ്റ് എക്സ്ട്രാക്ഷനും കൈകാര്യം ചെയ്യുന്നു
- ആന്തരികമായി പാക്ക് ചെയ്യാത്ത മെറ്റാഡാറ്റയുടെയും ടെക്സ്റ്റ് എൻട്രികളുടെയും ഒരു ടാർബോൾ തിരികെ നൽകുന്നു
പ്രോഗ്രാമിംഗ് ഭാഷ
പൈത്തൺ
Categories
https://sourceforge.net/projects/tika-python.mirror/ എന്നതിൽ നിന്നും ലഭിക്കാവുന്ന ഒരു ആപ്ലിക്കേഷനാണിത്. ഞങ്ങളുടെ സൗജന്യ ഓപ്പറേറ്റീവ് സിസ്റ്റങ്ങളിലൊന്നിൽ നിന്ന് ഏറ്റവും എളുപ്പമുള്ള രീതിയിൽ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി ഇത് OnWorks-ൽ ഹോസ്റ്റ് ചെയ്തിരിക്കുന്നു.