CC-Net എന്ന് പേരിട്ടിരിക്കുന്ന Linux ആപ്പാണിത്, ഇതിന്റെ ഏറ്റവും പുതിയ പതിപ്പ് cc_net1.0.0sourcecode.tar.gz ആയി ഡൗൺലോഡ് ചെയ്യാം. വർക്ക്സ്റ്റേഷനുകൾക്കായുള്ള സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവായ OnWorks-ൽ ഇത് ഓൺലൈനായി പ്രവർത്തിപ്പിക്കാം.
CC-Net എന്ന് പേരിട്ടിരിക്കുന്ന ഈ ആപ്പ് OnWorks-നൊപ്പം സൗജന്യമായി ഓൺലൈനായി ഡൗൺലോഡ് ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
ഈ ആപ്പ് പ്രവർത്തിപ്പിക്കുന്നതിന് ഈ നിർദ്ദേശങ്ങൾ പാലിക്കുക:
- 1. നിങ്ങളുടെ പിസിയിൽ ഈ ആപ്ലിക്കേഷൻ ഡൗൺലോഡ് ചെയ്തു.
- 2. ഞങ്ങളുടെ ഫയൽ മാനേജറിൽ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിൽ നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമം നൽകുക.
- 3. അത്തരം ഫയൽമാനേജറിൽ ഈ ആപ്ലിക്കേഷൻ അപ്ലോഡ് ചെയ്യുക.
- 4. ഈ വെബ്സൈറ്റിൽ നിന്ന് OnWorks Linux ഓൺലൈനോ Windows ഓൺലൈൻ എമുലേറ്ററോ MACOS ഓൺലൈൻ എമുലേറ്ററോ ആരംഭിക്കുക.
- 5. നിങ്ങൾ ഇപ്പോൾ ആരംഭിച്ച OnWorks Linux OS-ൽ നിന്ന്, നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമത്തോടുകൂടിയ ഞങ്ങളുടെ ഫയൽ മാനേജർ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിലേക്ക് പോകുക.
- 6. ആപ്ലിക്കേഷൻ ഡൌൺലോഡ് ചെയ്യുക, അത് ഇൻസ്റ്റാൾ ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
സ്ക്രീൻഷോട്ടുകൾ:
സിസി-നെറ്റ്
വിവരണം:
മോണോലിംഗ്വൽ ഡാറ്റാസെറ്റുകളും അനുബന്ധ പേപ്പറിൽ അവതരിപ്പിച്ച ബഹുഭാഷാ CC-100 ശേഖരവും ഉൾപ്പെടെ വലിയ തോതിലുള്ള ടെക്സ്റ്റ് കോർപ്പറ നിർമ്മിക്കുന്നതിന് കോമൺ ക്രാൾ ഡൗൺലോഡ് ചെയ്യാനും, സെഗ്മെന്റ് ചെയ്യാനും, ക്ലീൻ ചെയ്യാനും, ഫിൽട്ടർ ചെയ്യാനും cc_net ഉപകരണങ്ങൾ നൽകുന്നു. സ്നാപ്പ്ഷോട്ടുകൾ ലഭ്യമാക്കുന്നതിനും, ടെക്സ്റ്റ് എക്സ്ട്രാക്റ്റ് ചെയ്യുന്നതിനും, ഡ്യൂപ്ലിക്കേറ്റ് ചെയ്യുന്നതിനും, ഭാഷ തിരിച്ചറിയുന്നതിനും, ഹ്യൂറിസ്റ്റിക്സിനെയും ഭാഷാ മോഡലുകളെയും അടിസ്ഥാനമാക്കി ഗുണനിലവാര ഫിൽട്ടറിംഗ് പ്രയോഗിക്കുന്നതിനുമുള്ള പൈപ്പ്ലൈനുകൾ ഇതിൽ ഉൾപ്പെടുന്നു. ഭാഷാ മോഡലുകളെ പ്രീ-ട്രെയിനിംഗ് ചെയ്യുന്നതിനും പുതിയ ക്രാളുകൾ ഉപയോഗിച്ച് പുനർനിർമ്മിക്കാനോ അപ്ഡേറ്റ് ചെയ്യാനോ കഴിയുന്ന സ്റ്റാൻഡേർഡ് കോർപ്പറ സൃഷ്ടിക്കുന്നതിനുമാണ് ഔട്ട്പുട്ടുകൾ ഉദ്ദേശിച്ചിരിക്കുന്നത്. HTTP പരാജയങ്ങൾ, സ്നാപ്പ്ഷോട്ട് വ്യത്യാസങ്ങൾ, JSON-കളുടെ സ്ഥിതിവിവരക്കണക്കുകൾ എന്നിവ പോലുള്ള പ്രായോഗിക ആശങ്കകൾ റിപ്പോസിറ്ററി രേഖപ്പെടുത്തുന്നു, ഇത് പല ഭാഷകളിലുടനീളമുള്ള കമ്മ്യൂണിറ്റി ഉപയോഗത്തെ പ്രതിഫലിപ്പിക്കുന്നു. ശക്തമാണെങ്കിലും, റിപ്പോ ആർക്കൈവ് ചെയ്തിരിക്കുന്നു, വായിക്കാൻ മാത്രമുള്ളതാണ്, അതിനാൽ ഉപയോക്താക്കൾ അത് അതേപടി പ്രവർത്തിപ്പിക്കുകയോ അറ്റകുറ്റപ്പണികൾക്കായി ഫോർക്ക് ചെയ്യുകയോ ചെയ്യുമെന്ന് പ്രതീക്ഷിക്കണം. ആർക്കൈവ് ചെയ്ത അവസ്ഥയിൽ പോലും, ഇഷ്യൂകളും റിലീസുകളും പേജുകൾ നടപ്പിലാക്കൽ വിശദാംശങ്ങൾക്കും ഡാറ്റാസെറ്റ് ലൈനേജിനും ഉപയോഗപ്രദമായ റഫറൻസുകളായി തുടരുന്നു.
സവിശേഷതകൾ
- എൻഡ്-ടു-എൻഡ് കോമൺ ക്രാൾ ഡൗൺലോഡും എക്സ്ട്രാക്ഷനും
- ഭാഷാ തിരിച്ചറിയലും ഏകഭാഷാ വിഭജനവും
- ഗുണനിലവാര ഫിൽട്ടറിംഗും ഡീ-ഡ്യൂപ്ലിക്കേഷൻ പൈപ്പ്ലൈനുകളും
- CC-100 പോലുള്ള ബഹുഭാഷാ ഡാറ്റാസെറ്റുകൾ നിർമ്മിക്കുന്നതിനുള്ള പിന്തുണ.
- പുനരുൽപ്പാദിപ്പിക്കാവുന്ന സ്ഥിതിവിവരക്കണക്കുകളും കോർപ്പസ് മെറ്റാഡാറ്റ ഔട്ട്പുട്ടുകളും
- സ്നാപ്പ്ഷോട്ട്-ബൈ-സ്നാപ്പ്ഷോട്ട് പ്രോസസ്സിംഗിനായുള്ള സ്ക്രിപ്റ്റുകളും കോൺഫിഗറേഷനുകളും
പ്രോഗ്രാമിംഗ് ഭാഷ
പൈത്തൺ
Categories
ഇത് https://sourceforge.net/projects/cc-net.mirror/ എന്നതിൽ നിന്നും ലഭിക്കാവുന്ന ഒരു ആപ്ലിക്കേഷനാണ്. ഞങ്ങളുടെ സൗജന്യ ഓപ്പറേറ്റീവ് സിസ്റ്റങ്ങളിൽ ഒന്നിൽ നിന്ന് ഏറ്റവും എളുപ്പമുള്ള രീതിയിൽ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി ഇത് OnWorks-ൽ ഹോസ്റ്റ് ചെയ്തിരിക്കുന്നു.