Ubuntu Online, Fedora Online, Windows online emulator അല്ലെങ്കിൽ MAC OS ഓൺലൈൻ എമുലേറ്റർ എന്നിങ്ങനെയുള്ള ഞങ്ങളുടെ ഒന്നിലധികം സൗജന്യ ഓൺലൈൻ വർക്ക്സ്റ്റേഷനുകളിലൊന്ന് ഉപയോഗിച്ച് OnWorks സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവിൽ പ്രവർത്തിപ്പിക്കാൻ കഴിയുന്ന കമാൻഡ് langidentp ആണിത്.
പട്ടിക:
NAME
langident - എഴുതപ്പെട്ട ഭാഷാ ഫയലുകൾ തിരിച്ചറിയുന്നു
സിനോപ്സിസ്
രേഖാംശ [ഓപ്ഷനുകൾ] ഫയൽ1 [ഫയൽ2 ...]
വിവരണം
പേൾ മൊഡ്യൂൾ Lingua ::Identify ഉപയോഗിച്ച് എഴുതിയ ഭാഷാ ഫയലുകൾ തിരിച്ചറിയുന്നു.
ഓപ്ഷനുകൾ
-a
എല്ലാ ഫലങ്ങളും കാണിക്കുക (ഏറ്റവും സാധ്യതയുള്ള ഭാഷ മാത്രമല്ല).
-c
ഏറ്റവും സാധ്യതയുള്ള ഭാഷയ്ക്ക് ആത്മവിശ്വാസ നില കാണിക്കുക (അതിന് ശേഷമുള്ള ആദ്യ മൂല്യമായിരിക്കും ഇത്
ഏറ്റവും സാധ്യതയുള്ള ഭാഷ).
-d
ഡീബഗ് (വികസനം മാത്രം).
-E എൻകോഡിംഗ്
ഒരു ഇൻപുട്ട് എൻകോഡിംഗ് തിരഞ്ഞെടുക്കുക. UTF-8-ലേക്കുള്ള ഡിഫോൾട്ടുകൾ.
# ISO-8859-1 ഉപയോഗിക്കുക (ലാറ്റിൻ1)
langident -E ISO-8859-1 ഫയൽ
-e രീതികൾ
ഉപയോഗിക്കേണ്ട രീതി(കൾ) തിരഞ്ഞെടുക്കുക. ഇത് ചെയ്യുന്നതിന് മൂന്ന് വഴികളുണ്ട്:
# ഒരു രീതി ഉപയോഗിച്ച്
langident -e ngrams3 ഫയൽ
# നിരവധി രീതികൾ ഉപയോഗിക്കുന്നു (അവയെ ഒരു കോമ ഉപയോഗിച്ച് വേർതിരിക്കുക)
langident -e പ്രിഫിക്സുകൾ3,സഫിക്സുകൾ3
# നിരവധി രീതികൾ ഉപയോഗിച്ച് അവയിൽ ഓരോന്നിനും വ്യത്യസ്ത ഭാരം നൽകുക
langident -e ചെറിയ വാക്കുകൾ=2,പ്രിഫിക്സുകൾ=1,ngrams3=1.3
ലഭ്യമായ രീതികൾ ഇനിപ്പറയുന്നവയാണ്: ചെറിയ വാക്കുകൾ, പ്രിഫിക്സുകൾ1, പ്രിഫിക്സുകൾ2, പ്രിഫിക്സുകൾ3,
പ്രിഫിക്സുകൾ4, പ്രത്യയങ്ങൾ1, പ്രത്യയങ്ങൾ2, പ്രത്യയങ്ങൾ3, പ്രത്യയങ്ങൾ4, ngrams1, ngrams2, ngrams3 ഒപ്പം
ngrams4.
-h
സഹായ സന്ദേശം പ്രദർശിപ്പിച്ച് പുറത്തുകടക്കുക.
-l
ലഭ്യമായ എല്ലാ ഭാഷകളും ലിസ്റ്റുചെയ്ത് പുറത്തുകടക്കുക.
-m NUMBER
പ്രദർശിപ്പിക്കുന്നതിന് പരമാവധി എണ്ണം ഫലങ്ങൾ (ഭാഷകൾ) സജ്ജമാക്കുക (N ഏറ്റവും സാധ്യതയുള്ള ഭാഷകൾ കാണിക്കുന്നു,
പ്രോബബിലിറ്റിയുടെ അവരോഹണ ക്രമം വഴി).
-a സ്വിച്ച് അസാധുവാക്കുന്നു.
-o ഭാഷകൾ
നിർദ്ദിഷ്ട ഭാഷകളിൽ മാത്രം പ്രവർത്തിക്കുക.
# പോർച്ചുഗീസും ഇംഗ്ലീഷും തമ്മിൽ മാത്രം തിരിച്ചറിയുക
langident -o pt,en *
-p
ശതമാനവും കാണിക്കുക.
-s SIZE
പരിശോധിക്കാനുള്ള പരമാവധി വലുപ്പം.
-v
പതിപ്പ് കാണിച്ച് പുറത്തുകടക്കുക.
ഉദാഹരണങ്ങൾ
ngrams2, ngrams1 എന്നീ രീതികൾ ഉപയോഗിക്കുക, ngrams2 (-e) ന് ഇരട്ടി പ്രാധാന്യം നൽകി
സ്വിച്ച്); ഔട്ട്പുട്ടിൽ ഏറ്റവും സാധ്യതയുള്ള മൂന്ന് ഭാഷകൾ (-m സ്വിച്ച്) ഉൾപ്പെടുത്തും
ആദ്യ ഫലത്തിന്റെ ശതമാനവും (-p സ്വിച്ച്) ആത്മവിശ്വാസ നിലയും (-c switch).
$ ലാൻജിഡൻ്റ് -ഇ ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
TO DO
HTML ടാഗുകൾ അവഗണിക്കാൻ ഒരു സ്വിച്ച് ചേർക്കുക (ഒരുപക്ഷേ മറ്റ് ഫോർമാറ്റുകളും)
onworks.net സേവനങ്ങൾ ഉപയോഗിച്ച് langidentp ഓൺലൈനായി ഉപയോഗിക്കുക