Ito ang command langidentp na maaaring patakbuhin sa OnWorks na libreng hosting provider gamit ang isa sa aming maramihang libreng online na workstation gaya ng Ubuntu Online, Fedora Online, Windows online emulator o MAC OS online emulator
PROGRAMA:
NAME
langident - kinikilala ang mga file ng wika kung saan nakasulat
SINOPSIS
langident [OPSYON] file1 [file2 ...]
DESCRIPTION
Kinikilala ang mga file ng wika na nakasulat gamit ang Perl module Lingua::Identify.
Opsyon
-a
Ipakita ang lahat ng mga resulta (hindi lamang ang pinaka-malamang na wika).
-c
Ipakita ang antas ng kumpiyansa para sa pinaka-malamang na wika (ito ang magiging unang halaga pagkatapos
ang pinaka-malamang na wika).
-d
Debug (development lang).
-E PAG-ENCOD
Pumili ng input encoding. Mga Default sa UTF-8.
# gumamit ng ISO-8859-1 (latin1)
langident -E ISO-8859-1 file
-e PARAAN
Piliin ang (mga) paraan na gagamitin. May tatlong paraan para gawin ito:
# gamit lamang ang isang paraan
langident -e ngrams3 file
# gamit ang ilang mga pamamaraan (paghiwalayin ang mga ito ng kuwit)
langident -e prefix3, suffix3
# gamit ang ilang mga pamamaraan at magtalaga ng iba't ibang mga timbang sa bawat isa sa kanila
langident -e smallwords=2,prefixes=1,ngrams3=1.3
Ang mga magagamit na pamamaraan ay ang mga sumusunod: maliliit na salita, prefix1, prefix2, prefix3,
prefix4, panlapi1, panlapi2, panlapi3, panlapi4, ngrams1, ngrams2, ngrams3 at
ngrams4.
-h
Ipakita ang mensahe ng tulong at lumabas.
-l
Ilista ang lahat ng magagamit na wika at lumabas.
-m NUMBER
Itakda ang maximum na bilang ng mga resulta (mga wika) na ipapakita (ipinapakita ang N pinaka-malamang na wika,
sa pamamagitan ng pababang pagkakasunud-sunod ng posibilidad).
Ino-override ang -a switch.
-o WIKA
Gumagana lamang sa mga tinukoy na wika.
# tukuyin sa pagitan ng Portuges at Ingles lamang
langident -o pt,en *
-p
Ipakita din ang mga porsyento.
-s SIZE
Pinakamataas na sukat upang suriin.
-v
Ipakita ang bersyon at lumabas.
HALIMBAWA
Gumamit ng mga pamamaraan ng ngrams2 at ngrams1, na nagtatalaga ng dobleng kahalagahan sa ngrams2 (-e
lumipat); isasama sa output ang tatlong pinaka-malamang na wika (-m switch) kasama nito
mga porsyento (-p switch) at gayundin ang antas ng kumpiyansa (-c switch) ng unang resulta.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
SA DO
· Magdagdag ng switch para huwag pansinin ang mga HTML tag (at maaaring iba pang mga format)
Gumamit ng langidentp online gamit ang mga serbisyo ng onworks.net