Este é o comando langidentp que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador Windows online ou emulador MAC OS online
PROGRAMA:
NOME
langident - identifica os arquivos de linguagem em que foram escritos
SINOPSE
langident [OPÇÕES] arquivo1 [arquivo2 ...]
DESCRIÇÃO
Identifica os arquivos de idioma são escritos usando o módulo Perl Lingua :: Identify.
OPÇÕES
-a
Mostrar todos os resultados (não apenas o idioma mais provável).
-c
Mostra o nível de confiança para o idioma mais provável (será o primeiro valor logo a seguir
o idioma mais provável).
-d
Depurar (apenas desenvolvimento).
-E CODIFICAÇÃO
Selecione uma codificação de entrada. O padrão é UTF-8.
# usa ISO-8859-1 (latin1)
arquivo langident -E ISO-8859-1
-e MÉTODOS
Selecione o (s) método (s) a usar. Existem três maneiras de fazer isso:
# simplesmente usando um método
arquivo langident -e ngrams3
# usando vários métodos (separe-os com uma vírgula)
langident -e prefixos3, sufixos3
# usando vários métodos e atribuir pesos diferentes a cada um deles
langident -e smallwords = 2, prefixos = 1, ngrams3 = 1.3
Os métodos disponíveis são os seguintes: palavrinhas, prefixos 1, prefixos 2, prefixos 3,
prefixos 4, sufixos 1, sufixos 2, sufixos 3, sufixos 4, ngram1, ngram2, ngram3 e
ngram4.
-h
Exibir mensagem de ajuda e sair.
-l
Liste todos os idiomas disponíveis e saia.
-m NÚMERO
Defina o número máximo de resultados (idiomas) a serem exibidos (mostra os N idiomas mais prováveis,
por ordem decrescente de probabilidade).
Substitui a opção -a.
-o IDIOMAS
Funciona apenas com idiomas especificados.
# identifica entre português e inglês apenas
langident -o pt, en *
-p
Também mostra percentagens.
-s TAMANHO
Tamanho máximo para examinar.
-v
Mostra a versão e sai.
EXEMPLOS
Use os métodos ngrams2 e ngrams1, atribuindo o dobro da importância a ngrams2 (-e
trocar); a saída incluirá as três linguagens mais prováveis (-m switch) com seu
percentagens (opção -p) e também o nível de confiança (opção -c) do primeiro resultado.
$ langident -e ngrams2 = 2, ngrams1 -c -p -m 3 LEIA-ME
LEIA-ME: en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
TO DO
· Adicione uma opção para ignorar as tags HTML (e talvez outros formatos também)
Use langidentp online usando serviços onworks.net