langidentp - Online en la nube

Este es el comando langidentp que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


langident: identifica los archivos de idioma en los que están escritos

SINOPSIS


langident [OPCIONES] archivo1 [archivo2 ...]

DESCRIPCIÓN


Identifica los archivos de idioma en los que están escritos usando el módulo Perl Lingua :: Identify.

CAMPUS
-a
Muestra todos los resultados (no solo el idioma más probable).

-c
Muestre el nivel de confianza para el idioma más probable (será el primer valor inmediatamente después
el idioma más probable).

-d
Depurar (solo desarrollo).

-E CODIFICACION
Seleccione una codificación de entrada. Por defecto es UTF-8.

# usar ISO-8859-1 (latin1)
langident -E archivo ISO-8859-1

-e FORMAS DE PAGO
Seleccione los métodos que desee utilizar. Hay tres formas de hacer esto:

# simplemente usando un método
langident -e archivo ngrams3

# usando varios métodos (sepárelos con una coma)
langident -e prefijos3, sufijos3

# usar varios métodos y asignar diferentes pesos a cada uno de ellos
langident -e smallwords = 2, prefijos = 1, ngrams3 = 1.3

Los métodos disponibles son los siguientes: palabras pequeñas, prefijos1, prefijos2, prefijos3,
prefijos4, sufijos1, sufijos2, sufijos3, sufijos4, ngramas1, ngramas2, ngramas3 y
ngramas4.

-h
Mostrar mensaje de ayuda y salir.

-l
Enumere todos los idiomas disponibles y salga.

-m NÚMERO
Establecer el número máximo de resultados (idiomas) para mostrar (muestra los N idiomas más probables,
por orden descendente de probabilidad).

Anula el modificador -a.

-o IDIOMAS
Trabaja solo con idiomas específicos.

# identificarse solo entre portugués e inglés
langident -o pt, en *

-p
También muestra los porcentajes.

-s TAMAÑO
Tamaño máximo para examinar.

-v
Mostrar versión y salir.

EJEMPLOS


Utilice los métodos ngrams2 y ngrams1, asignando el doble de importancia a ngrams2 (-e
cambiar); La salida incluirá los tres idiomas más probables (modificador -m) con su
porcentajes (conmutador -p) y también el nivel de confianza (conmutador -c) del primer resultado.

$ langident -e ngrams2 = 2, ngrams1 -c -p -m 3 README
LÉAME: en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$

A DO


· Agregue un interruptor para ignorar las etiquetas HTML (y tal vez también otros formatos)

Utilice langidentp en línea utilizando los servicios de onworks.net



Últimos programas en línea de Linux y Windows