Il s'agit de la commande langidentp qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.
PROGRAMME:
Nom
langident - identifie les fichiers de langue dans lesquels sont écrits
SYNOPSIS
langident [OPTIONS] fichier1 [fichier2 ...]
DESCRIPTION
Identifie les fichiers de langue dans lesquels ils sont écrits à l'aide du module Perl Lingua::Identify.
OPTIONS
-a
Afficher tous les résultats (pas seulement la langue la plus probable).
-c
Afficher le niveau de confiance pour la langue la plus probable (ce sera la première valeur juste après
la langue la plus probable).
-d
Débogage (développement uniquement).
-E CODAGE
Sélectionnez un encodage d’entrée. La valeur par défaut est UTF-8.
# utiliser ISO-8859-1 (latin1)
fichier langident -E ISO-8859-1
-e MÉTHODES
Sélectionnez la ou les méthodes à utiliser. Il existe trois façons de procéder :
# simplement en utilisant une méthode
langident -e fichier ngrams3
# en utilisant plusieurs méthodes (séparez-les par une virgule)
langident -e préfixes3, suffixes3
# utiliser plusieurs méthodes et attribuer des poids différents à chacune d'elles
langident -e petits mots = 2, préfixes = 1, ngrammes3 = 1.3
Les méthodes disponibles sont les suivantes : petits mots, préfixes1, préfixes2, préfixes3,
préfixes4, suffixes1, suffixes2, suffixes3, suffixes4, ngrammes1, ngrammes2, ngrammes3 ainsi que
ngrammes4.
-h
Afficher le message d'aide et quitter.
-l
Répertoriez toutes les langues disponibles et quittez.
-m NUMÉRO
Définir le nombre maximum de résultats (langues) à afficher (affiche les N langues les plus probables,
par ordre décroissant de probabilité).
Remplace le commutateur -a.
-o LANGUE
Travaillez uniquement avec les langues spécifiées.
# identifier entre le portugais et l'anglais uniquement
langident -o pt,en *
-p
Afficher également les pourcentages.
-s TAILLE
Taille maximale à examiner.
-v
Afficher la version et quitter.
EXEMPLES
Utilisez les méthodes ngrams2 et ngrams1, en attribuant le double d'importance à ngrams2 (-e
changer); la sortie inclura les trois langues les plus probables (commutateur -m) avec son
pourcentages (commutateur -p) ainsi que le niveau de confiance (commutateur -c) du premier résultat.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
LISEZMOI :fr 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
À DO
· Ajoutez un commutateur pour ignorer les balises HTML (et peut-être d'autres formats aussi)
Utilisez langidentp en ligne à l'aide des services onworks.net