Il s'agit de la commande yaz-icu qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
yaz-icu - utilitaire YAZ ICU
SYNOPSIS
yaz-icu [-c config] [-p opter] [-s] [-x] [dans le fichier]
DESCRIPTION
yaz-icu est un utilitaire qui démontre le module de chaîne ICU de yaz. (yaz/icu.h).
L'utilitaire peut être utilisé de deux manières. Il peut lire du texte en utilisant une configuration XML pour
configurer l'ICU et afficher l'analyse de texte. Ce mode est déclenché par l'option -c qui
spécifie la configuration à utiliser. Le fichier d'entrée est lu à partir de l'entrée standard ou
à partir d'un fichier si infile est spécifié.
L'utilitaire peut également afficher des informations sur l'ICU. Ceci est déclenché par l'option -p.
OPTIONS
-c config
Spécifie le fichier contenant la configuration de la chaîne ICU basée sur XML.
-p type
Spécifie des informations supplémentaires à imprimer sur le système ICU. Si type est c alors ICU
les convertisseurs sont imprimés. Si type est l les locales disponibles sont imprimées. Si type est t
les translittérateurs disponibles sont imprimés.
-s
Spécifie que la sortie doit également inclure la clé de tri. Notez que la clé de tri diffère
entre les versions ICU.
-x
Spécifie que la sortie doit être basée sur XML plutôt que sur « texte ».
ICU CHAÎNE CONFIGURATION
La configuration de la chaîne ICU spécifie une ou plusieurs règles pour convertir les données de texte en jetons.
Le format de configuration est basé sur XML.
L'élément de niveau supérieur doit être nommé icu_chain. L'élément icu_chain en a un requis
attribut locale qui spécifie la locale ICU à utiliser dans les étapes de conversion.
L'élément icu_chain doit inclure des éléments où chaque élément spécifie une conversion
étape. La conversion est effectuée dans l'ordre dans lequel les étapes de conversion sont
spécifié. Chaque élément de conversion prend un attribut : règle qui sert d'argument à
l'étape de conversion.
Les éléments de conversion suivants sont disponibles :
carte de cas
Convertit la casse et la règle spécifie comment :
l
Minuscule en utilisant la fonction ICU u_strToLower.
u
Majuscules utilisant la fonction ICU u_strToUpper.
t
Pour titrer à l'aide de la fonction UCU u_strToTitle.
f
Plier le boîtier à l'aide de la fonction ICU u_strFoldCase.
l’affichage
Il s'agit d'une méta-étape qui spécifie qu'un terme/jeton doit être affiché. Ce terme est
récupéré dans une application à l'aide de la fonction icu_chain_token_display (yaz/icu.h).
transforment
Spécifie une règle de transformation ICU à l'aide d'un identifiant de translittérateur. L'attribut de règle
est l'identifiant du translittérateur. Voir ICU Transforme[1] pour plus d'informations.
translittérer
Spécifie un translittérateur basé sur des règles. L'attribut de règle est la transformation personnalisée
règle à utiliser. Voir ICU Transforme[1] pour plus d'informations.
tokenize
Casse/tokenize une chaîne en composants à l'aide des fonctions ICU ubrk_open,
ubrk_setText, .. . La règle est l'une des suivantes :
l
Ligne. USI : UBRK_LINE.
s
Phrase. USI : UBRK_SENTENCE.
w
Mot. ICU : UBRK_WORD.
c
Personnage. Unité de soins intensifs : UBRK_CHARACTER.
t
Titre. USI : UBRK_TITLE.
EXEMPLES
La commande suivante analyse le texte du fichier texte à l'aide du fichier chain.xml de configuration de la chaîne ICU :
texte de chat | yaz-icu -c chain.xml
Le fichier chain.xml peut ressembler à ceci :
z"/>
Utilisez yaz-icu en ligne en utilisant les services onworks.net
