Il s'agit de la commande mkbingram qui peut être exécutée dans le fournisseur d'hébergement gratuit OnWorks en utilisant l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS
PROGRAMME:
Nom
mkbingram
- créer un N-gram binaire à partir du fichier ARPA N-gram
SYNOPSIS
mkbingram [-nlr forward_ngram.arpa] [-nrl back_ngram.arpa] [-ré ancien_bingram_file]
{output_bingram_file}
DESCRIPTION
mkbingram est un outil pour convertir le(s) fichier(s) de définition N-gram au format standard ARPA en un
format binaire Julius compact. Cela accélérera beaucoup le temps de chargement initial de N-gramme
plus rapide. Il peut lire directement le fichier gzippé.
À partir de la version 4.0, Julius peut gérer le N-gramme avant, le N-gramme arrière et leurs combinaisons.
Alors, mkbingram génère maintenant un fichier binaire N-gram à partir de l'un d'eux, ou en les combinant deux pour
produire un N-gramme binaire.
Lorsque seul un N-gramme vers l'avant est spécifié, mkbingram génère un N-gramme binaire uniquement à partir du
avant N-gramme. Lors de l'utilisation de ce N-gramme binaire chez Julius, il effectue le 1er passage avec le
probabilités de 2 grammes dans le N-gramme, et exécuter le 2ème passage avec le N-gramme donné entièrement, avec
conversion des probabilités avant en probabilités arrière par la règle de Bayes.
Lorsque seul un N-gramme vers l'arrière est spécifié, mkbingram génère un fichier binaire N-gram qui
ne contient que le N-gramme arrière. Le 1er passage utilisera des probabilités avant de 2 grammes qui
peut être calculé à partir du 2-gramme vers l'arrière en utilisant la règle de Bayes, et le 2ème passage utilise le donné
arrière N-gramme complètement.
Lorsque les N-grammes avant et arrière sont spécifiés, la partie de 2 grammes dans le
Le N-gramme et tous les N-grammes en arrière seront combinés en un seul fichier bingram. L'avant
2 grammes seront appliqués pour le 1er passage et le N-gramme arrière pour le 2e passage. Noter que
les deux N-grammes doivent être entraînés dans le même corpus avec les mêmes paramètres (c'est-à-dire
seuils), avec le même vocabulaire.
L'ancien N-gramme binaire produit par mkbingram de la version 3.x et antérieure peut être utilisé dans
Julius-4, mais vous pouvez convertir l'ancienne version vers la nouvelle version en la spécifiant comme entrée
de courant mkbingram par option "-d".
Veuillez noter que le fichier binaire N-gram converti par mkbingram de la version 4.0 et ultérieure ne peut pas
être lu par l'ancien Julius 3.x.
OPTIONS
-nlr forward_ngram.arpa
Lire dans un fichier N-gram de mot avant (de gauche à droite) au format standard ARPA.
-nrl back_ngram.arpa
Lire dans un fichier N-gram de mots en arrière (de droite à gauche) au format standard ARPA.
-d ancien_bingram_file
Lire dans un fichier binaire N-gram.
-échanger
Échangez le mot BOS et le mot EOS en N-gramme.
fichier_bingram_sortie
nom de fichier binaire N-gram à afficher.
EXEMPLES
Convertissez un ensemble de N-grammes avant et arrière au format ARPA en forme binaire Julius :
Convertissez un seul 4 grammes vers l'avant au format ARPA en un fichier binaire :
Convertir l'ancien fichier binaire N-gram au format actuel :
Utiliser mkbingram en ligne à l'aide des services onworks.net
