Este es el comando apertium que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
apertium: esta aplicación es parte de ( apertura )
Esta herramienta es parte de la arquitectura de traducción automática de apertium:
http://apertium.sf.net.
SINOPSIS
apertura [-d directorio de datos] [-f formato] [-u] [-a] {par de idiomas} [infile [archivo de salida]]
DESCRIPCIÓN
apertura es la aplicación que la mayoría de la gente utilizará, ya que simplifica el uso de
herramientas apertium / lt-toolbox para traducción automática.
Esta herramienta intenta facilitar el uso de caja de herramientas lt (que contiene todo el procesamiento léxico
módulos y herramientas) y apertura (que contiene el resto del motor) proporcionando un
interfaz única para el usuario final.
Los diferentes módulos detrás de la arquitectura de traducción automática de apertium están en orden:
· desformateador: Separa el texto a traducir de la información de formato.
· analizador-morfológico: Tokeniza el texto en formas superficiales.
· Parte del discurso etiquetador: Elige una forma de superficie entre los homógrafos.
· léxico bancaria módulo: Lee cada forma léxica del idioma de origen y ofrece una
correspondiente forma léxica de la lengua de llegada.
· estructural bancaria módulo: Detecta patrones de longitud fija de formas léxicas
(fragmentos o frases) que necesitan un procesamiento especial debido a divergencias gramaticales
entre los dos lenguajes y realiza las transformaciones correspondientes.
· morfologico generador: Ofrece una forma de superficie en el idioma de destino para cada destino
forma léxica del lenguaje, flexionándola adecuadamente.
· post-generador: Realiza operaciones ortográficas como contracciones y
apostrofaciones.
· re-formateador: Restaura la información de formato encapsulada por el desformateador
en el texto traducido y elimina las secuencias de encapsulación utilizadas para proteger
ciertos caracteres en el texto fuente.
OPCIONES
-d directorio de datos El directorio que contiene los datos lingüísticos. Por defecto utilizará el
ruta de instalación esperada.
par de idiomas El par de idiomas: LANG1-LANG2 (por ejemplo es-ca or ca-es).
-f formato Especifica el formato de los archivos de entrada y salida que pueden tener estos valores:
· txt (defecto valor) Los archivos de entrada y salida están en formato de texto.
· html Los archivos de entrada y salida están en formato "html". Este "html" es el aceptado
por la gran mayoría de navegadores web.
· html-noent Los archivos de entrada y salida están en formato "html", pero conservan el formato nativo.
codificación de caracteres en lugar de utilizar entidades de texto HTML.
· rtf Los archivos de entrada y salida están en formato "rtf". El "rtf" aceptado es el
generado por Microsoft WordPad (C) y Microsoft Perú (C) hasta e incluyendo
Oficina 97.
-u Desactive el marcado de palabras desconocidas con el carácter '*'.
-a Habilite el marcado de palabras sin ambigüedad con el carácter '='.
Utilice apertium en línea utilizando los servicios de onworks.net