InglésFrancésEspañol

Ad


icono de página de OnWorks

enc2xs: en línea en la nube

Ejecute enc2xs en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando enc2xs que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


enc2xs - Generador de módulos de codificación Perl

SINOPSIS


enc2xs - [opciones]
enc2xs -M ModName mapfiles ...
enc2xs-C

DESCRIPCIÓN


enc2xs crea una extensión de Perl para que la use Encode desde el mapeo de caracteres Unicode
archivos (.ucm) o archivos de codificación Tcl (.enc). Además de ser utilizado internamente durante la construcción
proceso del módulo Codificar, puede utilizar enc2xs para agregar su propia codificación a perl. No
el conocimiento de XS es ​​necesario.

Búsqueda Guía


Si desea saber lo menos posible sobre Perl pero necesita agregar una nueva codificación, simplemente
lea este capítulo y olvídese del resto.

0. Tenga listo un archivo .ucm. Puede obtenerlo de alguna parte o puede escribir el suyo propio desde
scratch o puede tomar uno de la distribución de Encode y personalizarlo. Para el
Formato UCM, consulte el capítulo siguiente. En el siguiente ejemplo, llamaré a mi teoría
codificación myascii, definida en mi.ucm. "$" es un indicador de shell.

$ ls -F
mi.ucm

1. Emita un comando de la siguiente manera;

$ enc2xs -M Mi my.ucm
generando Makefile.PL
generando My.pm
generando README
generando cambios

Ahora eche un vistazo a su directorio actual. Debe tener un aspecto como este.

$ ls -F
Makefile.PL My.pm my.ucm t /

Se crearon los siguientes archivos.

Makefile.PL: guión de MakeMaker
My.pm - Submódulo de codificación
t / My.t - archivo de prueba

1.1.
Si desea que * .ucm se instale junto con los módulos, haga lo siguiente;

$ mkdir Codificar
$ mv * .ucm Codificar
$ enc2xs -M Mi codificación / * ucm

2. Edite los archivos generados. No tienes que hacerlo si no tienes tiempo y no tienes intención de hacerlo.
dárselo a otra persona. Pero es una buena idea editar el pod y agregar más pruebas.

3. Ahora emita un comando que a todos los Perl Mongers les encanta:

$perl Makefile.PL
Escribiendo Makefile para Encode :: My

4. Ahora todo lo que tienes que hacer es hacer.

$ make
cp My.pm blib / lib / Encode / My.pm
/ usr / local / bin / perl / usr / local / bin / enc2xs -Q -O \
-o codificar_t.c -f codificar_t.fnm
Leyendo myascii (myascii)
Escribir formulario compilado
128 bytes en tablas de cadenas
384 bytes (75%) guardados detectando duplicados
1 bytes (0.775%) guardados mediante subcadenas
....
chmod 644 blib / arch / auto / Encode / My / My.bs
$

El tiempo que tarda varía según la velocidad de su máquina y el tamaño de su
la codificación es. A menos que esté trabajando en algo grande como euc-tw, no será necesario
de largo.

5. Ya puede "hacer la instalación", pero primero debe probar.

$ hacer prueba
PERL_DL_NONLAZY = 1 / usr / local / bin / perl -Iblib / arch -Iblib / lib \
-e 'use Test :: Harness qw (& runtests $ verbose); \
$ detallado = 0; runtests @ARGV; ' t / *. t
t / Mi ... ok
Todas las pruebas fueron exitosas.
Archivos = 1, Pruebas = 2, 0 segundos de reloj de pared
(0.09 cusr + 0.01 csys = 0.09 CPU)

6. Si está satisfecho con el resultado de la prueba, simplemente "haga la instalación"

7. Si desea agregar su codificación a la lista de carga de demanda de Encode (para que no tenga que
"use Encode :: YourEncoding"), ejecute

enc2xs-C

para actualizar Encode :: ConfigLocal, un módulo que controla la configuración local. Después,
"use Encode;" es suficiente para cargar sus codificaciones bajo demanda.

El Unicode Caracter Mapa


Encode utiliza el formato de mapa de caracteres Unicode (UCM) para las asignaciones de caracteres de origen. Esta
El formato es utilizado por el paquete ICU de IBM y fue adoptado por Nick Ing-Simmons para su uso con el
Módulo de codificación. Dado que UCM es más flexible que el mapa de codificación de Tcl y mucho más
amigable, este es el formato recomendado para Encode ahora.

Un archivo UCM tiene este aspecto.

#
# Comentarios
#
"US-ascii" # Requerido
"ascii" # Opcional
1 # Requerido; generalmente 1
1 # Máx. # de bytes / char
\ x3F # Carácter de sustitución
#
CHARMAP
\ x0000 | 00 #
\ x0001 | 01 #
\ x0002 | 02 #
....
\ x007C | 7 # LÍNEA VERTICAL
\ x007D | 7 # SOPORTE RIZADO DERECHO
\ x007E | 7 # TILDE
\ x007F | 7 #
FIN DE CHARMAP

· Todo lo que sigue a "#" se trata como un comentario.

· La sección de encabezado continúa hasta una línea que contiene la palabra CHARMAP. Esta sección
tiene una forma de propuesta de, un par por línea. Las cadenas utilizadas como valores deben ser
cotizado. Las palabras desnudas se tratan como números. \ xXX representa un byte.

La mayoría de las palabras clave se explican por sí mismas. subcarácter significa carácter de sustitución, no
subcarácter. Cuando decodifica una secuencia Unicode para esta codificación pero no coincide
se encuentra el carácter, se utilizará la secuencia de bytes definida aquí. En la mayoría de los casos,
el valor aquí es \ x3F; en ASCII, es un signo de interrogación.

· CHARMAP inicia la sección del mapa de caracteres. Cada línea tiene la siguiente forma:

\ xXX .. | 0 # comentario
^ ^ ^
| | + - Bandera de reserva
| + -------- Secuencia de bytes codificada
+ -------------- ID de carácter Unicode en hexadecimal

El formato es aproximadamente el mismo que el de una sección de encabezado, excepto por el indicador de reserva: |
seguido de 0..3. El significado de los valores posibles es el siguiente:

| 0 Viaje de ida y vuelta seguro. Un carácter descodificado en Unicode se codifica de nuevo en el mismo byte
secuencia. La mayoría de los personajes tienen esta bandera.

| 1 Respaldo para Unicode -> codificación. Cuando se ve, enc2xs agrega este carácter para el
codificar mapa solamente.

| 2 Omita la asignación de subcarácter si no hubiera ningún punto de código.

| 3 Respaldo para la codificación -> unicode. Cuando se ve, enc2xs agrega este carácter para el
decodificar el mapa solamente.

· Y finalmente, END OF CHARMAP finaliza la sección.

Cuando crea manualmente un archivo UCM, debe copiar ascii.ucm o un archivo existente.
codificación cercana a la suya, en lugar de escribir la suya propia desde cero.

Cuando lo haga, asegúrese de dejar al menos U0000 a U0020 tal cual, a menos que su entorno
es EBCDIC.

CONSIDERACIÓN: no se implementan todas las funciones en UCM. Por ejemplo, icu: state no se usa.
Por eso, necesita escribir un módulo perl si desea admitir algoritmos
codificaciones, en particular la serie ISO-2022. Dichos módulos incluyen Encode :: JP :: 2022_JP,
Encode :: KR :: 2022_KR y Encode :: TW :: HZ.

Albardilla duplicar mapeos
Cuando crea un mapa, DEBE hacer que sus asignaciones de ida y vuelta sean seguras. Es decir,
"codificar ('su-codificación', decode ('su-codificación', $ datos)) eq $ datos" significa todos
caracteres que están marcados como "| 0". A continuación, le indicamos cómo asegurarse:

· Ordena tu mapa en orden Unicode.

· Cuando tenga una entrada duplicada, marque una con '| 1' o '| 3'.

· Y asegúrese de que la entrada '| 1' o '| 3' SIGUE la entrada '| 0'.

Aquí hay un ejemplo de big5-eten.

\ xF2550 \ xF9 | 9
\ xA2550 \ xA2 | 4

Codificación interna -> Unicode y Unicode -> El mapa de codificación tiene este aspecto;

E a UU a E
--------------------------------------
\ xF9 \ xF9 => U2550 U2550 => \ xF9 \ xF9
\ xA2 \ xA4 => U2550

Por lo que es seguro de ida y vuelta para \ xF9 \ xF9. Pero si la línea de arriba está al revés, esto es lo que
sucede.

E a UU a E
--------------------------------------
\ xA2 \ xA4 => U2550 U2550 => \ xF9 \ xF9
(\ xF9 \ xF9 => ¡U2550 ahora se sobrescribe!)

El paquete Encode viene con ucmlint, una utilidad tosca pero suficiente para comprobar el
integridad de un archivo UCM. Verifique esto en el directorio Encode / bin.

En caso de duda, puede utilizar ordenar, otra utilidad más en el directorio Encode / bin.

Favoritos


· Página de inicio de la UCIhttp://www.icu-project.org/>

· Tablas de mapeo de caracteres de la UCIhttp://site.icu-project.org/charts/charset>

· UCI: datos de conversiónhttp://www.icu-project.org/userguide/conversion-data.html>

Use enc2xs en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

  • 1
    Complemento Eclipse Tomcat
    Complemento Eclipse Tomcat
    El complemento Eclipse Tomcat proporciona
    integración simple de un servlet tomcat
    contenedor para el desarrollo de java
    aplicaciones web. Puedes unirte a nosotros para
    discutirio ...
    Descargar el complemento Eclipse Tomcat
  • 2
    Escritorio WebTorrent
    Escritorio WebTorrent
    WebTorrent Desktop es para streaming
    torrents en Mac, Windows o Linux. Eso
    se conecta a BitTorrent y
    Compañeros de WebTorrent. Ahora no hay
    Necesito esperar ...
    Descargar WebTorrent Escritorio
  • 3
    GenX
    GenX
    GenX es un programa científico para refinar
    refelcetivity de rayos X, neutrones
    reflectividad y rayos X de superficie
    datos de difracción usando el diferencial
    algoritmo de evolución ....
    Descargar GenX
  • 4
    pspp4ventanas
    pspp4ventanas
    PSPP es un programa de estadística
    análisis de datos muestreados. es gratis
    sustitución del programa propietario
    SPSS. El PSPP tiene tanto contenido basado en texto como
    gráfico nosotros...
    Descargar pspp4windows
  • 5
    Extensiones Git
    Extensiones Git
    Git Extensions es una herramienta de interfaz de usuario independiente
    para administrar repositorios de Git. También
    se integra con el Explorador de Windows y
    Microsoft Visual Studio
    (2015/2017/2019). Es ...
    Descargar extensiones Git
  • 6
    eSpeak: síntesis de voz
    eSpeak: síntesis de voz
    Motor de texto a voz para inglés y
    muchos otros idiomas. Tamaño compacto con
    Pronunciación clara pero artificial.
    Disponible como un programa de línea de comandos con
    muchos ...
    Descargar eSpeak: síntesis de voz
  • Más "

Comandos de Linux

Ad