Este es el comando adintool que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.
PROGRAMA:
NOMBRE
herramienta addin
- una herramienta para grabar / dividir / enviar / recibir transmisiones de audio
SINOPSIS
herramienta addin {-en entradadev} {-fuera salidadev} [opciones...]
DESCRIPCIÓN
herramienta addin analiza la entrada de voz, encuentra segmentos de voz que omiten el silencio y registra la
segmentos detectados de varias formas. Realiza detección de voz basada en el número de cruce por cero
y potencia (nivel), y registra las partes detectadas en archivos u otros dispositivos de salida
sucesivamente.
herramienta addin es una versión superior de adinrec con varias funciones. Los dispositivos de entrada admitidos son:
entrada de micrófono, un archivo de voz, entrada tty estándar y toma de red (llamada adin-net
modo servidor). También se puede utilizar el complemento Julius. Los segmentos de voz detectados se guardarán en
dispositivos de salida: archivos de voz, salida tty estándar y toma de red (llamada adin-net
modo cliente). Por ejemplo, puede dividir el discurso entrante en segmentos y enviarlos a
Julius para ser reconocido.
El formato de salida es WAV, 16 bits (con signo corto), monoral. Si el archivo ya existe, será
anulado.
OPCIONES
Se pueden configurar todas las opciones de Julius. Solo se tratan las opciones relacionadas con la entrada de audio y otras
saltó silenciosamente. A continuación se muestra una lista de opciones.
herramienta addin soluciones y opciones
-frecuencia Hz
Establezca la frecuencia de muestreo en Hz. (predeterminado: 16,000)
-in entradadev
Dispositivo de entrada de audio. "micrófono" para capturar a través de la entrada de micrófono, "archivo" para la entrada de archivos de audio,
y "stdin" para leer datos sin procesar de la entrada estándar. Para la entrada de archivos, el indicador de nombre de archivo
aparecen después del inicio. Utilice "adinnet" para hacer herramienta addin como "servidor adinnet", recibiendo
datos del cliente a través de la toma de red. El número de puerto predeterminado es 5530, que se puede modificar
por opción "-entre".
Alternativamente, el dispositivo de entrada se puede configurar mediante "-aporte"opción, en cuyo caso puede utilizar
entrada de complemento.
-fuera salidadev
El dispositivo de salida de audio almacena los datos. Especifique "archivo" para guardar en archivo, en el que la salida
el nombre del archivo debe estar dado por "-nombre del archivo". Utilice" stdout "para la salida estándar." Adinnet "
“piensen de nuevo sobre los incrementos de precio” herramienta addin ser un cliente de adinnet, enviando datos de voz a un servidor a través de tcp / ip
enchufe. Cuando se usa la salida "adinnet", se debe especificar el nombre del servidor para enviar datos
por "-servidor". El número de puerto predeterminado es 5530, que se puede cambiar con"-Puerto" opción.
-entre número
Cuando adintool se convierte en servidor de adinnet para recibir datos (-en adinnet), establezca el número de puerto
escuchar. (predeterminado: 5530)
-servidor [anfitrión] [, anfitrión ...]
Cuando se envía al servidor adinnet (-out adinnet), establezca el nombre de host. Puedes enviar a
múltiples hosts especificando sus nombres de host como una lista delimitada por comas como
"host1, host2, host3".
-Puerto [num] [, num ...]
Cuando adintool envíe datos al servidor adinnet (-out adinnet), establezca el número de puerto en
conectar. (predeterminado: 5530) Para varios servidores, especifique los números de puerto para todos los servidores
como "5530,5530,5531".
-nombre del archivo presentar
Cuando se envía a archivo (-fuera presentar), establezca el nombre del archivo de salida. El nombre del archivo real será
como "archivo.0000.wav","archivo.0001.wav"y así sucesivamente, donde el número de cuatro dígitos aumenta
como segmento de voz detectado. El número inicial se establecerá en 0 de forma predeterminada, lo que puede
ser cambiado por "-id de inicio"opción. Cuando se utiliza"-un trago"opción para guardar solo la primera
segmento, la entrada se guardará como "presentar".
-id de inicio número
En la salida del archivo, establezca el número de archivo inicial. (predeterminado: 0)
-un trago
Salga después del final del primer segmento de voz.
-nosegmento
No realice la detección de voz para la entrada, solo trate todas las entradas como una única entrada válida.
segmento.
-crudo
Salida como archivo RAW (sin encabezado).
-Pausa Automática
Cuando se envía al servidor adinnet, herramienta addin entrar en estado de pausa en cada final del discurso
segmento. Se reiniciará cuando el servidor adinnet de destino le envíe una señal de reanudación.
-loosesync
Cuando se envía a varios servidores adinnet, no se debe realizar una sincronización estricta para reiniciar.
Por defecto, cuando herramienta addin ha entrado en estado de pausa, no se reiniciará hasta que se reanude
Los comandos se reciben de todos los servidores. Esta opción permitirá reiniciar al menos una
Ha llegado el comando de reinicio.
-rebobinar mseg
Cuando la entrada es un dispositivo de micrófono en vivo, y ha habido alguna entrada continua en el
momento herramienta addin se reanuda, comienza a registrar el retroceso en los milisegundos especificados.
Referente Julius opciones
-aporte {mic | rawfile | adinnet | stdin | netaudio | esd | alsa | oss}
Elija la fuente de entrada de voz. Especifique 'archivo' o 'rawfile' para el archivo de forma de onda. En archivo
entrada, se les pedirá a los usuarios que ingresen el nombre de archivo de stdin.
´mic 'es obtener entrada de audio de un dispositivo de micrófono en vivo predeterminado, y' adinnet 'significa
recibir datos de forma de onda a través de la red tcpip desde un cliente de adinnet. 'netaudio' es de
Entrada DatLink / NetAudio y 'stdin' significa entrada de datos desde la entrada estándar.
En Linux, puede elegir API en tiempo de ejecución especificando alsa, oss y esd.
-tamaño de porción cualquier
Tamaño del fragmento de audio en número de muestras. (predeterminado: 1000)
-lv tres
Umbral de nivel para la detección de entrada de voz. Los valores deben estar en el rango de 0 a 32767.
(predeterminado: 2000)
-zc tres
Umbral de cruce por cero por segundo. Única entrada que supera el umbral de nivel (-lv)
serán contados. (predeterminado: 60)
-margen de cabeza mseg
Margen de silencio al comienzo del segmento de voz en milisegundos. (predeterminado: 300)
-margen de cola mseg
Margen de silencio al final del segmento de voz en milisegundos. (predeterminado: 400)
-zmedia
Esta opción permite la eliminación de la compensación de CC.
-smpFreq Hz
Establezca la frecuencia de muestreo en Hz. (predeterminado: 16,000)
-48
Grabe la entrada con muestreo de 48 kHz y haga un muestreo descendente a 16 kHz sobre la marcha. Esta opción
es válido solo para el modelo de 16 kHz. La rutina de muestreo descendente se transfirió desde sptk. (Rvdo.
4.0).
-N / A nombre del dispositivo
Nombre de host para la entrada del servidor DatLink (-aporte netaudio).
-aportar número de puerto
Con -aporte adnet, especifique el número de puerto de adinnet para escuchar. (predeterminado: 5530)
-cinta
Julius elimina por defecto muestras de cero sucesivas en los datos de voz de entrada. Esta opción
para.
-C jconffile
Cargue un archivo jconf aquí. El contenido del jconffile se ampliará en este punto.
-plugindir lista de direcciones
Especifique qué directorios cargar el complemento. Si existen varios directorios, especifíquelos por
lista separada por dos puntos.
MEDIO AMBIENTE VARIABLES
ALSADEV
(usando la entrada de micrófono con un dispositivo alsa) especifique un nombre de dispositivo de captura. Si no se especifica,
se utilizará "predeterminado".
DISPOSITIVO DE AUDIO
(usando la entrada de micrófono con un dispositivo oss) especifique una ruta de dispositivo de captura. Si no se especifica,
"/ dev / dsp" se utilizará.
LATENCIA_MSEC
Intente establecer la latencia de entrada de la entrada del micrófono en milisegundos. Un valor menor
acortan la latencia pero a veces hacen que el proceso sea inestable. El valor predeterminado dependerá de la
ejecutando SO.
EJEMPLOS
Grabe la entrada del micrófono en archivos: "datos.0000.wav""datos.0001.wav" etcétera:
Dividir un archivo de voz largo "foobar.raw" dentro "foobar.1500.wav""foobar.1501.wav"...:
Copie un archivo de audio completo a través de una toma de red.
Detecte segmento de voz, envíelo a Julius a través de la red y reconózcalo:
Utilice adintool en línea utilizando los servicios de onworks.net