InglésFrancésEspañol

Ad


icono de página de OnWorks

filtros ffmpeg: en línea en la nube

Ejecute filtros ffmpeg en el proveedor de alojamiento gratuito de OnWorks a través de Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS

Este es el comando ffmpeg-filtros que se puede ejecutar en el proveedor de alojamiento gratuito de OnWorks utilizando una de nuestras múltiples estaciones de trabajo en línea gratuitas, como Ubuntu Online, Fedora Online, emulador en línea de Windows o emulador en línea de MAC OS.

PROGRAMA:

NOMBRE


filtros ffmpeg - filtros FFmpeg

DESCRIPCIÓN


Este documento describe filtros, fuentes y receptores proporcionados por la biblioteca libavfilter.

Filtrado INTRODUCCIÓN


El filtrado en FFmpeg se habilita a través de la biblioteca libavfilter.

En libavfilter, un filtro puede tener múltiples entradas y múltiples salidas. Para ilustrar el
tipo de cosas que son posibles, consideramos el siguiente gráfico de filtro.

[principal]
entrada -> dividir ---------------------> superposición -> salida
| ^
| [tmp] [flip] |
+ -----> recortar -> vflip ------- +

Este gráfico de filtro divide el flujo de entrada en dos flujos, luego envía un flujo a través del
filtro de recorte y el filtro vflip, antes de fusionarlo con el otro flujo
superponiéndolo en la parte superior. Puede usar el siguiente comando para lograr esto:

ffmpeg -i ENTRADA -vf "split [main] [tmp]; [tmp] crop = iw: ih / 2: 0: 0, vflip [flip]; [main] [flip] overlay = 0: H / 2" OUTPUT

El resultado será que la mitad superior del video se refleja en la mitad inferior del
salida de video.

Los filtros de la misma cadena lineal están separados por comas y las distintas cadenas lineales de
los filtros están separados por punto y coma. En nuestro ejemplo, cultivo, vflip están en una cadena lineal,
dividido y superposición están por separado en otro. Los puntos donde se unen las cadenas lineales son
etiquetados con nombres entre corchetes. En el ejemplo, el filtro dividido genera
dos salidas que están asociadas a las etiquetas [principal] y [tmp].

La secuencia enviada a la segunda salida de dividido, etiquetado como [tmp], se procesa a través del
cultivo filtro, que recorta la mitad inferior del video y luego verticalmente
volteado. El superposición el filtro toma en entrada la primera salida sin cambios del filtro dividido
(que fue etiquetado como [principal]), y superponga en su mitad inferior la salida generada por el
cultivo, vflip cadena de filtros.

Algunos filtros toman como entrada una lista de parámetros: se especifican después del nombre del filtro
y un signo igual, y están separados entre sí por dos puntos.

Existen los llamados fuente filtros que no tienen entrada de audio / video, y lavabo
filtros que no tendrá salida de audio / video.

GRAFICO


El gráfico2punto programa incluido en el FFmpeg El directorio se puede utilizar para analizar un
filtrar la descripción del gráfico y emitir una representación textual correspondiente en el punto
idioma.

Invocar el comando:

gráfico2punto -h

para ver como usar gráfico2punto.

A continuación, puede pasar la descripción del punto al punto programa (de la suite graphviz de
programas) y obtener una representación gráfica del gráfico de filtro.

Por ejemplo, la secuencia de comandos:

eco | \
herramientas / graph2dot -o graph.tmp && \
punto -Tpng graph.tmp -o graph.png && \
mostrar gráfico.png

se puede utilizar para crear y mostrar una imagen que represente el gráfico descrito por
DESCRIPCIÓN_GRAFICA cuerda. Tenga en cuenta que esta cadena debe ser un gráfico autónomo completo,
con sus entradas y salidas explícitamente definidas. Por ejemplo, si su línea de comando es de
la forma:

ffmpeg -i infile -vf scale = 640: 360 outfile

su proveedor DESCRIPCIÓN_GRAFICA la cadena deberá tener la forma:

nullsrc, escala = 640: 360, nullsink

es posible que también deba configurar el nulo parámetros y agregue un formato filtrar para
simular un archivo de entrada específico.

FILTROGRAFICO DESCRIPCIÓN


Un gráfico de filtro es un gráfico dirigido de filtros conectados. Puede contener ciclos, y no
Puede haber varios enlaces entre un par de filtros. Cada enlace tiene una almohadilla de entrada en un lado
conectarlo a un filtro del que toma su entrada, y un pad de salida en el otro
lado conectándolo a un filtro aceptando su salida.

Cada filtro en un gráfico de filtro es una instancia de una clase de filtro registrada en el
aplicación, que define las características y el número de pads de entrada y salida del
filtrar.

Un filtro sin pads de entrada se denomina "fuente", y un filtro sin pads de salida se denomina "fuente".
llamado "fregadero".

gráfico de filtro sintaxis
Un gráfico de filtro tiene una representación textual, que es reconocida por el -filtrar/-vf/-af y
-filtro_complejo opciones en ffmpeg y -vf/-af in ffplay, Y por el
Función "avfilter_graph_parse_ptr ()" definida en libavfilter / avfilter.h.

Una cadena de filtros consta de una secuencia de filtros conectados, cada uno conectado al
anterior en la secuencia. Una cadena de filtros está representada por una lista de "," - separados
descripciones de filtros.

Un gráfico de filtro consta de una secuencia de cadenas de filtros. Una secuencia de cadenas de filtros es
representado por una lista de ";" - descripciones de cadenas de filtros separadas.

Un filtro está representado por una cadena de la forma:
[en_enlace_1] ... [en_enlace_N]nombre_filtro=argumentos[enlace_salida_1] ... [enlace_salida_M]

nombre_filtro es el nombre de la clase de filtro de la cual el filtro descrito es una instancia
of, y debe ser el nombre de una de las clases de filtro registradas en el programa. El
opcionalmente, el nombre de la clase de filtro va seguido de una cadena "=argumentos".

argumentos es una cadena que contiene los parámetros utilizados para inicializar el filtro
ejemplo. Puede tener una de dos formas:

· A ':' - lista separada de clave = valor pares.

· A ':' - lista separada de propuesta de. En este caso, se supone que las claves son la opción
nombres en el orden en que se declaran. Por ejemplo, el filtro "fundido" declara tres opciones en
este orden -- tipo, marco_de_inicio y nb_frames. Entonces la lista de parámetros en: 0: 30 significa
que el valor in está asignado a la opción tipo, 0 a marco_de_inicio y 30 a
nb_frames.

· A ':' - lista separada de directo mixto propuesta de y largo clave = valor pares. El directo propuesta de
debe preceder al clave = valor pares, y siguen el mismo orden de restricciones del
punto anterior. La siguiente clave = valor los pares se pueden configurar en cualquier orden preferido.

Si el valor de la opción en sí es una lista de elementos (por ejemplo, el filtro "formato" toma una lista de
formatos de píxeles), los elementos de la lista suelen estar separados por |.

La lista de argumentos se puede citar utilizando el carácter ' como marca inicial y final, y
el personaje \ por escapar de los caracteres dentro del texto citado; de lo contrario el argumento
La cadena se considera terminada cuando el siguiente carácter especial (perteneciente al conjunto
[] = ;,) se encuentra.

El nombre y los argumentos del filtro están opcionalmente precedidos y seguidos de una lista de
etiquetas de enlace. Una etiqueta de enlace permite nombrar un enlace y asociarlo a una salida de filtro
o pad de entrada. Las etiquetas anteriores en_enlace_1 ... en_enlace_N, están asociados al filtro
pads de entrada, las siguientes etiquetas enlace_salida_1 ... enlace_salida_M, están asociados a la salida
almohadillas

Cuando se encuentran dos etiquetas de enlace con el mismo nombre en el gráfico de filtro,
Se crea el pad de entrada y salida correspondiente.

Si un panel de salida no está etiquetado, está vinculado de forma predeterminada a la primera entrada sin etiquetar
almohadilla del siguiente filtro en la cadena de filtros. Por ejemplo en la cadena de filtros

nullsrc, split [L1], superposición [L2], nullsink

la instancia de filtro dividido tiene dos pads de salida, y la instancia de filtro de superposición tiene dos entradas
almohadillas. La primera almohadilla de salida de la división está etiquetada como "L1", la primera almohadilla de entrada de la superposición es
etiquetado "L2", y el segundo pad de salida de split está vinculado al segundo pad de entrada de
superposición, que no están etiquetadas.

En una descripción de filtro, si no se especifica la etiqueta de entrada del primer filtro, "en" es
ficticio; si no se especifica la etiqueta de salida del último filtro, se asume "out".

En una cadena de filtros completa, todas las almohadillas de entrada y salida de filtro no etiquetadas deben
conectado. Un gráfico de filtro se considera válido si todas las almohadillas de entrada y salida de filtro de
todas las cadenas de filtros están conectadas.

Libavfilter insertará automáticamente escala filtros donde se requiere conversión de formato.
Es posible especificar indicadores de escala de escala para los escaladores insertados automáticamente mediante
anteponiendo "sws_flags =banderas; " a la descripción del gráfico de filtro.

Aquí hay una descripción BNF de la sintaxis del gráfico de filtro:

:: = secuencia de caracteres alfanuméricos y '_'
:: = "[" "]"
:: = [ ]
:: = secuencia de caracteres (posiblemente citado)
:: = [ ] ["=" ] [ ]
:: = [, ]
:: = [sws_flags = ;] [; ]

Notas on gráfico de filtro escapar
La composición de la descripción del gráfico de filtro implica varios niveles de escape. Ver las "Citando
y escapando " . in las utilidades ffmpeg(1) manual para más información sobre el
procedimiento de escape empleado.

Un escape de primer nivel afecta el contenido de cada valor de opción de filtro, que puede contener
el carácter especial ":" utilizado para separar valores, o uno de los caracteres de escape "\ '".

Un segundo nivel de escape afecta a toda la descripción del filtro, que puede contener la
caracteres de escape "\ '" o los caracteres especiales "[] ,;" utilizado por el filtergraph
descripción.

Finalmente, cuando especifica un gráfico de filtro en una línea de comandos de shell, debe realizar una
tercer nivel de escape para los caracteres especiales de shell que contiene.

Por ejemplo, considere que la siguiente cadena está incrustada en el dibujar texto filtrar
descripción texto valor:

esta es una 'cadena': puede contener uno o más caracteres especiales

Esta cadena contiene el carácter de escape especial "'" y el carácter especial ":", por lo que
debe escaparse de esta manera:

texto = esta es una \ 'cadena \' \: puede contener uno o más caracteres especiales

Se requiere un segundo nivel de escape al incrustar la descripción del filtro en un
descripción de filtergraph, para escapar de todos los caracteres especiales de filtergraph. Por lo tanto
el ejemplo anterior se convierte en:

drawtext = text = esta es una \\\ 'cadena \\\' \\: puede contener uno \, o más \, caracteres especiales

(tenga en cuenta que además de los caracteres especiales de escape "\ '", también "," debe ser
escapado).

Finalmente, se necesita un nivel adicional de escape al escribir la descripción del gráfico de filtro
en un comando de shell, que depende de las reglas de escape del shell adoptado. Por ejemplo,
asumiendo que "\" es especial y debe escaparse con otro "\", la cadena anterior
finalmente resultará en:

-vf "drawtext = text = esta es una \\\\\\ 'cadena \\\\\\' \\\\: puede contener uno \\, o más \\, caracteres especiales"

CRONOLOGÍA EDICIÓN


Algunos filtros admiten un genérico habilitar opción. Para los filtros que admiten la edición de la línea de tiempo,
esta opción se puede establecer en una expresión que se evalúa antes de enviar un marco al
filtrar. Si la evaluación es distinta de cero, el filtro se habilitará; de lo contrario, el marco
se enviará sin cambios al siguiente filtro en el gráfico de filtros.

La expresión acepta los siguientes valores:

t marca de tiempo expresada en segundos, NAN si se desconoce la marca de tiempo de entrada

n número secuencial de la trama de entrada, comenzando desde 0

pos la posición en el archivo del marco de entrada, NAN si se desconoce

w
h ancho y alto del marco de entrada si video

Además, estos filtros admiten una habilitar comando que se puede utilizar para redefinir el
expresión.

Como cualquier otra opción de filtrado, el habilitar La opción sigue las mismas reglas.

Por ejemplo, para habilitar un filtro de desenfoque (Smartblur) de 10 segundos a 3 minutos, y un
curvas filtro a partir de 3 segundos:

smartblur = enable = 'entre (t, 10,3 * 60)',
curvas = habilitar = 'gte (t, 3)': preset = cross_process

AUDIO FILTROS


Cuando configura su compilación FFmpeg, puede deshabilitar cualquiera de los filtros existentes usando
"--disable-filtros". La salida de configuración mostrará los filtros de audio incluidos en su
construir.

A continuación se muestra una descripción de los filtros de audio disponibles actualmente.

desvanecerse
Aplique fundido cruzado de una secuencia de audio de entrada a otra secuencia de audio de entrada. La Cruz
el desvanecimiento se aplica durante una duración especificada cerca del final de la primera transmisión.

El filtro acepta las siguientes opciones:

nb_muestras, ns
Especifique el número de muestras para las que debe durar el efecto de fundido cruzado. Al final
del efecto de fundido cruzado, la primera entrada de audio será completamente silenciosa. El valor predeterminado es
44100.

duración, d
Especifique la duración del efecto de fundido cruzado. Ver las Horario duración . in las
utilidades ffmpeg(1) manual para la sintaxis aceptada. Por defecto se determina la duración
by nb_muestras. Si se establece, esta opción se usa en lugar de nb_muestras.

superposición, o
¿Debería superponerse el final del primer flujo con el inicio del segundo flujo? El valor predeterminado está habilitado.

curva1
Establecer curva para transición de fundido cruzado para la primera transmisión.

curva2
Establecer curva para transición de fundido cruzado para la segunda secuencia.

Para obtener una descripción de los tipos de curvas disponibles, consulte desvanecerse descripción del filtro.

Ejemplos

· Fundido cruzado de una entrada a otra:

ffmpeg -i first.flac -i second.flac -filter_complex acrossfade = d = 10: c1 = exp: c2 = exp output.flac

· Fundido cruzado de una entrada a otra pero sin superposición:

ffmpeg -i first.flac -i second.flac -filter_complex acrossfade = d = 10: o = 0: c1 = exp: c2 = exp output.flac

un retraso
Retrasa uno o más canales de audio.

Las muestras en el canal retardado están llenas de silencio.

El filtro acepta la siguiente opción:

retrasos
Establezca la lista de retrasos en milisegundos para cada canal separados por '|'. Al menos uno
Se debe proporcionar un retraso mayor que 0. Los retrasos no utilizados se ignorarán en silencio. Si
el número de retrasos dados es menor que el número de canales, todos los canales restantes
no se demore.

Ejemplos

· Retrasa el primer canal en 1.5 segundos, el tercer canal en 0.5 segundos y deja el
segundo canal (y cualquier otro canal que pueda estar presente) sin cambios.

adelay = 1500 | 0 | 500

eco
Aplicar eco al audio de entrada.

Los ecos son sonido reflejado y pueden ocurrir naturalmente entre montañas (y a veces grandes
edificios) al hablar o gritar; Los efectos de eco digital emulan este comportamiento y son
a menudo se utiliza para ayudar a completar el sonido de un solo instrumento o voz. La diferencia horaria
entre la señal original y la reflexión es el "retraso", y el volumen de la
la señal reflejada es el "decaimiento". Múltiples ecos pueden tener diferentes retrasos y caídas.

A continuación, se incluye una descripción de los parámetros aceptados.

en_ganancia
Establece la ganancia de entrada de la señal reflejada. El valor predeterminado es 0.6.

ganar
Establece la ganancia de salida de la señal reflejada. El valor predeterminado es 0.3.

retrasos
Establecer la lista de intervalos de tiempo en milisegundos entre la señal original y los reflejos
separados por '|'. El rango permitido para cada "retraso" es "(0 - 90000.0]". El valor predeterminado es 1000.

caries
Establezca la lista de sonoridades de las señales reflejadas separadas por '|'. Rango permitido para cada
"decay" es "(0 - 1.0]". El valor predeterminado es 0.5.

Ejemplos

· Haz que suene como si hubiera el doble de instrumentos de los que realmente se están tocando:

aecho = 0.8: 0.88: 60: 0.4

· Si la demora es muy corta, entonces suena como un robot (metálico) tocando música:

aecho = 0.8: 0.88: 6: 0.4

· Un retraso más largo sonará como un concierto al aire libre en la montaña:

aecho = 0.8: 0.9: 1000: 0.3

· Igual que el anterior pero con una montaña más:

aecho=0.8:0.9:1000|1800:0.3|0.25

aeval
Modifique una señal de audio de acuerdo con las expresiones especificadas.

Este filtro acepta una o más expresiones (una para cada canal), que se evalúan
y se utiliza para modificar una señal de audio correspondiente.

Acepta los siguientes parámetros:

exprés
Establezca la lista de expresiones separadas '|' para cada canal por separado. Si el número de
canales de entrada es mayor que el número de expresiones, el último especificado
La expresión se utiliza para los canales de salida restantes.

disposición_del_canal, c
Establecer el diseño del canal de salida. Si no se especifica, el diseño del canal lo especifica el
número de expresiones. Si se establece en mismo, utilizará por defecto el mismo canal de entrada
diseño.

Cada expresión en exprés puede contener las siguientes constantes y funciones:

ch número de canal de la expresión actual

n número de la muestra evaluada, comenzando desde 0

s frecuencia de muestreo

t tiempo de la muestra evaluada expresada en segundos

nb_en_canales
nb_out_channels
número de canales de entrada y salida

val (CH)
el valor del canal de entrada con número CH

Nota: este filtro es lento. Para un procesamiento más rápido, debe usar un filtro dedicado.

Ejemplos

· Medio volumen:

aeval = val (ch) / 2: c = igual

· Invertir fase del segundo canal:

aeval =val(0) | -val(1)

desvanecerse
Aplique el efecto de fundido de entrada / salida al audio de entrada.

A continuación, se incluye una descripción de los parámetros aceptados.

tipo, t
Especifique el tipo de efecto, puede ser "in" para un fundido de entrada o "out" para un fundido de salida
efecto. El valor predeterminado es "en".

muestra_inicial, ss
Especifique el número de la muestra de inicio para comenzar a aplicar el efecto de desvanecimiento. Defecto
es 0.

nb_muestras, ns
Especifique el número de muestras para las que debe durar el efecto de desvanecimiento. Al final de
efecto de aparición gradual, el audio de salida tendrá el mismo volumen que el audio de entrada, en el
Al final de la transición de desvanecimiento, el audio de salida se silenciará. El valor predeterminado es 44100.

hora de inicio, st
Especifique la hora de inicio del efecto de desvanecimiento. El valor predeterminado es 0. Se debe especificar el valor.
como una duración de tiempo; ver las Horario duración . in las utilidades ffmpeg(1) manual para
la sintaxis aceptada. Si se establece, esta opción se usa en lugar de muestra_inicial.

duración, d
Especifique la duración del efecto de desvanecimiento. Ver las Horario duración . in las
utilidades ffmpeg(1) manual para la sintaxis aceptada. Al final del efecto de aparición gradual,
el audio de salida tendrá el mismo volumen que el audio de entrada, al final del desvanecimiento
transición el audio de salida será silencio. Por defecto, la duración está determinada por
nb_muestras. Si se establece, esta opción se usa en lugar de nb_muestras.

curva
Establecer curva para transición de fundido.

Acepta los siguientes valores:

tri seleccionar pendiente lineal triangular (predeterminado)

qsen
seleccionar un cuarto de onda sinusoidal

hsin
seleccionar la mitad de la onda sinusoidal

inspiración
seleccionar onda sinusoidal exponencial

log seleccionar logarítmico

ipar
seleccionar parábola invertida

mie seleccionar cuadrático

cubo seleccionar cúbico

squ seleccionar raíz cuadrada

cbr seleccionar raíz cúbica

por seleccionar parábola

exp seleccionar exponencial

iq sin
seleccione un cuarto invertido de onda sinusoidal

ihsin
seleccione la mitad invertida de la onda sinusoidal

deseo
seleccione asiento doble exponencial

desi
seleccione sigmoide doble exponencial

Ejemplos

· Desvanecimiento en los primeros 15 segundos de audio:

afade = t = in: ss = 0: d = 15

· Desaparece los últimos 25 segundos de un audio de 900 segundos:

afade = t = out: st = 875: d = 25

un formato
Establezca restricciones de formato de salida para el audio de entrada. El marco negociará más
formato apropiado para minimizar las conversiones.

Acepta los siguientes parámetros:

ejemplo_fmts
Una lista separada por '|' de formatos de muestra solicitados.

tarifas_de_muestra
Una lista separada por "|" de las frecuencias de muestreo solicitadas.

canal_diseños
Una lista separada por '|' de diseños de canales solicitados.

See las Channel Disposición . in las utilidades ffmpeg(1) manual para la sintaxis requerida.

Si se omite un parámetro, se permiten todos los valores.

Forzar la salida a estéreo de 8 bits sin firmar o de 16 bits con signo

aformat = sample_fmts = u8 | s16: channel_layouts = estéreo

todo pasa
Aplicar un filtro de paso total de dos polos con frecuencia central (en Hz) frecuenciay filtro
anchura anchura. Un filtro de paso total cambia la frecuencia del audio a la relación de fase
sin cambiar su relación de frecuencia a amplitud.

El filtro acepta las siguientes opciones:

frecuencia, f
Configure la frecuencia en Hz.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Especifique el ancho de banda de un filtro en unidades de tipo_ancho.

fusionarse
Combine dos o más transmisiones de audio en una única transmisión multicanal.

El filtro acepta las siguientes opciones:

entradas
Establezca el número de entradas. El valor predeterminado es 2.

Si los diseños de canales de las entradas son inconexos y, por lo tanto, compatibles, el canal
El diseño de la salida se establecerá en consecuencia y los canales se reordenarán como
necesario. Si los diseños de canales de las entradas no están separados, la salida tendrá todos
los canales de la primera entrada luego todos los canales de la segunda entrada, en ese orden,
y el diseño del canal de la salida será el valor predeterminado correspondiente al total
número de canales.

Por ejemplo, si la primera entrada está en 2.1 (FL + FR + LF) y la segunda entrada es FC + BL + BR,
entonces la salida estará en 5.1, con los canales en el siguiente orden: a1, a2, b1, a3,
b2, b3 (a1 es el primer canal de la primera entrada, b1 es el primer canal de la segunda
entrada).

Por otro lado, si ambas entradas están en estéreo, los canales de salida estarán en el valor predeterminado.
orden: a1, a2, b1, b2, y el diseño del canal se establecerá arbitrariamente en 4.0, que puede o
puede no ser el valor esperado.

Todas las entradas deben tener la misma frecuencia de muestreo y formato.

Si las entradas no tienen la misma duración, la salida se detendrá con la más corta.

Ejemplos

· Fusiona dos archivos mono en una secuencia estéreo:

amovie = left.wav [l]; amovie = right.mp3 [r]; [l] [r] fusionar

· Múltiples fusiones asumiendo 1 flujo de video y 6 flujos de audio en entrada.mkv:

ffmpeg -i input.mkv -filter_complex "[0: 1] [0: 2] [0: 3] [0: 4] [0: 5] [0: 6] amerge = input = 6" -c: a pcm_s16le output.mkv

amix
Mezcla múltiples entradas de audio en una sola salida.

Tenga en cuenta que este filtro solo admite muestras flotantes (el fusionarse y pan filtros de audio
admite muchos formatos). Si el amix la entrada tiene muestras enteras entonces una muestra se mostrarán
insertado automáticamente para realizar la conversión a muestras flotantes.

Por ejemplo:

ffmpeg -i ENTRADA1 -i ENTRADA2 -i ENTRADA3 -filter_complex amix = entradas = 3: duración = primero: dropout_transition = 3 SALIDA

mezclará 3 transmisiones de audio de entrada en una sola salida con la misma duración que la primera
entrada y un tiempo de transición de abandono de 3 segundos.

Acepta los siguientes parámetros:

entradas
El número de entradas. Si no se especifica, el valor predeterminado es 2.

duración
Cómo determinar el final del flujo.

mas largo
La duración de la entrada más larga. (defecto)

más corto
La duración de la entrada más corta.

la primera
La duración de la primera entrada.

abandono_transición
El tiempo de transición, en segundos, para la renormalización del volumen cuando finaliza un flujo de entrada.
El valor predeterminado es 2 segundos.

anular
Pase la fuente de audio sin cambios a la salida.

una almohadilla
Rellena el final de una secuencia de audio con silencio.

Esto se puede utilizar junto con ffmpeg -más corto para extender las transmisiones de audio a la misma longitud
como la secuencia de video.

A continuación, se incluye una descripción de las opciones aceptadas.

tamaño del paquete
Establecer el tamaño del paquete de silencio. El valor predeterminado es 4096.

pad_len
Establezca el número de muestras de silencio para agregar al final. Una vez alcanzado el valor,
la secuencia se termina. Esta opción es mutuamente excluyente con Whole_len.

Whole_len
Establezca el número total mínimo de muestras en el flujo de audio de salida. Si el valor es
más largo que la longitud del audio de entrada, se agrega silencio al final, hasta que el valor es
alcanzado. Esta opción es mutuamente excluyente con pad_len.

Si ni el pad_len ni la Whole_len está configurada la opción, el filtro agregará silencio a la
final de la secuencia de entrada de forma indefinida.

Ejemplos

· Agrega 1024 muestras de silencio al final de la entrada:

apad = pad_len = 1024

· Asegúrese de que la salida de audio contenga al menos 10000 muestras, rellene la entrada con
silencio si es necesario:

apad = whole_len = 10000

· Usar ffmpeg para rellenar la entrada de audio con silencio, de modo que la transmisión de video siempre
resultado el más corto y se convertirá hasta el final en el archivo de salida cuando se utiliza
las más corto opción:

ffmpeg -i VIDEO -i AUDIO -filter_complex "[1: 0] apad" -salida más corta

afasador
Agregue un efecto de fase al audio de entrada.

Un filtro de fase crea una serie de picos y valles en el espectro de frecuencias. El
La posición de los picos y valles se modula para que varíen con el tiempo, creando una
efecto de barrido.

A continuación, se incluye una descripción de los parámetros aceptados.

en_ganancia
Configure la ganancia de entrada. El valor predeterminado es 0.4.

ganar
Establece la ganancia de salida. El valor predeterminado es 0.74

retrasar
Establezca el retraso en milisegundos. El valor predeterminado es 3.0.

decadencia
Establecer decadencia. El valor predeterminado es 0.4.

velocidad
Configure la velocidad de modulación en Hz. El valor predeterminado es 0.5.

tipo
Establece el tipo de modulación. El valor predeterminado es triangular.

Acepta los siguientes valores:

triangular, t
sinusoidal, s

una muestra
Vuelva a muestrear el audio de entrada a los parámetros especificados, utilizando la biblioteca libswresample. Si
si no se especifica ninguno, el filtro se convertirá automáticamente entre su entrada y
salida.

Este filtro también puede estirar / comprimir los datos de audio para que coincidan con las marcas de tiempo
o para inyectar silencio / cortar el audio para que coincida con las marcas de tiempo, haz una combinación de
ambos o ninguno.

El filtro acepta la sintaxis [tasa_de_muestra:]remuestreo_opciones, Donde tasa_de_muestra expresa
una frecuencia de muestreo y remuestreo_opciones es una lista de clave=propuesta de pares, separados por ":". Ver
el manual ffmpeg-resampler para obtener la lista completa de opciones compatibles.

Ejemplos

· Vuelva a muestrear el audio de entrada a 44100Hz:

aresample = 44100

· Estire / apriete las muestras a las marcas de tiempo dadas, con un máximo de 1000 muestras por
segunda compensación:

aresample = async = 1000

muestras
Establezca el número de muestras por cada cuadro de audio de salida.

El último paquete de salida puede contener un número diferente de muestras, ya que el filtro se vaciará
todas las muestras restantes cuando la señal de audio de entrada finalice.

El filtro acepta las siguientes opciones:

nb_fuera_muestras, n
Establezca el número de fotogramas por cada fotograma de audio de salida. El número está destinado a
número de muestras para cada una canal. El valor predeterminado es 1024.

almohadilla, p
Si se establece en 1, el filtro rellenará el último cuadro de audio con ceros, de modo que el último
frame contendrá el mismo número de muestras que las anteriores. El valor predeterminado es
1.

Por ejemplo, para establecer el número de muestras por cuadro en 1234 y deshabilitar el relleno para el
último cuadro, use:

asetnsamples = n = 1234: p = 0

asetrar
Establezca la frecuencia de muestreo sin alterar los datos PCM. Esto resultará en un cambio de velocidad.
y tono.

El filtro acepta las siguientes opciones:

tasa_de_muestra, r
Establezca la frecuencia de muestreo de salida. El valor predeterminado es 44100 Hz.

mostrarinfo
Muestra una línea que contiene información diversa para cada fotograma de audio de entrada. El audio de entrada es
no modificado.

La línea mostrada contiene una secuencia de pares clave / valor de la forma clave:propuesta de.

Los siguientes valores se muestran en la salida:

n El número (secuencial) del marco de entrada, comenzando desde 0.

pts La marca de tiempo de presentación del marco de entrada, en unidades de base de tiempo; la base de tiempo
depende de la almohadilla de entrada del filtro, y normalmente es 1 /tasa_de_muestra.

hora_pts
La marca de tiempo de presentación del fotograma de entrada en segundos.

pos posición de la trama en el flujo de entrada, -1 si esta información no está disponible
y / o sin sentido (por ejemplo, en el caso de audio sintético)

fmt El formato de muestra.

diseño
El diseño del canal.

y
La frecuencia de muestreo del cuadro de audio.

nb_muestras
El número de muestras (por canal) en la trama.

suma de comprobación
La suma de comprobación de Adler-32 (impresa en hexadecimal) de los datos de audio. Para audio plano,
los datos se tratan como si todos los planos estuvieran concatenados.

sumas de comprobación_avión
Una lista de sumas de comprobación de Adler-32 para cada plano de datos.

astatos
Muestra información estadística en el dominio del tiempo sobre los canales de audio. Las estadísticas son
calculado y mostrado para cada canal de audio y, cuando corresponda, una cifra general
también se da.

Acepta la siguiente opción:

de largo
Longitud de ventana corta en segundos, utilizada para medición RMS pico y valle. El valor predeterminado es
0.05 (50 milisegundos). El rango permitido es "[0.1 - 10]".

metadatos
Establecer la inyección de metadatos. Todas las claves de metadatos tienen el prefijo "lavfi.astats.X",
donde "X" es el número de canal a partir de 1 o la cadena "Total". El valor predeterminado está deshabilitado.

Las claves disponibles para cada canal son: DC_offset Min_level Max_level Min_difference
Diferencia_máx. Diferencia_ media Nivel_pico RMS_peak RMS_trough Factor_de_cresta Factor_plano
Pico_recuento Bit_profundidad

y para general: DC_offset Min_level Max_level Min_difference Max_difference
Media_diferencia Nivel_pico Nivel_ RMS Nivel_RMS_pico RMS_trough Factor_plano Contador_picos
Bit_depth Número_de_muestras

Por ejemplo, la clave completa se ve así "lavfi.astats.1.DC_offset" o esto
"lavfi.astats.Overall.Peak_count".

Para obtener una descripción de lo que significa cada tecla, lea a continuación.

reajustar
Establezca el número de fotogramas después del cual se volverán a calcular las estadísticas. El valor predeterminado es
discapacitado.

A continuación, se incluye una descripción de cada parámetro mostrado:

DC compensar
Desplazamiento de amplitud media desde cero.

Min nivel
Nivel de muestra mínimo.

Max nivel
Nivel de muestra máximo.

Min un cambio
Diferencia mínima entre dos muestras consecutivas.

Max un cambio
Diferencia máxima entre dos muestras consecutivas.

Media un cambio
Diferencia media entre dos muestras consecutivas. El promedio de cada diferencia
entre dos muestras consecutivas.

En pleno nivel dB
RMS nivel dB
Pico estándar y nivel RMS medido en dBFS.

RMS pico dB
RMS canal dB
Valores máximos y mínimos para el nivel RMS medidos en una ventana corta.

Crest factor
Relación estándar de pico a nivel RMS (nota: no en dB).

Las rebabas factor
Planitud (es decir, muestras consecutivas con el mismo valor) de la señal en su pico
niveles (es decir, ya sea Min nivel or Max nivel).

En pleno contar
Número de ocasiones (no el número de muestras) que alcanzó la señal Min
nivel or Max nivel.

Poco profundidad
Profundidad de bits general de audio. Número de bits utilizados para cada muestra.

astreamsync
Reenvíe dos secuencias de audio y controle el orden en que se reenvían los búferes.

El filtro acepta las siguientes opciones:

expr, e
Establezca la expresión que decide qué flujo se debe reenviar a continuación: si el resultado es
negativo, se reenvía la primera secuencia; si el resultado es positivo o cero, el segundo
se reenvía la secuencia. Puede utilizar las siguientes variables:

b1 b2
número de búferes reenviados hasta ahora en cada transmisión

s1 s2
número de muestras enviadas hasta ahora en cada flujo

t1 t2
marca de tiempo actual de cada transmisión

El valor predeterminado es "t1-t2", lo que significa reenviar siempre la transmisión que tiene un
marca de tiempo más pequeña.

Ejemplos

Prueba de estrés "amerge" enviando búferes aleatoriamente en la entrada incorrecta, evitando también
mucha desincronización:

amovie = file.ogg [a]; amovie = file.mp3 [b];
[a] [b] astreamsync = (2 *azar(1))-1+tanh(5*(t1-t2)) [a2] [b2] ;
[a2] [b2] fusionar

asíncronos
Sincronice los datos de audio con marcas de tiempo apretándolos / estirándolos y / o soltándolos
muestras / agregar silencio cuando sea necesario.

Este filtro no está construido de forma predeterminada, utilice una muestra hacer apretar / estirar.

Acepta los siguientes parámetros:

compensar
Habilite el estiramiento / compresión de los datos para que coincidan con las marcas de tiempo. Inhabilitado por
defecto. Cuando está deshabilitado, los intervalos de tiempo se cubren con silencio.

min_delta
La diferencia mínima entre las marcas de tiempo y los datos de audio (en segundos) para activar
agregar / soltar muestras. El valor predeterminado es 0.1. Si obtiene una sincronización imperfecta con
este filtro, intente establecer este parámetro en 0.

max_comp
La compensación máxima en muestras por segundo. Solo relevante con compensar = 1. El
el valor predeterminado es 500.

primeros_ptos
Suponga que el primer PTS debería ser este valor. La base de tiempo es 1 / frecuencia de muestreo. Esta
permite rellenar / recortar al comienzo de la transmisión. Por defecto, no hay suposiciones
realizado sobre el PTS esperado del primer fotograma, por lo que no se realiza ningún relleno ni recorte. Para
Por ejemplo, esto podría establecerse en 0 para rellenar el comienzo con silencio si una transmisión de audio
comienza después de la transmisión de video o para recortar cualquier muestra con un PTS negativo debido a
retardo del codificador.

tiempo
Ajusta el tempo del audio.

El filtro acepta exactamente un parámetro, el tempo de audio. Si no se especifica, entonces el
El filtro asumirá un tempo nominal de 1.0. El tempo debe estar en el rango [0.5, 2.0].

Ejemplos

· Reduzca la velocidad del audio al 80% del tempo:

atempo = 0.8

· Para acelerar el audio al 125% de tempo:

atempo = 1.25

un recorte
Recorte la entrada para que la salida contenga una subparte continua de la entrada.

Acepta los siguientes parámetros:

comienzo
Marca de tiempo (en segundos) del inicio de la sección a conservar. Es decir, la muestra de audio con
la marca de tiempo comienzo será la primera muestra en la salida.

final Especifique el tiempo de la primera muestra de audio que se eliminará, es decir, la muestra de audio
inmediatamente anterior al que tiene la marca de tiempo final será la última muestra en el
salida.

puntos_inicio
Igual que comienzo, excepto que esta opción establece la marca de tiempo de inicio en muestras en lugar de
segundos.

puntos_finales
Igual que final, excepto que esta opción establece la marca de tiempo de finalización en muestras en lugar de segundos.

duración
La duración máxima de la salida en segundos.

muestra_inicial
El número de la primera muestra que debe imprimirse.

muestra_final
El número de la primera muestra que debe descartarse.

comienzo, finaly duración se expresan como especificaciones de duración de tiempo; ver las Horario
duración . in las utilidades ffmpeg(1) manual.

Tenga en cuenta que los dos primeros conjuntos de opciones de inicio / fin y duración opción mira la
marca de tiempo de fotograma, mientras que las opciones _sample simplemente cuentan las muestras que pasan por el
filtrar. Entonces, start / end_pts y start / end_sample darán resultados diferentes cuando el
las marcas de tiempo son incorrectas, inexactas o no comienzan en cero. También tenga en cuenta que este filtro no
modificar las marcas de tiempo. Si desea que las marcas de tiempo de salida comiencen en cero, inserte el
filtro asetpts después del filtro atrim.

Si se establecen varias opciones de inicio o fin, este filtro intenta ser codicioso y mantener todas
muestras que coinciden con al menos una de las restricciones especificadas. Para mantener solo la parte que
coincide con todas las restricciones a la vez, encadena varios filtros atrim.

Los valores predeterminados son tales que se conservan todas las entradas. Por lo tanto, es posible establecer, por ejemplo, solo el
valores finales para mantener todo antes de la hora especificada.

Ejemplos:

· Suelta todo excepto el segundo minuto de entrada:

ffmpeg -i ENTRADA -af atrim = 60: 120

· Conserve solo las primeras 1000 muestras:

ffmpeg -i ENTRADA -af atrim = end_sample = 1000

paso de banda
Aplique un filtro de paso de banda Butterworth de dos polos con frecuencia central frecuenciay
(3dB-point) ancho de banda de ancho. El CSG La opción selecciona una ganancia de falda constante (ganancia máxima =
Q) en lugar del valor predeterminado: ganancia pico constante de 0dB. El filtro se reduce a 6dB por octava
(20dB por década).

El filtro acepta las siguientes opciones:

frecuencia, f
Configure la frecuencia central del filtro. El valor predeterminado es 3000.

CSG Ganancia de falda constante si se establece en 1. El valor predeterminado es 0.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Especifique el ancho de banda de un filtro en unidades de tipo_ancho.

rechazo de banda
Aplique un filtro de rechazo de banda Butterworth de dos polos con frecuencia central frecuenciay
(3dB-point) ancho de banda anchura. El filtro se reduce a 6dB por octava (20dB por década).

El filtro acepta las siguientes opciones:

frecuencia, f
Configure la frecuencia central del filtro. El valor predeterminado es 3000.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Especifique el ancho de banda de un filtro en unidades de tipo_ancho.

bajo
Aumente o reduzca las frecuencias graves (más bajas) del audio utilizando un filtro de estantería de dos polos
con una respuesta similar a la de los controles de tono de un equipo de alta fidelidad estándar. Esto también se conoce como
ecualización de estantería (EQ).

El filtro acepta las siguientes opciones:

ganancia, g
Dar la ganancia a 0 Hz. Su rango útil es de aproximadamente -20 (para un corte grande) a +20 (para un
gran impulso). Tenga cuidado con el recorte cuando utilice una ganancia positiva.

frecuencia, f
Configure la frecuencia central del filtro y así se puede usar para extender o reducir la
rango de frecuencia para aumentar o reducir. El valor predeterminado es 100 Hz.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Determine qué tan empinada es la transición de estante del filtro.

bicuadrado
Aplique un filtro biquad IIR con los coeficientes dados. Donde b0, b1, b2 y a0, a1, a2
son los coeficientes del numerador y del denominador respectivamente.

bs2b
Transformación de estéreo a binaural Bauer, que mejora la escucha de estéreo con auriculares
grabaciones de audio.

Acepta los siguientes parámetros:

perfiles
Nivel de alimentación cruzada predefinido.

tu préstamo estudiantil
Nivel predeterminado (fcut = 700, feed = 50).

cmoy
Circuito Chu Moy (fcut = 700, feed = 60).

jmeier
Circuito de Jan Meier (fcut = 650, feed = 95).

corte
Frecuencia de corte (en Hz).

pienso
Nivel de alimentación (en Hz).

mapa de canales
Vuelva a asignar los canales de entrada a nuevas ubicaciones.

Acepta los siguientes parámetros:

disposición_del_canal
El diseño de canal del flujo de salida.

mapa Mapa de canales de entrada a salida. El argumento es una lista de asignaciones separada por '|',
cada uno en el "in_channel-out_channel " or en_canal . en_canal puede ser el
nombre del canal de entrada (por ejemplo, FL para el frente izquierdo) o su índice en el canal de entrada
diseño. canal_salida es el nombre del canal de salida o su índice en la salida
diseño de canales. Si canal_salida no se da, entonces es implícitamente un índice, comenzando
con cero y aumentando en uno para cada mapeo.

Si no hay ningún mapeo, el filtro mapeará implícitamente los canales de entrada a los de salida.
canales, conservando índices.

Por ejemplo, asumiendo un archivo MOV de entrada 5.1 + downmix,

ffmpeg -i in.mov -filter 'channelmap = map = DL-FL | DR-FR' out.wav

creará un archivo WAV de salida etiquetado como estéreo a partir de los canales de mezcla descendente de la entrada.

Para arreglar un WAV 5.1 codificado incorrectamente en el orden de canal nativo de AAC

ffmpeg -i in.wav -filter 'channelmap = 1 | 2 | 0 | 5 | 3 | 4: 5.1' out.wav

canales divididos
Divida cada canal de una secuencia de audio de entrada en una secuencia de salida separada.

Acepta los siguientes parámetros:

disposición_del_canal
El diseño de canal del flujo de entrada. El valor predeterminado es "estéreo".

Por ejemplo, suponiendo un archivo MP3 de entrada estéreo,

ffmpeg -i in.mp3 -filter_complex canales divididos.mkv

creará un archivo Matroska de salida con dos secuencias de audio, una que contiene solo la izquierda
canal y el otro el canal derecho.

Divida un archivo WAV 5.1 en archivos por canal:

ffmpeg -i en.wav -filter_complex
'channelplit = channel_layout = 5.1 [FL] [FR] [FC] [LFE] [SL] [SR]'
-map '[FL]' front_left.wav -map '[FR]' front_right.wav -map '[FC]'
front_center.wav -map '[LFE]' lfe.wav -map '[SL]' side_left.wav -map '[SR]'
lado_derecho.wav

coro
Agrega un efecto de coro al audio.

Puede hacer que una sola voz suene como un coro, pero también se puede aplicar a la instrumentación.

El coro se asemeja a un efecto de eco con un breve retardo, pero mientras que con el eco el retardo es
constante, con chorus, se varía utilizando modulación sinusoidal o triangular. El
La profundidad de modulación define el rango en el que se reproduce el retardo modulado antes o después del
demora. Por lo tanto, el sonido retardado sonará más lento o más rápido, es decir, el sonido retardado.
afinado alrededor del original, como en un coro donde algunas voces están ligeramente desafinadas.

Acepta los siguientes parámetros:

en_ganancia
Configure la ganancia de entrada. El valor predeterminado es 0.4.

ganar
Establece la ganancia de salida. El valor predeterminado es 0.4.

retrasos
Establecer retrasos. Un retraso típico es de alrededor de 40 ms a 60 ms.

caries
Establecer decaimientos.

velocidades
Establecer velocidades.

profundidades
Establecer profundidades.

Ejemplos

· Un solo retraso:

chorus=0.7:0.9:55:0.4:0.25:2

· Dos retrasos:

chorus=0.6:0.9:50|60:0.4|0.32:0.25|0.4:2|1.3

· Coro de sonido más completo con tres retardos:

chorus=0.5:0.9:50|60|40:0.4|0.32|0.3:0.25|0.4|0.3:2|2.3|1.3

compañía
Comprime o expande el rango dinámico del audio.

Acepta los siguientes parámetros:

ataques
caries
Una lista de tiempos en segundos para cada canal sobre el cual el nivel instantáneo del
la señal de entrada se promedia para determinar su volumen. ataques se refiere al aumento de volumen
y caries se refiere a la disminución del volumen. Para la mayoría de situaciones, el tiempo de ataque
(respuesta al audio cada vez más fuerte) debe ser más corto que el tiempo de caída, porque
el oído humano es más sensible al sonido fuerte repentino que al sonido suave repentino. Un tipico
El valor de ataque es de 0.3 segundos y un valor típico de caída es de 0.8 segundos. Si
el número especificado de ataques y desintegraciones es menor que el número de canales, el último conjunto
El ataque / decaimiento se utilizará para todos los canales restantes.

puntos
Una lista de puntos para la función de transferencia, especificada en dB en relación con el máximo
posible amplitud de la señal. Cada lista de puntos clave debe definirse utilizando lo siguiente
sintaxis: "x0 / y0 | x1 / y1 | x2 / y2 | ...." o "x0 / y0 x1 / y1 x2 / y2 ...."

Los valores de entrada deben estar en orden estrictamente creciente, pero la función de transferencia no
no tiene que estar aumentando monótonamente. Se asume el punto "0/0" pero se puede anular
(por "0 / out-dBn"). Los valores típicos para la función de transferencia son "-70 / -70 | -60 / -20".

rodilla blanda
Establezca el radio de la curva en dB para todas las uniones. Su valor predeterminado es 0.01.

ganancia
Establezca la ganancia adicional en dB que se aplicará en todos los puntos de la función de transferencia.
Esto permite un fácil ajuste de la ganancia general. Su valor predeterminado es 0.

volumen
Establezca un volumen inicial, en dB, que se asumirá para cada canal cuando comience el filtrado.
Esto permite al usuario suministrar un nivel nominal inicialmente, de modo que, por ejemplo,
No se aplica una ganancia muy grande a los niveles iniciales de la señal antes de que la compresión haya
comenzó a operar. Un valor típico para el audio que inicialmente es silencioso es -90 dB. Eso
el valor predeterminado es 0.

retrasar
Establezca un retraso, en segundos. El audio de entrada se analiza inmediatamente, pero el audio se retrasa
antes de pasar al ajustador de volumen. Especificando un retraso aproximadamente igual al
Los tiempos de ataque / desintegración permiten que el filtro opere de manera efectiva en predictivo en lugar de
modo reactivo. Su valor predeterminado es 0.

Ejemplos

· Haga música con pasajes altos y silenciosos adecuados para escuchar en un ambiente ruidoso
ambiente:

compand=.3|.3:1|1:-90/-60|-60/-40|-40/-30|-20/-20:6:0:-90:0.2

Otro ejemplo de audio con partes de susurro y explosión:

compand=0|0:1|1:-90/-900|-70/-70|-30/-9|0/-3:6:0:0:0

· Una puerta de ruido para cuando el ruido está en un nivel más bajo que la señal:

compand=.1|.1:.2|.2:-900/-900|-50.1/-900|-50/-50:.01:0:-90:.1

· Aquí hay otra puerta de ruido, esta vez para cuando el ruido está en un nivel más alto que el
señal (haciéndolo, de alguna manera, similar al silenciador):

compand=.1|.1:.1|.1:-45.1/-45.1|-45/-900|0/-900:.01:45:-90:.1

dccambio
Aplica un cambio de CC al audio.

Esto puede ser útil para eliminar un desplazamiento de CC (causado quizás por un problema de hardware en el
cadena de grabación) del audio. El efecto de una compensación de CC es un margen reducido y, por lo tanto,
volumen. El astatos El filtro se puede utilizar para determinar si una señal tiene un desplazamiento de CC.

Turno
Establezca el desplazamiento de CC, el rango permitido es [-1, 1]. Indica la cantidad para cambiar el
de audio.

limitador de nuevo
Opcional. Debe tener un valor mucho menor que 1 (por ejemplo, 0.05 o 0.02) y se usa para
evitar el recorte.

dynaudnorm
Normalizador de audio dinámico.

Este filtro aplica una cierta cantidad de ganancia al audio de entrada para traer su pico
magnitud a un nivel objetivo (por ejemplo, 0 dBFS). Sin embargo, en contraste con más "simples"
algoritmos de normalización, Dynamic Audio Normalizer * dinámicamente * reajusta la ganancia
factor al audio de entrada. Esto permite aplicar una ganancia extra a las secciones "silenciosas" de
el audio evitando distorsiones o recortando las secciones "ruidosas". En otras palabras: El
Dynamic Audio Normalizer "nivelará" el volumen de las secciones silenciosas y ruidosas, en el
siente que el volumen de cada sección se lleva al mismo nivel objetivo. Sin embargo, tenga en cuenta
que Dynamic Audio Normalizer logra este objetivo * sin * aplicar "rango dinámico
compresión ". Retendrá el 100% del rango dinámico * dentro * de cada sección del audio
archivo.

f Establezca la longitud del cuadro en milisegundos. En el rango de 10 a 8000 milisegundos. Defecto
es 500 milisegundos. El Normalizador de audio dinámico procesa el audio de entrada en pequeños
fragmentos, denominados fotogramas. Esto es necesario, porque una magnitud pico no tiene
es decir, para un solo valor de muestra. En cambio, necesitamos determinar el pico
magnitud para una secuencia contigua de valores de muestra. Mientras que un normalizador "estándar"
simplemente usaría la magnitud máxima del archivo completo, el Normalizador de audio dinámico
determina la magnitud máxima de forma individual para cada fotograma. La longitud de un marco es
especificado en milisegundos. De forma predeterminada, el Normalizador de audio dinámico utiliza un marco
longitud de 500 milisegundos, que se ha encontrado que da buenos resultados con la mayoría de los archivos.
Tenga en cuenta que se determinará la longitud exacta del cuadro, en número de muestras
automáticamente, según la frecuencia de muestreo del archivo de audio de entrada individual.

g Establezca el tamaño de la ventana del filtro gaussiano. En el rango de 3 a 301, debe ser un número impar.
El valor predeterminado es 31. Probablemente el parámetro más importante del normalizador de audio dinámico.
es el "tamaño de la ventana" del filtro de suavizado gaussiano. El tamaño de la ventana del filtro es
especificado en fotogramas, centrado alrededor del fotograma actual. Por el bien de la simplicidad,
debe ser un número impar. En consecuencia, el valor predeterminado de 31 tiene en cuenta
el fotograma actual, así como los 15 fotogramas anteriores y los 15 fotogramas posteriores.
El uso de una ventana más grande da como resultado un efecto de suavizado más fuerte y, por lo tanto, una menor ganancia.
variación, es decir, una adaptación de ganancia más lenta. Por el contrario, el uso de una ventana más pequeña da como resultado
un efecto de suavizado más débil y, por lo tanto, en una mayor variación de ganancia, es decir, una ganancia más rápida
adaptación. En otras palabras, cuanto más aumente este valor, mayor será la dinámica
Audio Normalizer se comportará como un filtro de normalización "tradicional". Sobre el
Por el contrario, cuanto más disminuya este valor, más se reducirá el Normalizador de audio dinámico.
se comporta como un compresor de rango dinámico.

p Establezca el valor pico objetivo. Esto especifica el nivel de magnitud más alto permitido para
la entrada de audio normalizada. Este filtro intentará acercarse a la magnitud del pico objetivo
lo más cerca posible, pero al mismo tiempo también se asegura de que la normalización
La señal nunca excederá la magnitud máxima. El factor de ganancia local máximo de una trama es
impuesta directamente por la magnitud del pico objetivo. El valor predeterminado es 0.95 y por lo tanto
deja una altura libre del 5% *. No se recomienda superar este valor.

m Establezca el factor de ganancia máximo. En el rango de 1.0 a 100.0. El valor predeterminado es 10.0. La dinámica
Audio Normalizer determina el factor de ganancia máximo posible (local) para cada entrada
fotograma, es decir, el factor de ganancia máximo que no produce recorte o distorsión.
El factor de ganancia máxima está determinado por la muestra de mayor magnitud de la trama.
Sin embargo, el Normalizador de audio dinámico también limita la ganancia máxima del cuadro
factor por un factor de ganancia máximo predeterminado (global). Esto se hace para evitar
factores de ganancia excesivos en cuadros "silenciosos" o casi silenciosos. Por defecto, el máximo
El factor de ganancia es 10.0. Para la mayoría de las entradas, el valor predeterminado debería ser suficiente y
Por lo general, no se recomienda aumentar este valor. Aunque, para la entrada con un
nivel de volumen general bajo, puede ser necesario permitir factores de ganancia aún más altos. Nota,
sin embargo, que el Normalizador de audio dinámico no aplica simplemente un umbral "estricto"
(es decir, valores de corte por encima del umbral). En su lugar, una función de umbral "sigmoidea"
sera aplicado. De esta manera, los factores de ganancia se acercarán suavemente al umbral.
valor, pero nunca exceda ese valor.

r Establezca el RMS objetivo. En el rango de 0.0 a 1.0. El valor predeterminado es 0.0 - deshabilitado. Por defecto,
el Normalizador de audio dinámico realiza una normalización de "picos". Esto significa que el
El factor de ganancia local máximo para cada trama se define (solo) por el valor más alto de la trama.
muestra de magnitud. De esta forma, las muestras se pueden amplificar tanto como sea posible sin
superando el nivel máximo de señal, es decir, sin recorte. Opcionalmente, sin embargo, el
Dynamic Audio Normalizer también puede tener en cuenta el cuadrado medio de la raíz del cuadro,
RMS abreviado. En ingeniería eléctrica, el RMS se usa comúnmente para determinar el
potencia de una señal variable en el tiempo. Por tanto, se considera que el RMS es un mejor
aproximación del "volumen percibido" que simplemente mirar el pico de la señal
magnitud. En consecuencia, al ajustar todos los fotogramas a un valor RMS constante, se
Se puede establecer la "sonoridad percibida". Si se ha especificado un valor RMS objetivo,
El factor de ganancia local de la trama se define como el factor que daría como resultado exactamente eso
Valor RMS. Sin embargo, tenga en cuenta que el factor de ganancia local máximo todavía está restringido por
la muestra de mayor magnitud del fotograma, para evitar recortes.

n Habilitar el acoplamiento de canales. Por defecto está habilitado. De forma predeterminada, el audio dinámico
El normalizador amplificará todos los canales en la misma cantidad. Esto significa la misma ganancia
se aplicará a todos los canales, es decir, el factor de ganancia máximo posible es
determinado por el canal "más ruidoso". Sin embargo, en algunas grabaciones, puede suceder que
el volumen de los diferentes canales es desigual, por ejemplo, un canal puede ser "más silencioso" que
los otros). En este caso, esta opción se puede utilizar para deshabilitar el canal
acoplamiento. De esta forma, el factor de ganancia se determinará de forma independiente para cada canal,
dependiendo solo de la muestra de mayor magnitud del canal individual. Esto permite
armonizando el volumen de los diferentes canales.

c Habilite la corrección de polarización de CC. Por defecto está deshabilitado. Una señal de audio (en el tiempo
dominio) es una secuencia de valores de muestra. En el Normalizador de audio dinámico, estos ejemplos
Los valores están representados en el rango de -1.0 a 1.0, independientemente de la entrada original.
formato. Normalmente, la señal de audio, o "forma de onda", debe centrarse alrededor del cero
punto. Eso significa que si calculamos el valor medio de todas las muestras en un archivo, o en un
fotograma único, entonces el resultado debe ser 0.0 o al menos muy cerca de ese valor. Si,
sin embargo, hay una desviación significativa del valor medio de 0.0, ya sea en
dirección positiva o negativa, esto se conoce como polarización de CC o desplazamiento de CC. Desde un
El sesgo de CC es claramente indeseable, el normalizador de audio dinámico proporciona un sesgo de CC opcional
corrección. Con la corrección de polarización de CC habilitada, el normalizador de audio dinámico
determinar el valor medio, o compensación de "corrección de CC", de cada cuadro de entrada y restar
ese valor de todos los valores de muestra del marco, lo que garantiza que esas muestras sean
centrado alrededor de 0.0 nuevamente. Además, para evitar "huecos" en los límites del marco, el
Los valores de compensación de corrección de CC se interpolarán suavemente entre los fotogramas vecinos.

b Habilite el modo de límite alternativo. Por defecto está deshabilitado. El audio dinámico
El normalizador tiene en cuenta una determinada vecindad alrededor de cada cuadro. Esto incluye
los fotogramas anteriores así como los fotogramas posteriores. Sin embargo, para el "límite"
fotogramas, ubicados al principio y al final del archivo de audio, no todos
los marcos vecinos están disponibles. En particular, para los primeros fotogramas de la
archivo de audio, no se conocen los fotogramas anteriores. Y, de manera similar, para los últimos
fotogramas en el archivo de audio, no se conocen los fotogramas siguientes. Por tanto, la pregunta
surge qué factores de ganancia deben asumirse para los fotogramas que faltan en el "límite"
región. Dynamic Audio Normalizer implementa dos modos para hacer frente a esta situación.
El modo de límite predeterminado asume un factor de ganancia de exactamente 1.0 para los fotogramas faltantes,
resultando en un suave "fade in" y "fade out" al principio y al final de la
entrada, respectivamente.

s Establezca el factor de compresión. En el rango de 0.0 a 30.0. El valor predeterminado es 0.0. Por defecto, el
Dynamic Audio Normalizer no aplica la compresión "tradicional". Esto significa que
los picos de señal no se eliminarán y, por lo tanto, se mantendrá el rango dinámico completo
dentro de cada barrio local. Sin embargo, en algunos casos puede ser conveniente combinar
el algoritmo de normalización del Dynamic Audio Normalizer con un método más "tradicional"
compresión. Para este propósito, el Normalizador de audio dinámico proporciona un
función de compresión (umbralización). Si (y solo si) la función de compresión está
habilitado, todos los fotogramas de entrada serán procesados ​​por una función de umbral de rodilla suave antes
al proceso de normalización real. En pocas palabras, la función de umbral
pode todas las muestras cuya magnitud exceda un cierto valor umbral. sin embargo, el
Dynamic Audio Normalizer no aplica simplemente un valor de umbral fijo. En cambio, el
El valor de umbral se ajustará para cada fotograma individual. En general, más pequeño
Los parámetros dan como resultado una compresión más fuerte y viceversa. Los valores por debajo de 3.0 no son
recomendado, porque puede aparecer una distorsión audible.

cerumen
Haga que el audio sea más fácil de escuchar con auriculares.

Este filtro agrega "señales" al audio estéreo de 44.1 kHz (es decir, formato de CD de audio) para que cuando
escuchado en auriculares, la imagen estéreo se mueve desde el interior de su cabeza (estándar para
auriculares) al exterior y delante del oyente (estándar para altavoces).

Portado desde SoX.

igualada
Aplique un filtro de ecualización de picos (EQ) de dos polos. Con este filtro, el nivel de la señal en
y alrededor de una frecuencia seleccionada se puede aumentar o disminuir, mientras que (a diferencia del paso de banda y
filtros de rechazo de banda) que en todas las demás frecuencias no se modifica.

Para producir curvas de ecualización complejas, este filtro se puede aplicar varias veces,
cada uno con una frecuencia central diferente.

El filtro acepta las siguientes opciones:

frecuencia, f
Configure la frecuencia central del filtro en Hz.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Especifique el ancho de banda de un filtro en unidades de tipo_ancho.

ganancia, g
Establezca la ganancia o atenuación requerida en dB. Tenga cuidado con los recortes cuando utilice un positivo
ganar.

Ejemplos

· Atenuar 10 dB a 1000 Hz, con un ancho de banda de 200 Hz:

ecualizador = f = 1000: width_type = h: width = 200: g = -10

· Aplique una ganancia de 2 dB a 1000 Hz con Q 1 y atenúe 5 dB a 100 Hz con Q 2:

equalizer=f=1000:width_type=q:width=1:g=2,equalizer=f=100:width_type=q:width=2:g=-5

flanger
Aplica un efecto de flanger al audio.

El filtro acepta las siguientes opciones:

retrasar
Establece la demora base en milisegundos. Rango de 0 a 30. El valor predeterminado es 0.

profundidad
Establezca el retardo de barrido adicional en milisegundos. Rango de 0 a 10. El valor predeterminado es 2.

revolver
Configure el porcentaje de regeneración (retroalimentación de señal retardada). Rango de -95 a 95. Predeterminado
el valor es 0.

anchura
Establezca el porcentaje de señal retardada mezclada con la original. Rango de 0 a 100. Predeterminado
el valor es 71.

velocidad
Establecer barridos por segundo (Hz). Rango de 0.1 a 10. El valor predeterminado es 0.5.

dar forma a
Establecer forma de onda barrida, puede ser triangular or sinusoidal. El valor predeterminado es sinusoidal.

fase
Configure el desplazamiento porcentual de la onda de barrido para multicanal. Rango de 0 a 100. Valor predeterminado
es 25.

interpretar
Establecer la interpolación de la línea de retardo, lineal or cuadrático. El valor predeterminado es lineal.

paso alto
Aplique un filtro de paso alto con una frecuencia puntual de 3dB. El filtro puede ser unipolar,
o bipolar (por defecto). El filtro cae a 6dB por polo por octava (20dB por
polo por década).

El filtro acepta las siguientes opciones:

frecuencia, f
Configure la frecuencia en Hz. El valor predeterminado es 3000.

postes p
Establecer el número de polos. El valor predeterminado es 2.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Especifique el ancho de banda de un filtro en unidades de tipo_ancho. Se aplica solo a bipolar
filtrar. El valor predeterminado es 0.707q y da una respuesta de Butterworth.

únete
Únase a múltiples flujos de entrada en un flujo multicanal.

Acepta los siguientes parámetros:

entradas
El número de flujos de entrada. Su valor predeterminado es 2.

disposición_del_canal
El diseño del canal de salida deseado. Por defecto es estéreo.

mapa Mapa de canales de entradas a salidas. El argumento es una lista de asignaciones separada por '|',
cada uno en el "input_idx.in_channel-out_channel " . entrada_idx es el índice basado en 0 de
el flujo de entrada. en_canal puede ser el nombre del canal de entrada (p. ej., FL para
anverso izquierdo) o su índice en el flujo de entrada especificado. canal_salida es el nombre de la
canal de salida.

El filtro intentará adivinar las asignaciones cuando no se especifiquen explícitamente. Eso
lo hace primero tratando de encontrar un canal de entrada coincidente no utilizado y, si eso falla,
elige el primer canal de entrada no utilizado.

Une 3 entradas (con diseños de canales configurados correctamente):

ffmpeg -i ENTRADA1 -i ENTRADA2 -i ENTRADA3 -filtro_complejo unión = entradas = 3 SALIDA

Cree una salida 5.1 a partir de 6 transmisiones de un solo canal:

ffmpeg -i fl -i fr -i fc -i sl -i sr -i lfe -complejo_filtro
'join=inputs=6:channel_layout=5.1:map=0.0-FL|1.0-FR|2.0-FC|3.0-SL|4.0-SR|5.0-LFE'
salir

muchachospa
Cargue un complemento LADSPA (API de complemento simple para desarrolladores de audio de Linux).

Para habilitar la compilación de este filtro, debe configurar FFmpeg con "--enable-ladspa".

archivo, f
Especifica el nombre de la biblioteca de complementos LADSPA que se cargará. Si la variable de entorno
LADSPA_RUTA está definido, se busca el plugin LADSPA en cada uno de los directorios
especificado por la lista separada por dos puntos en LADSPA_RUTA, de lo contrario en el estándar LADSPA
rutas, que están en este orden: INICIO / .ladspa / lib /, / usr / local / lib / ladspa /,
/ usr / lib / ladspa /.

enchufar, p
Especifica el complemento dentro de la biblioteca. Algunas bibliotecas contienen solo un complemento, pero
otros contienen muchos de ellos. Si esto no está configurado, el filtro enumerará todos los complementos disponibles
dentro de la biblioteca especificada.

control S, c
Establezca el '|' lista separada de controles que son cero o más valores de punto flotante
que determinan el comportamiento del complemento cargado (por ejemplo, retraso, umbral o
ganar). Los controles deben definirse utilizando la siguiente sintaxis:
c0 =valor0| c1 =valor1| c2 =valor2| ..., donde valori es el valor establecido en el i-ésimo control.
If controles está configurado en "ayuda", todos los controles disponibles y sus rangos válidos son
impreso.

tasa_de_muestra, s
Especifique la frecuencia de muestreo, el valor predeterminado es 44100. Solo se usa si el complemento tiene cero entradas.

nb_muestras, n
Establezca el número de muestras por canal por cada cuadro de salida, el valor predeterminado es 1024. Solo
se usa si el complemento tiene cero entradas.

duración, d
Establezca la duración mínima del audio de origen. Ver las Horario duración . in las
utilidades ffmpeg(1) manual para la sintaxis aceptada. Tenga en cuenta que la duración resultante puede
ser mayor que la duración especificada, ya que el audio generado siempre se corta en el
final de un cuadro completo. Si no se especifica, o la duración expresada es negativa, la
se supone que el audio se genera para siempre. Solo se usa si el complemento no tiene entradas.

Ejemplos

· Enumere todos los complementos disponibles dentro de la biblioteca amp (complemento de ejemplo LADSPA):

ladspa = file = amp

· Enumere todos los controles disponibles y sus rangos válidos para el complemento "vcf_notch" de "VCF"
biblioteca:

ladspa = f = vcf: p = vcf_notch: c = ayuda

· Simula equipos de audio de baja calidad con el complemento "Computer Music Toolkit" (CMT)
biblioteca:

ladspa=file=cmt:plugin=lofi:controls=c0=22|c1=12|c2=12

· Agregue reverberación al audio usando complementos TAP (complementos de procesamiento de audio de Tom):

ladspa = file = tap_reverb: tap_reverb

· Genera ruido blanco, con amplitud de 0.2:

ladspa = file = cmt: ruido_fuente_blanco: c = c0 = .2

· Genera clics de 20 bpm usando el complemento "C * Click - Metronome" del complemento de audio "C *
Biblioteca Suite "(CAPS):

ladspa = file = caps: Click: c = c1 = 20 '

· Aplicar el efecto "C * Eq10X2 - Ecualizador estéreo de 10 bandas":

ladspa=caps:Eq10X2:c=c0=-48|c9=-24|c3=12|c4=2

Comandos

Este filtro admite los siguientes comandos:

cN Modificar el N-ésimo valor de control.

Si el valor especificado no es válido, se ignora y se mantiene el anterior.

paso bajo
Aplique un filtro de paso bajo con una frecuencia puntual de 3dB. El filtro puede ser unipolar o
bipolar (por defecto). El filtro cae a 6dB por polo por octava (20dB por polo
por década).

El filtro acepta las siguientes opciones:

frecuencia, f
Configure la frecuencia en Hz. El valor predeterminado es 500.

postes p
Establecer el número de polos. El valor predeterminado es 2.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Especifique el ancho de banda de un filtro en unidades de tipo_ancho. Se aplica solo a bipolar
filtrar. El valor predeterminado es 0.707q y da una respuesta de Butterworth.

pan
Mezcle canales con niveles de ganancia específicos. El filtro acepta el diseño del canal de salida
seguido de un conjunto de definiciones de canales.

Este filtro también está diseñado para reasignar de manera eficiente los canales de una secuencia de audio.

El filtro acepta parámetros de la forma: "l|superar|superar| ... "

l diseño del canal de salida o número de canales

superar
especificación del canal de salida, de la forma:
"nombre_fuera=[ganancia*]en nombre[+ [ganancia*]en nombre...] "

nombre_fuera
canal de salida para definir, ya sea un nombre de canal (FL, FR, etc.) o un número de canal
(c0, c1, etc)

ganancia
coeficiente multiplicativo para el canal, 1 dejando el volumen sin cambios

en nombre
canal de entrada para usar, vea out_name para más detalles; no es posible mezclar nombre y
canales de entrada numerados

Si el `= 'en una especificación de canal se reemplaza por` <', entonces las ganancias para ese
La especificación se volverá a normalizar para que el total sea 1, evitando así el ruido de recorte.

Mezcla ejemplos

Por ejemplo, si desea realizar una mezcla descendente de estéreo a mono, pero con un factor mayor para la
canal izquierdo:

pan=1c|c0=0.9*c0+0.1*c1

Un down-mix personalizado a estéreo que funciona automáticamente para 3, 4, 5 y 7 canales
rodear:

pan = estéreo | FL <FL + 0.5 * FC + 0.6 * BL + 0.6 * SL | FR <FR + 0.5 * FC + 0.6 * BR + 0.6 * SR

Tenga en cuenta que ffmpeg integra un sistema de mezcla descendente (y mezcla ascendente) predeterminado que debe ser
preferido (consulte la opción "-ac") a menos que tenga necesidades muy específicas.

Reasignación ejemplos

La reasignación de canales será efectiva si, y solo si:

*
*

Si se cumplen todas estas condiciones, el filtro notificará al usuario ("Canal puro
mapeo detectado "), y utilice un método optimizado y sin pérdidas para realizar el remapeo.

Por ejemplo, si tiene una fuente 5.1 y desea una transmisión de audio estéreo eliminando el
canales:

pan = "estéreo | c0 = FL | c1 = FR"

Dada la misma fuente, también puede cambiar los canales frontales izquierdo y derecho y mantener
el diseño del canal de entrada:

pan = "5.1 | c0 = c1 | c1 = c0 | c2 = c2 | c3 = c3 | c4 = c4 | c5 = c5"

Si la entrada es un flujo de audio estéreo, puede silenciar el canal frontal izquierdo (y aún mantener
el diseño del canal estéreo) con:

pan = "estéreo | c1 = c1"

Aún con una entrada de flujo de audio estéreo, puede copiar el canal derecho en ambos lados delantero izquierdo
y a la derecha:

pan = "estéreo | c0 = FR | c1 = FR"

volver a jugar
Filtro de escáner ReplayGain. Este filtro toma un flujo de audio como entrada y lo emite
sin alterar. Al final del filtrado, muestra "track_gain" y "track_peak".

volver a muestrear
Convierta el formato de muestra de audio, la frecuencia de muestreo y el diseño del canal. No está destinado a ser
utilizado directamente.

compresión de cadena lateral
Este filtro actúa como un compresor normal pero tiene la capacidad de comprimir la señal detectada
utilizando una segunda señal de entrada. Necesita dos flujos de entrada y devuelve un flujo de salida.
El primer flujo de entrada se procesará según la señal del segundo flujo. El filtrado
la señal luego se puede filtrar con otros filtros en etapas posteriores de procesamiento. Ver pan y
fusionarse filtrar.

El filtro acepta las siguientes opciones:

umbral
Si una señal del segundo flujo sube por encima de este nivel, afectará la reducción de ganancia.
del primer flujo. Por defecto es 0.125. El rango está entre 0.00097563 y 1.

proporción
Establezca una relación en torno a la cual se reduce la señal. 1: 2 significa que si el nivel subió 4dB
por encima del umbral, estará solo 2 dB por encima después de la reducción. El valor predeterminado es 2.
El rango está entre 1 y 20.

atacar
Cantidad de milisegundos que la señal tiene que elevarse por encima del umbral antes de la ganancia.
comienza la reducción. El valor predeterminado es 20. El rango está entre 0.01 y 2000.

,
Cantidad de milisegundos que la señal tiene que caer por debajo del umbral antes de que se produzca la reducción.
disminuyó de nuevo. El valor predeterminado es 250. El rango está entre 0.01 y 9000.

maquillaje
Establezca la cantidad de señal que se amplificará después del procesamiento. El valor predeterminado es 2.
El rango es de 1 a 64.

rodilla
Curva la rodilla afilada alrededor del umbral para entrar en la reducción de ganancia de forma más suave.
El valor predeterminado es 2.82843. El rango está entre 1 y 8.

liga
Elija si el nivel "promedio" entre todos los canales del flujo de cadena lateral o el
El canal más alto ("máximo") del flujo de la cadena lateral afecta la reducción. El valor predeterminado es
"promedio".

detección
Debe tomarse la señal exacta en caso de "pico" o una RMS en caso de "rms".
El valor predeterminado es "rms", que es principalmente más suave.

Ejemplos

· Ejemplo completo de ffmpeg tomando 2 entradas de audio, la primera entrada se comprimirá dependiendo de la
señal de la segunda entrada y luego la señal comprimida que se fusionará con la segunda entrada:

ffmpeg -i main.flac -i sidechain.flac -filter_complex "[1: a] asplit = 2 [sc] [mix]; [0: a] [sc] sidechaincompress [compr]; [compr] [mix] amerge"

silencio detectar
Detecta el silencio en una secuencia de audio.

Este filtro registra un mensaje cuando detecta que el volumen de audio de entrada es menor o igual a
un valor de tolerancia al ruido por una duración mayor o igual al ruido mínimo detectado
duración.

Los tiempos y la duración impresos se expresan en segundos.

El filtro acepta las siguientes opciones:

duración, d
Establezca la duración del silencio hasta la notificación (el valor predeterminado es 2 segundos).

ruido, n
Establezca la tolerancia al ruido. Se puede especificar en dB (en caso de que se agregue "dB" al
valor) o relación de amplitud. El valor predeterminado es -60dB o 0.001.

Ejemplos

· Detecta 5 segundos de silencio con tolerancia al ruido de -50dB:

Silenciodetect = n = -50dB: d = 5

· Ejemplo completo con ffmpeg para detectar silencio con tolerancia al ruido de 0.0001 en
silencio.mp3:

ffmpeg -i silencio.mp3 -af detección de silencio = ruido = 0.0001 -f nulo -

silencio quitar
Elimina el silencio del principio, el medio o el final del audio.

El filtro acepta las siguientes opciones:

periodos_de_inicio
Este valor se usa para indicar si el audio debe recortarse al comienzo del audio. A
El valor cero indica que no se debe recortar ningún silencio desde el principio. Cuándo
al especificar un valor distinto de cero, recorta el audio hasta que no encuentra silencio. Normalmente,
al recortar el silencio desde el principio del audio, periodos_de_inicio será 1 pero puede
aumentarse a valores más altos para recortar todo el audio hasta un recuento específico de no silencio
períodos. El valor predeterminado es 0.

inicio_duración
Especifique la cantidad de tiempo que debe detectarse el no silencio antes de que deje de recortar
audio. Al aumentar la duración, las ráfagas de ruidos pueden tratarse como silencio y
cortado. El valor predeterminado es 0.

inicio_umbral
Esto indica qué valor de muestra debe tratarse como silencio. Para audio digital, un
El valor de 0 puede estar bien, pero para el audio grabado de forma analógica, es posible que desee aumentar
el valor para tener en cuenta el ruido de fondo. Puede especificarse en dB (en caso de que "dB" sea
añadido al valor especificado) o la relación de amplitud. El valor predeterminado es 0.

detener_períodos
Establezca el recuento para recortar el silencio desde el final del audio. Para quitar el silencio del
en medio de un archivo, especifique un detener_períodos eso es negativo. Este valor luego se trata
como un valor positivo y se utiliza para indicar que el efecto debe reiniciar el procesamiento como
especificado por periodos_de_inicio, haciéndolo adecuado para eliminar períodos de silencio en el
mitad del audio. El valor predeterminado es 0.

duración_detención
Especifique una duración de silencio que debe existir antes de que no se vuelva a copiar el audio. Por
especificando una duración mayor, se puede dejar el silencio que se desee en el audio.
El valor predeterminado es 0.

detener_umbral
Esto es lo mismo que inicio_umbral sino para recortar el silencio del final del audio.
Puede especificarse en dB (en caso de que se agregue "dB" al valor especificado) o amplitud
proporción. El valor predeterminado es 0.

dejar_silencio
Esto indica que duración_detención La longitud del audio debe dejarse intacta en el
comienzo de cada período de silencio. Por ejemplo, si desea eliminar pausas largas
entre palabras pero no quiero eliminar las pausas por completo. El valor predeterminado es 0.

Ejemplos

· El siguiente ejemplo muestra cómo se puede utilizar este filtro para iniciar una grabación que no
no contiene el retraso en el inicio que generalmente ocurre entre presionar el registro
botón y el inicio de la actuación:

quitar silencio = 1: 5: 0.02

triple
Aumente o reduzca las frecuencias agudas (superiores) del audio utilizando un filtro de estantería de dos polos con
una respuesta similar a la de los controles de tono de un equipo de alta fidelidad estándar. Esto también se conoce como
ecualización de estantería (EQ).

El filtro acepta las siguientes opciones:

ganancia, g
Proporcione la ganancia en el que sea menor de ~ 22 kHz y la frecuencia de Nyquist. Su
el rango útil es de aproximadamente -20 (para un corte grande) a +20 (para un gran impulso). Cuidado con
recorte cuando se usa una ganancia positiva.

frecuencia, f
Configure la frecuencia central del filtro y así se puede usar para extender o reducir la
rango de frecuencia para aumentar o reducir. El valor predeterminado es 3000 Hz.

ancho_tipo
Configure el método para especificar el ancho de banda del filtro.

h Hz

q Factor Q

o octava

s pendiente

anchura, w
Determine qué tan empinada es la transición de estante del filtro.

volumen
Ajusta el volumen del audio de entrada.

Acepta los siguientes parámetros:

volumen
Establecer la expresión del volumen de audio.

Los valores de salida se recortan al valor máximo.

El volumen de audio de salida viene dado por la relación:

= *

El valor predeterminado para volumen es "1.0".

precisión
Este parámetro representa la precisión matemática.

Determina qué formatos de muestra de entrada se permitirán, lo que afecta la precisión
de la escala de volumen.

fijas
Punto fijo de 8 bits; esto limita el formato de muestra de entrada a U8, S16 y S32.

flotar
Punto flotante de 32 bits; esto limita el formato de muestra de entrada a FLT. (defecto)

doble
Punto flotante de 64 bits; esto limita el formato de muestra de entrada a DBL.

volver a jugar
Elija el comportamiento al encontrar datos secundarios de ReplayGain en los marcos de entrada.

caer
Elimina los datos secundarios de ReplayGain, ignorando su contenido (predeterminado).

pasar por alto
Ignore los datos secundarios de ReplayGain, pero déjelos en el marco.

seguir
Prefiera la ganancia de pista, si está presente.

álbum
Prefiere la ganancia del álbum, si está presente.

replaygain_preamplificador
Ganancia de preamplificación en dB para aplicar a la ganancia de ganancia de reproducción seleccionada.

Valor predeterminado para replaygain_preamplificador es 0.0.

eval
Se establece cuando se evalúa la expresión de volumen.

Acepta los siguientes valores:

una vez
solo evalúe la expresión una vez durante la inicialización del filtro, o cuando el volumen
se envía el comando

marco
evaluar la expresión para cada fotograma entrante

El valor predeterminado es una vez.

La expresión de volumen puede contener los siguientes parámetros.

n número de fotograma (a partir de cero)

nb_canales
número de canales

nb_muestras_consumidas
número de muestras consumidas por el filtro

nb_muestras
número de muestras en el fotograma actual

pos posición del fotograma original en el archivo

pts marco PTS

tasa_de_muestra
frecuencia de muestreo

inicios
PTS al inicio de la transmisión

arrancar
tiempo al inicio de la transmisión

t pedazo de tiempo

tb base de tiempo de marca de tiempo

volumen
último valor de volumen establecido

Tenga en cuenta que cuando eval se establece a una vez sólo el tasa_de_muestra y tb las variables están disponibles,
todas las demás variables se evaluarán como NAN.

Comandos

Este filtro admite los siguientes comandos:

volumen
Modifica la expresión de volumen. El comando acepta la misma sintaxis del
opción correspondiente.

Si la expresión especificada no es válida, se mantiene en su valor actual.

replaygain_noclip
Evite el recorte limitando la ganancia aplicada.

Valor predeterminado para replaygain_noclip es 1.

Ejemplos

· Reducir a la mitad el volumen de audio de entrada:

volumen = volumen = 0.5
volumen = volumen = 1/2
volumen = volumen = -6.0206dB

En todo el ejemplo anterior, la clave nombrada para volumen se puede omitir, por ejemplo, como en:

volumen = 0.5

· Aumente la potencia de audio de entrada en 6 decibelios utilizando precisión de punto fijo:

volumen = volumen = 6dB: precisión = fijo

· Desvanece el volumen después del tiempo 10 con un período de aniquilación de 5 segundos:

volume='if(lt(t,10),1,max(1-(t-10)/5,0))':eval=frame

detectar volumen
Detecta el volumen del video de entrada.

El filtro no tiene parámetros. La entrada no se modifica. Las estadísticas sobre el volumen
se imprimirá en el registro cuando se alcance el final del flujo de entrada.

En particular, mostrará el volumen medio (raíz cuadrada media), el volumen máximo (en un
muestra), y el comienzo de un histograma de los valores de volumen registrados (desde el
valor máximo a un acumulado de 1/1000 de las muestras).

Todos los volúmenes están en decibelios en relación con el valor máximo de PCM.

Ejemplos

Aquí hay un extracto del resultado:

[Parsed_volumedetect_0 0xa23120] volumen_medio: -27 dB
[Parsed_volumedetect_0 0xa23120] volumen_máximo: -4 dB
[Análisis_volumendetect_0 0xa23120] histograma_4db: 6
[Análisis_volumendetect_0 0xa23120] histograma_5db: 62
[Análisis_volumendetect_0 0xa23120] histograma_6db: 286
[Análisis_volumendetect_0 0xa23120] histograma_7db: 1042
[Análisis_volumendetect_0 0xa23120] histograma_8db: 2551
[Análisis_volumendetect_0 0xa23120] histograma_9db: 4609
[Análisis_volumendetect_0 0xa23120] histograma_10db: 8409

Esto significa que:

· La energía cuadrática media es aproximadamente -27 dB, o 10 ^ -2.7.

· La muestra más grande está a -4 dB, o más precisamente entre -4 dB y -5 dB.

· Hay 6 muestras a -4 dB, 62 a -5 dB, 286 a -6 dB, etc.

En otras palabras, subir el volumen en +4 dB no provoca ningún recorte, subiéndolo en +5
dB causa recorte para 6 muestras, etc.

AUDIO FUENTES


A continuación se muestra una descripción de las fuentes de audio disponibles actualmente.

un amortiguador
Almacene los fotogramas de audio en búfer y póngalos a disposición de la cadena de filtros.

Esta fuente está destinada principalmente a un uso programático, en particular a través de la interfaz
definido en libavfilter / asrc_abuffer.h.

Acepta los siguientes parámetros:

base_tiempo
La base de tiempo que se utilizará para las marcas de tiempo de los fotogramas enviados. Debe ser
un número de coma flotante o en numerador/denominador .

tasa_de_muestra
La frecuencia de muestreo de los búferes de audio entrantes.

muestra_fmt
El formato de muestra de los búferes de audio entrantes. O un nombre de formato de muestra o su
correspondiente representación entera de la enumeración AVSampleFormat en
libavutil / samplefmt.h

disposición_del_canal
El diseño de canal de los búferes de audio entrantes. O un nombre de diseño de canal de
channel_layout_map en libavutil / channel_layout.c o su número entero correspondiente
representación de las macros AV_CH_LAYOUT_ * en libavutil / channel_layout.h

canales
El número de canales de los búferes de audio entrantes. Si ambos canales y
disposición_del_canal se especifican, entonces deben ser consistentes.

Ejemplos

abuffer = sample_rate = 44100: sample_fmt = s16p: channel_layout = stereo

indicará a la fuente que acepte estéreo plano firmado de 16 bits a 44100 Hz. Desde el
El formato de muestra con el nombre "s16p" corresponde al número 6 y al diseño del canal "estéreo"
corresponde al valor 0x3, esto equivale a:

abuffer = sample_rate = 44100: sample_fmt = 6: channel_layout = 0x3

aevalsrc
Genera una señal de audio especificada por una expresión.

Esta fuente acepta en la entrada una o más expresiones (una para cada canal), que son
evaluado y utilizado para generar una señal de audio correspondiente.

Esta fuente acepta las siguientes opciones:

exprés
Establezca la lista de expresiones separadas '|' para cada canal por separado. En caso de
disposición_del_canal opción no está especificada, el diseño del canal seleccionado depende de la
número de expresiones proporcionadas. De lo contrario, la última expresión especificada se aplica a
los canales de salida restantes.

disposición_del_canal, c
Configure el diseño del canal. El número de canales en el diseño especificado debe ser igual
al número de expresiones especificadas.

duración, d
Establezca la duración mínima del audio de origen. Ver las Horario duración . in las
utilidades ffmpeg(1) manual para la sintaxis aceptada. Tenga en cuenta que la duración resultante puede
ser mayor que la duración especificada, ya que el audio generado siempre se corta en el
final de un cuadro completo.

Si no se especifica, o la duración expresada es negativa, se supone que el audio es
generado para siempre.

nb_muestras, n
Establezca el número de muestras por canal por cada cuadro de salida, el valor predeterminado es 1024.

tasa_de_muestra, s
Especifique la frecuencia de muestreo, predeterminada en 44100.

Cada expresión en exprés puede contener las siguientes constantes:

n número de la muestra evaluada, comenzando desde 0

t tiempo de la muestra evaluada expresada en segundos, a partir de 0

s frecuencia de muestreo

Ejemplos

· Generar silencio:

aevalsrc = 0

· Genere una señal sin con frecuencia de 440 Hz, establezca la frecuencia de muestreo en 8000 Hz:

aevalsrc = "/ sin (440 * 2 * PI * t): s = 8000"

· Genere una señal de dos canales, especifique el diseño del canal (Centro delantero + trasero
Centro) explícitamente:

aevalsrc = "/ sin (420 * 2 * PI * t) | cos (430 * 2 * PI * t): c = FC | BC"

· Genera ruido blanco:

aevalsrc = "/ - 2+azar(0) "

· Genera una señal modulada en amplitud:

aevalsrc = "/ sin (10 * 2 * PI * t) * sin (880 * 2 * PI * t)"

· Genera ritmos binaurales de 2.5 Hz en una portadora de 360 ​​Hz:

aevalsrc="/0.1*sin(2*PI*(360-2.5/2)*t) | 0.1*sin(2*PI*(360+2.5/2)*t)"

anulasrc
La fuente de audio nula devuelve cuadros de audio sin procesar. Es principalmente útil como plantilla.
y para ser empleado en herramientas de análisis / depuración, o como fuente de filtros que
ignore los datos de entrada (por ejemplo, el filtro de sintetizador sox).

Esta fuente acepta las siguientes opciones:

disposición_del_canal, cl
Especifica el diseño del canal y puede ser un número entero o una cadena que representa un
diseño de canales. El valor predeterminado de disposición_del_canal es "estéreo".

Compruebe la definición de channel_layout_map en libavutil / channel_layout.c para el mapeo
entre cadenas y valores de diseño de canal.

tasa_de_muestra, r
Especifica la frecuencia de muestreo y el valor predeterminado es 44100.

nb_muestras, n
Establezca el número de muestras por fotogramas solicitados.

Ejemplos

· Establezca la frecuencia de muestreo en 48000 Hz y el diseño del canal en AV_CH_LAYOUT_MONO.

anullsrc = r = 48000: cl = 4

· Haz la misma operación con una sintaxis más obvia:

anullsrc = r = 48000: cl = mono

Todos los parámetros deben definirse explícitamente.

flite
Sintetice un enunciado de voz usando la biblioteca libflite.

Para habilitar la compilación de este filtro, debe configurar FFmpeg con
"--enable-libflite".

Tenga en cuenta que la biblioteca flite no es segura para subprocesos.

El filtro acepta las siguientes opciones:

lista_voces
Si se establece en 1, enumere los nombres de las voces disponibles y salga inmediatamente. Defecto
el valor es 0.

nb_muestras, n
Establezca el número máximo de muestras por fotograma. El valor predeterminado es 512.

Archivo de texto
Configure el nombre de archivo que contiene el texto para hablar.

texto
Configure el texto para que hable.

voz, v
Configure la voz que se utilizará para la síntesis de voz. El valor predeterminado es "kal". Ver también el
lista_voces .

Ejemplos

· Leer de archivo discurso.txty sintetizar el texto usando la voz flite estándar:

flite = archivo de texto = discurso.txt

· Leer el texto especificado seleccionando la voz "slt":

flite = text = 'Que te vaya bien, pobre diablo de Sub-Sub, de quien soy comentarista': voice = slt

· Introduzca texto en ffmpeg:

ffmpeg -f lavfi -i flite = text = 'Así que te vaya bien, pobre diablo de Sub-Sub, cuyo comentarista soy yo': voice = slt

· Fabricar ffplay decir el texto especificado, usando "flite" y el dispositivo "lavfi":

ffplay -f lavfi flite = text = 'No te entristezcas más por lo que has hecho.'

Para obtener más información sobre libflite, consulte:http://www.speech.cs.cmu.edu/flite/>

seno
Genere una señal de audio hecha de una onda sinusoidal con amplitud de 1/8.

La señal de audio es exacta en bits.

El filtro acepta las siguientes opciones:

frecuencia, f
Configure la frecuencia portadora. El valor predeterminado es 440 Hz.

pitido_factor, b
Habilite un pitido periódico cada segundo con frecuencia pitido_factor veces el portador
frecuencia. El valor predeterminado es 0, lo que significa que el pitido está desactivado.

tasa_de_muestra, r
Especifique la frecuencia de muestreo, la predeterminada es 44100.

duración, d
Especifique la duración de la transmisión de audio generada.

muestras_por_fotograma
Establezca el número de muestras por cuadro de salida, el valor predeterminado es 1024.

Ejemplos

· Genere una onda sinusoidal simple de 440 Hz:

seno

· Genere una onda sinusoidal de 220 Hz con un pitido de 880 Hz cada segundo, durante 5 segundos:

seno = 220: 4: d = 5
seno = f = 220: b = 4: d = 5
seno = frecuencia = 220: beep_factor = 4: duración = 5

AUDIO FREGADEROS


A continuación se muestra una descripción de los receptores de audio disponibles actualmente.

fregadero
Almacene los fotogramas de audio en búfer y póngalos a disposición hasta el final de la cadena de filtros.

Este receptor está diseñado principalmente para uso programático, en particular a través de la interfaz
definido en libavfilter / buffersink.h o el sistema de opciones.

Acepta un puntero a una estructura AVABufferSinkContext, que define la entrada
formatos de búfer, que se pasarán como parámetro opaco a "avfilter_init_filter" para
inicialización.

sumidero anulado
Disipador de audio nulo; no haga absolutamente nada con el audio de entrada. Es principalmente útil como
plantilla y para su uso en herramientas de análisis / depuración.

VIDEO FILTROS


Cuando configura su compilación FFmpeg, puede deshabilitar cualquiera de los filtros existentes usando
"--disable-filtros". La salida de configuración mostrará los filtros de video incluidos en su
construir.

A continuación se muestra una descripción de los filtros de video disponibles actualmente.

extracto alfa
Extraiga el componente alfa de la entrada como un video en escala de grises. Esto es especialmente útil
con el alfamerge filtrar.

alfamerge
Agregue o reemplace el componente alfa de la entrada principal con el valor de escala de grises de un
segunda entrada. Esto está diseñado para su uso con extracto alfa para permitir la transmisión o
almacenamiento de secuencias de cuadros que tienen alfa en un formato que no admite un alfa
canal.

Por ejemplo, para reconstruir fotogramas completos a partir de un video codificado en YUV normal y un
video creado con extracto alfa, puedes usar:

película = in_alpha.mkv [alpha]; [in] [alpha] alphamerge [out]

Dado que este filtro está diseñado para la reconstrucción, opera en secuencias de cuadros sin
teniendo en cuenta las marcas de tiempo, y termina cuando cualquiera de las entradas llega al final del flujo. Esta voluntad
causar problemas si su canalización de codificación pierde marcos. Si está intentando aplicar una imagen
como superposición a una transmisión de video, considere la superposición filtro en su lugar.

culo
Igual que el subtítulos filtro, excepto que no requiere libavcodec y libavformat para
trabajo. Por otro lado, está limitado a archivos de subtítulos ASS (Advanced Substation Alpha).

Este filtro acepta la siguiente opción además de las opciones comunes del
subtítulos filtro:

la formación
Configurar el motor de modelado

Los valores disponibles son:

auto
El motor de configuración de libass predeterminado, que es el mejor disponible.

simples
Modelador rápido, independiente de la fuente que solo puede hacer sustituciones

integraciones
Modelador más lento usando OpenType para sustituciones y posicionamiento

El valor predeterminado es "automático".

atadenoise
Aplique un Denoiser de promediado temporal adaptable a la entrada de video.

El filtro acepta las siguientes opciones:

0a Establezca el umbral A para el primer plano. El valor predeterminado es 1. El rango válido es de 0.02 a 0.

0b Establezca el umbral B para el primer plano. El valor predeterminado es 1. El rango válido es de 0.04 a 0.

1a Establezca el umbral A para el segundo plano. El valor predeterminado es 2. El rango válido es de 0.02 a 0.

1b Establezca el umbral B para el segundo plano. El valor predeterminado es 2. El rango válido es de 0.04 a 0.

2a Establezca el umbral A para el tercer plano. El valor predeterminado es 3. El rango válido es de 0.02 a 0.

2b Establezca el umbral B para el tercer plano. El valor predeterminado es 3. El rango válido es de 0.04 a 0.

El umbral A está diseñado para reaccionar ante cambios abruptos en la señal de entrada y el umbral B
está diseñado para reaccionar ante cambios continuos en la señal de entrada.

s Establecer el número de fotogramas que el filtro utilizará para promediar. El valor predeterminado es 33. Debe ser un número impar
en el rango [5, 129].

bbox
Calcule el cuadro delimitador para los píxeles no negros en el plano de luminancia del marco de entrada.

Este filtro calcula el cuadro delimitador que contiene todos los píxeles con un valor de luminancia
mayor que el valor mínimo permitido. Los parámetros que describen el cuadro delimitador son
impreso en el registro del filtro.

El filtro acepta la siguiente opción:

valor_mínimo
Establezca el valor mínimo de luminancia. El valor predeterminado es 16.

detección negra
Detecta intervalos de video que son (casi) completamente negros. Puede ser útil para detectar capítulos
transiciones, comerciales o grabaciones no válidas. Las líneas de salida contienen el tiempo para el
inicio, fin y duración del intervalo de negro detectado expresado en segundos.

Para mostrar las líneas de salida, debe establecer el nivel de registro al menos en el
Valor AV_LOG_INFO.

El filtro acepta las siguientes opciones:

duración_min_negro, d
Establezca la duración mínima del negro detectado expresada en segundos. Debe ser un no
número de coma flotante negativo.

El valor predeterminado es 2.0.

imagen_negro_ratio_th, foto_ésima
Establezca el umbral para considerar una imagen "negra". Exprese el valor mínimo para
el radio:

/

para lo cual una imagen se considera negra. El valor predeterminado es 0.98.

píxel_negro_th, pix_ésimo
Establezca el umbral para considerar un píxel "negro".

El umbral expresa el valor máximo de luminancia de píxeles para el que un píxel es
considerado "negro". El valor proporcionado se escala de acuerdo con la siguiente ecuación:

= + *

luminancia_rango_tamaño y valor_mínimo_luminancia Depende del formato de vídeo de entrada, el
el rango es [0-255] para formatos YUV de rango completo y [16-235] para YUV no rango completo
formatos.

El valor predeterminado es 0.10.

El siguiente ejemplo establece el umbral máximo de píxeles en el valor mínimo y detecta
solo intervalos negros de 2 o más segundos:

blackdetect = d = 2: pix_th = 0.00

marco negro
Detecta fotogramas que son (casi) completamente negros. Puede ser útil para detectar capítulos
transiciones o comerciales. Las lneas de salida consisten en el nmero de trama del detectado
fotograma, el porcentaje de oscuridad, la posición en el archivo si se conoce o -1 y el
marca de tiempo en segundos.

Para mostrar las líneas de salida, debe establecer el nivel de registro al menos en el
Valor AV_LOG_INFO.

Acepta los siguientes parámetros:

cantidad
El porcentaje de píxeles que deben estar por debajo del umbral; por defecto es 98.

umbral, trillar
El umbral por debajo del cual un valor de píxel se considera negro; por defecto es 32.

mezcla, mezcla
Combina dos fotogramas de video entre sí.

El filtro "blend" toma dos flujos de entrada y genera un flujo, la primera entrada es el
La capa "superior" y la segunda entrada es la capa "inferior". La salida termina cuando la entrada más corta
termina.

El filtro "tblend" (mezcla de tiempo) toma dos fotogramas consecutivos de una sola transmisión y
genera el resultado obtenido al combinar el nuevo marco con el anterior.

A continuación, se incluye una descripción de las opciones aceptadas.

c0_modo
c1_modo
c2_modo
c3_modo
todo_modo
Establezca el modo de fusión para un componente de píxel específico o todos los componentes de píxel en caso de
todo_modo. El valor predeterminado es "normal".

Los valores disponibles para los modos de componentes son:

adición
y
promedio
quemar
oscurecer
un cambio
diferencia128
dividir
esquivar
exclusión
brillo
luz dura
mezcla dura
aligerar
luz lineal
multiplicar
negación
normal
or
superposición
fénix
luz pin
reflejar
detectar
luz tenue
sustraer
viva luz
xor
c0_opacidad
c1_opacidad
c2_opacidad
c3_opacidad
toda_opacidad
Establezca la opacidad de la mezcla para un componente de píxel específico o todos los componentes de píxel en caso de
toda_opacidad. Solo se utiliza en combinación con los modos de fusión de componentes de píxeles.

c0_expr
c1_expr
c2_expr
c3_expr
toda_expr
Establezca la expresión de combinación para un componente de píxel específico o todos los componentes de píxel en caso de
toda_expr. Tenga en cuenta que las opciones de modo relacionadas se ignorarán si están configuradas.

Las expresiones pueden utilizar las siguientes variables:

N El número secuencial del fotograma filtrado, comenzando desde 0.

X
Y las coordenadas de la muestra actual

W
H el ancho y alto del plano actualmente filtrado

SW
SH Escala de ancho y alto según el plano filtrado actualmente. Es la razon
entre el número de píxeles del plano de luminancia correspondiente y los del plano actual.
Por ejemplo, para YUV4: 2: 0 los valores son "1,1" para el plano luma y "0.5,0.5" para
planos de croma.

T Tiempo del fotograma actual, expresado en segundos.

CIMA, A
Valor del componente de píxel en la ubicación actual para el primer fotograma de video (capa superior).

FONDO, B
Valor del componente de píxel en la ubicación actual para el segundo fotograma de video (parte inferior
capa).

más corto
Forzar la terminación cuando termina la entrada más corta. El valor predeterminado es 0. Esta opción es
solo definido para el filtro "mezcla".

repetir último
Continúe aplicando el último marco inferior después del final de la secuencia. Un valor de 0
deshabilite el filtro después de alcanzar el último fotograma de la capa inferior. El valor predeterminado es 1.
Esta opción solo está definida para el filtro "blend".

Ejemplos

· Aplicar la transición de la capa inferior a la capa superior en los primeros 10 segundos:

blend=all_expr='A*(if(gte(T,10),1,T/10))+B*(1-(if(gte(T,10),1,T/10)))'

· Aplicar efecto tablero de ajedrez 1x1:

blend = all_expr = 'if (eq (mod (X, 2), mod (Y, 2)), A, B)'

· Aplicar efecto descubierto a la izquierda:

blend = all_expr = 'if (gte (N * SW + X, W), A, B)'

· Aplicar efecto destaparse:

blend = all_expr = 'if (gte (YN * SH, 0), A, B)'

· Aplicar efecto destapar arriba a la izquierda:

blend = all_expr = 'if (gte (T * SH * 40 + Y, H) * gte ((T * 40 * SW + X) * W / H, W), A, B)'

· Mostrar diferencias entre el cuadro actual y el anterior:

tblend = all_mode = difference128

caja de desenfoque
Aplique un algoritmo boxblur al video de entrada.

Acepta los siguientes parámetros:

luma_radio, lr
luma_poder, lp
croma_radio, cr
croma_poder, cp
radio_alfa, ar
alfa_poder, ap

A continuación, se incluye una descripción de las opciones aceptadas.

luma_radio, lr
croma_radio, cr
radio_alfa, ar
Establezca una expresión para el radio del cuadro en píxeles utilizados para difuminar el correspondiente
plano de entrada.

El valor del radio debe ser un número no negativo y no debe ser mayor que el valor
de la expresión "min (w, h) / 2" para los planos luma y alpha, y de "min (cw, ch) / 2"
para los planos cromáticos.

Valor predeterminado para radio_luma es "2". Si no se especifica, croma_radio y radio_alfa
predeterminado al valor correspondiente establecido para radio_luma.

Las expresiones pueden contener las siguientes constantes:

w
h El ancho y alto de entrada en píxeles.

cw
ch El ancho y alto de la imagen cromática de entrada en píxeles.

hsub
vssub
Los valores de submuestra de croma horizontal y vertical. Por ejemplo, para el píxel
formato "yuv422p", hsub es 2 y vssub es 1.

luma_poder, lp
croma_poder, cp
alfa_poder, ap
Especifique cuántas veces se aplica el filtro de desenfoque de cuadro al plano correspondiente.

Valor predeterminado para luma_power es 2. Si no se especifica, croma_poder y poder_alfa
predeterminado al valor correspondiente establecido para luma_power.

Un valor de 0 desactivará el efecto.

Ejemplos

· Aplique un filtro de desenfoque de cuadro con el luma, el croma y los radios alfa establecidos en 2:

boxblur = luma_radius = 2: luma_power = 1
boxblur = 2: 1

· Establece el radio de luminancia en 2 y el radio de croma y alfa en 0:

boxblur = 2: 1: cr = 0: ar = 0

· Establezca los radios de luminancia y crominancia en una fracción de la dimensión del video:

boxblur = luma_radius = min (h \, w) / 10: luma_power = 1: chroma_radius = min (cw \, ch) / 10: chroma_power = 1

códecview
Visualice la información exportada por algunos códecs.

Algunos códecs pueden exportar información a través de marcos utilizando datos secundarios u otros medios. Para
Por ejemplo, algunos códecs basados ​​en MPEG exportan vectores de movimiento a través del exportar_mvs bandera en el
códec banderas2 .

El filtro acepta la siguiente opción:

mv Establecer vectores de movimiento para visualizar.

Banderas disponibles para mv son:

pf MVs previstos hacia adelante de fotogramas P

bf MVs previstos hacia adelante de fotogramas B

bb MVs previstos hacia atrás de fotogramas B

Ejemplos

· Visualiza MV multidireccionales de P y B-Frames usando ffplay:

ffplay -flags2 + export_mvs input.mpg -vf codecview = mv = pf + bf + bb

balance de color
Modifique la intensidad de los colores primarios (rojo, verde y azul) de los fotogramas de entrada.

El filtro permite ajustar un marco de entrada en las sombras, los medios tonos o las luces
regiones para el equilibrio rojo-cian, verde-magenta o azul-amarillo.

Un valor de ajuste positivo desplaza el balance hacia el color primario, un valor negativo
hacia el color complementario.

El filtro acepta las siguientes opciones:

rs
gs
bs Ajusta las sombras rojas, verdes y azules (píxeles más oscuros).

rm
gm
bm Ajuste los medios tonos rojos, verdes y azules (píxeles medios).

rh
gh
bh Ajuste las luces rojas, verdes y azules (píxeles más brillantes).

Los rangos permitidos para las opciones son "[-1.0, 1.0]". Los valores predeterminados son 0.

Ejemplos

· Añade un tinte de color rojo a las sombras:

balance de color = rs = .3

clave de color
Clave de color del espacio de color RGB.

El filtro acepta las siguientes opciones:

Color
El color que será reemplazado por transparencia.

semejanza
Porcentaje de similitud con el color clave.

0.01 coincide solo con el color de clave exacto, mientras que 1.0 coincide con todo.

mezclar
Porcentaje de mezcla.

0.0 hace que los píxeles sean completamente transparentes o no transparentes en absoluto.

Los valores más altos dan como resultado píxeles semitransparentes, con una mayor transparencia cuanto más
similar es el color de los píxeles al color clave.

Ejemplos

· Hacer transparente cada píxel verde de la imagen de entrada:

ffmpeg -i input.png -vf colorkey = green out.png

· Superponga un video en pantalla verde sobre una imagen de fondo estática.

ffmpeg -i background.png -i video.mp4 -filter_complex "[1: v] colorkey = 0x3BBD1E: 0.3: 0.2 [ckout]; [0: v] [ckout] overlay [out]" -map "[out]" output.flv

niveles de color
Ajuste los marcos de entrada de video usando niveles.

El filtro acepta las siguientes opciones:

Rimín
Gimin
bimín
apuntando
Ajuste el punto negro de entrada rojo, verde, azul y alfa. Los rangos permitidos para las opciones son
"[-1.0, 1.0]". Los valores predeterminados son 0.

rimax
gimax
bimax
aimax
Ajuste el punto blanco de entrada rojo, verde, azul y alfa. Los rangos permitidos para las opciones son
"[-1.0, 1.0]". Los valores predeterminados son 1.

Los niveles de entrada se utilizan para aclarar las altas luces (tonos brillantes), oscurecer las sombras (oscuras
tonos), cambia el equilibrio de tonos claros y oscuros.

Romin
gomín
bomin
aomin
Ajuste el punto negro de salida rojo, verde, azul y alfa. Los rangos permitidos para las opciones son
"[0, 1.0]". Los valores predeterminados son 0.

romax
gomax
bomax
aomax
Ajuste el punto blanco de salida rojo, verde, azul y alfa. Los rangos permitidos para las opciones son
"[0, 1.0]". Los valores predeterminados son 1.

Los niveles de salida permiten la selección manual de un rango de nivel de salida restringido.

Ejemplos

· Hacer la salida de video más oscura:

niveles de color = rimin = 0.058: gimin = 0.058: bimin = 0.058

· Aumentar contraste:

colorlevels=rimin=0.039:gimin=0.039:bimin=0.039:rimax=0.96:gimax=0.96:bimax=0.96

· Hacer la salida de video más liviana:

niveles de color = rimax = 0.902: gimax = 0.902: bimax = 0.902

· Incrementa el brillo:

niveles de color = romin = 0.5: gomin = 0.5: bomin = 0.5

mezclador de canales de color
Ajuste los fotogramas de entrada de video volviendo a mezclar los canales de color.

Este filtro modifica un canal de color agregando los valores asociados a los otros canales
de los mismos píxeles. Por ejemplo, si el valor a modificar es rojo, el valor de salida será:

= * + * + * + *

El filtro acepta las siguientes opciones:

rr
rg
rb
ra Ajuste la contribución de los canales de entrada rojo, verde, azul y alfa para la salida roja
canal. El valor predeterminado es 1 para rr, y 0 para rg, rb y ra.

gr
gg
gb
ga Ajuste la contribución de los canales de entrada rojo, verde, azul y alfa para la salida verde
canal. El valor predeterminado es 1 para gg, y 0 para gr, gb y ga.

br
bg
bb
ba Ajuste la contribución de los canales de entrada rojo, verde, azul y alfa para la salida azul
canal. El valor predeterminado es 1 para bb, y 0 para br, bg y ba.

ar
ag
ab
aa Ajuste la contribución de los canales de entrada rojo, verde, azul y alfa para la salida alfa
canal. El valor predeterminado es 1 para aa, y 0 para ar, ag y ab.

Los rangos permitidos para las opciones son "[-2.0, 2.0]".

Ejemplos

· Convertir fuente a escala de grises:

colorchannelmixer=.3:.4:.3:0:.3:.4:.3:0:.3:.4:.3

· Simula tonos sepia:

colorchannelmixer=.393:.769:.189:0:.349:.686:.168:0:.272:.534:.131

matriz de colores
Convertir matriz de color.

El filtro acepta las siguientes opciones:

src
dst Especifique la matriz de colores de origen y destino. Deben especificarse ambos valores.

Los valores aceptados son:

bt709
BT.709

bt601
BT.601

smpte240m
SMPTE-240M

fcc FCC

Por ejemplo, para convertir de BT.601 a SMPTE-240M, use el comando:

colormatrix = bt601: smpte240m

copia
Copie la fuente de entrada sin cambios a la salida. Esto es principalmente útil para realizar pruebas.

cultivo
Recorta el video de entrada a las dimensiones dadas.

Acepta los siguientes parámetros:

w, fuera_w
El ancho del video de salida. Su valor predeterminado es "iw". Esta expresión solo se evalúa
una vez durante la configuración del filtro, o cuando el w or fuera_w se envía el comando.

h, fuera_h
La altura del video de salida. Su valor predeterminado es "ih". Esta expresión se evalúa
sólo una vez durante la configuración del filtro, o cuando el h or fuera_h se envía el comando.

x La posición horizontal, en el video de entrada, del borde izquierdo del video de salida. Eso
por defecto es "(in_w-out_w) / 2". Esta expresión se evalúa por fotograma.

y La posición vertical, en el video de entrada, del borde superior del video de salida. Eso
por defecto es "(in_h-out_h) / 2". Esta expresión se evalúa por fotograma.

mantener_aspecto
Si se establece en 1, la relación de aspecto de la pantalla de salida será la misma que la de entrada, por
cambiar la relación de aspecto de la muestra de salida. Su valor predeterminado es 0.

El fuera_w, fuera_h, x, y Los parámetros son expresiones que contienen las siguientes constantes:

x
y Los valores calculados para x y y. Se evalúan para cada nuevo cuadro.

en W
en_h
El ancho y alto de entrada.

iw
ih Estos son los mismos que en W y en_h.

fuera_w
fuera_h
La salida (recortada) de ancho y alto.

ow
oh Estos son los mismos que fuera_w y fuera_h.

a mismo como iw / ih

sar relación de aspecto de muestra de entrada

Dar relación de aspecto de la pantalla de entrada, es la misma que (iw / ih) * sar

hsub
vssub
valores de submuestra de croma horizontal y vertical. Por ejemplo para el formato de píxeles
"yuv422p" hsub es 2 y vssub es 1.

n El número del marco de entrada, comenzando desde 0.

pos la posición en el archivo del marco de entrada, NAN si se desconoce

t La marca de tiempo expresada en segundos. Es NAN si se desconoce la marca de tiempo de entrada.

La expresión para fuera_w puede depender del valor de fuera_h, y la expresión para fuera_h
puede depender de fuera_w, pero no pueden depender de x y y, ya que x y y son evaluados después
fuera_w y fuera_h.

El x y y Los parámetros especifican las expresiones para la posición de la esquina superior izquierda de
el área de salida (no recortada). Se evalúan para cada cuadro. Si el valor evaluado
no es válido, se aproxima al valor válido más cercano.

La expresión para x puede depender de y, y la expresión para y puede depender de x.

Ejemplos

· Área de recorte con tamaño 100x100 en la posición (12,34).

cultivo = 100: 100: 12: 34

Usando opciones con nombre, el ejemplo anterior se convierte en:

cultivo = w = 100: h = 100: x = 12: y = 34

· Recorta el área de entrada central con tamaño 100x100:

cultivo = 100: 100

· Recorta el área de entrada central con un tamaño de 2/3 del video de entrada:

crop = 2/3 * in_w: 2/3 * in_h

· Recorta el cuadro central del video de entrada:

crop = out_w = in_h
crop = in_h

· Delimita el rectángulo con la esquina superior izquierda colocada en la posición 100: 100 y la
esquina inferior derecha correspondiente a la esquina inferior derecha de la imagen de entrada.

crop = in_w-100: in_h-100: 100: 100

· Recorta 10 píxeles de los bordes izquierdo y derecho y 20 píxeles de la parte superior e inferior
fronteras

crop = in_w-2 * 10: in_h-2 * 20

· Conserve solo el cuarto inferior derecho de la imagen de entrada:

crop = in_w / 2: in_h / 2: in_w / 2: in_h / 2

· Altura del cultivo para conseguir la armonía griega:

crop = in_w: 1 / PHI * in_w

· Aplicar efecto temblor:

crop=in_w/2:in_h/2:(in_w-out_w)/2+((in_w-out_w)/2)*sin(n/10):(in_h-out_h)/2 +((in_h-out_h)/2)*sin(n/7)

· Aplicar efecto de cámara errático según la marca de tiempo:

crop=in_w/2:in_h/2:(in_w-out_w)/2+((in_w-out_w)/2)*sin(t*10):(in_h-out_h)/2 +((in_h-out_h)/2)*sin(t*13)"

· Establecer x en función del valor de y:

crop=in_w/2:in_h/2:y:10+10*sin(n/10)

Comandos

Este filtro admite los siguientes comandos:

w, fuera_w
h, fuera_h
x
y Establezca el ancho / alto del video de salida y la posición horizontal / vertical en la entrada
video. El comando acepta la misma sintaxis de la opción correspondiente.

Si la expresión especificada no es válida, se mantiene en su valor actual.

cultivodetectar
Detecta automáticamente el tamaño del cultivo.

Calcula los parámetros de recorte necesarios e imprime los parámetros recomendados a través de
el sistema de registro. Las dimensiones detectadas corresponden al área no negra de la entrada.
vídeo.

Acepta los siguientes parámetros:

límitar
Establezca un umbral de valor de negro más alto, que se puede especificar opcionalmente desde nada (0)
a todo (255 para formatos basados ​​en 8 bits). Un valor de intensidad mayor al conjunto
el valor se considera no negro. El valor predeterminado es 24. También puede especificar un valor
entre 0.0 y 1.0, que se escalará dependiendo de la profundidad de bits del píxel
formato.

redondo
El valor por el cual el ancho / alto debe ser divisible. El valor predeterminado es 16. El desplazamiento
se ajusta automáticamente para centrar el video. Utilice 2 para obtener solo dimensiones uniformes
(necesario para video 4: 2: 2). 16 es mejor cuando se codifica en la mayoría de los códecs de video.

restablecer_cuenta, reajustar
Configure el contador que determina después de cuántos fotogramas cropdetect restablecerá el
detectado previamente el área de video más grande y comience de nuevo para detectar el óptimo actual
área de cultivo. El valor predeterminado es 0.

Esto puede resultar útil cuando los logotipos de los canales distorsionan el área de video. 0 indica 'nunca
reset ', y devuelve el área más grande encontrada durante la reproducción.

curvas
Aplicar ajustes de color mediante curvas.

Este filtro es similar a las herramientas de curvas de Adobe Photoshop y GIMP. Cada componente (rojo,
verde y azul) tiene sus valores definidos por N puntos clave unidos entre sí mediante un suave
curva. El eje x representa los valores de píxeles del cuadro de entrada y el eje y el nuevo
valores de píxeles que se establecerán para el cuadro de salida.

Por defecto, una curva componente se define por los dos puntos (0; 0) y (1; 1). Esto crea un
línea recta donde cada valor de píxel original se "ajusta" a su propio valor, lo que significa
sin cambios en la imagen.

El filtro le permite redefinir estos dos puntos y agregar algunos más. Una nueva curva (usando un
interpolación natural cúbica spline) se definirá para pasar sin problemas a través de todos estos nuevos
coordenadas. Los nuevos puntos definidos deben aumentar estrictamente sobre el eje x, y
su x y y los valores deben estar en el [0; 1] intervalo. Si las curvas calculadas fueran
fuera de los espacios vectoriales, los valores se recortarán en consecuencia.

Si no hay ningún punto clave definido en "x = 0", el filtro insertará automáticamente un (0; 0)
punto. De la misma forma, si no hay un punto clave definido en "x = 1", el filtro
insertar automáticamente un (1; 1) punto.

El filtro acepta las siguientes opciones:

preestablecido
Seleccione uno de los ajustes preestablecidos de color disponibles. Esta opción se puede utilizar además de
r, g, b parámetros; en este caso, las opciones posteriores tienen prioridad sobre el preajuste
valores. Los ajustes preestablecidos disponibles son:

ninguna
color_negativo
proceso cruzado
más oscuro
Aumentar contraste
encendedor
contraste_lineal
contraste_medio
negativas
fuerte_contraste
vendimia

El valor predeterminado es "ninguno".

dominar, m
Establezca los puntos de la llave maestra. Estos puntos definirán un mapeo de segundo paso. Está
a veces se denomina mapeo de "luminancia" o "valor". Se puede utilizar con r, g, b or todos
ya que actúa como una LUT de posprocesamiento.

rojo, r
Establezca los puntos clave para el componente rojo.

verde g
Establezca los puntos clave para el componente verde.

azul, b
Establezca los puntos clave para el componente azul.

todos Establezca los puntos clave para todos los componentes (sin incluir el maestro). Se puede utilizar además
a las otras opciones de componentes de puntos clave. En este caso, los componentes no armados
respaldo en esto todos ajuste.

archivo ps
Especifique un archivo de curvas de Photoshop (".asv") desde el que importar la configuración.

Para evitar algunos conflictos de sintaxis del gráfico de filtro, cada lista de puntos clave debe definirse utilizando
la siguiente sintaxis: "x0 / y0 x1 / y1 x2 / y2 ...".

Ejemplos

· Incrementa ligeramente el nivel medio de azul:

curvas = azul = '0.5 / 0.58'

· Efecto vintage:

curves=r='0/0.11 .42/.51 1/0.95':g='0.50/0.48':b='0/0.22 .49/.44 1/0.8'

Aquí obtenemos las siguientes coordenadas para cada componente:

rojo "(0;0.11) (0.42;0.51) (1;0.95)"

green
"(0;0) (0.50;0.48) (1;1)"

azul
"(0;0.22) (0.49;0.44) (1;0.80)"

· El ejemplo anterior también se puede lograr con el preset incorporado asociado:

curvas = preset = vintage

· O simplemente:

curvas = vintage

· Utilice un ajuste preestablecido de Photoshop y redefina los puntos del componente verde:

curves = psfile = 'MyCurvesPresets / purple.asv': verde = '0.45 / 0.53'

dctdnoiz
Elimine el ruido de los fotogramas utilizando DCT 2D (filtrado en el dominio de la frecuencia).

Este filtro no está diseñado para tiempo real.

El filtro acepta las siguientes opciones:

sigma, s
Establezca la constante sigma de ruido.

Este sigma define un umbral estricto de "3 * sigma"; cada coeficiente DCT (absoluto
valor) por debajo de este umbral se eliminará.

Si necesita un filtrado más avanzado, consulte expr.

El valor predeterminado es 0.

superposición
Establezca el número de píxeles superpuestos para cada bloque. Dado que el filtro puede ser lento, puede
quiere reducir este valor, a costa de un filtro menos eficaz y el riesgo de
varios artefactos.

Si el valor superpuesto no permite procesar todo el ancho o alto de entrada, un
Se mostrará una advertencia y los bordes correspondientes no se eliminarán de ruido.

El valor predeterminado es tamaño de bloque-1, que es el mejor ajuste posible.

expr, e
Establezca la expresión del factor de coeficiente.

Para cada coeficiente de un bloque DCT, esta expresión se evaluará como un multiplicador
valor del coeficiente.

Si esta opción está configurada, la sigma se ignorará la opción.

Se puede acceder al valor absoluto del coeficiente a través del c variable.

n Seleccione las tamaño de bloque utilizando el número de bits. "1 <n" define el tamaño de bloque, que es el
ancho y alto de los bloques procesados.

El valor predeterminado es 3 (8x8) y se puede elevar a 4 para agendar una tamaño de bloque de 16x16. Nota
que cambiar esta configuración tiene enormes consecuencias en la velocidad de procesamiento. También una
un tamaño de bloque más grande no significa necesariamente una mejor eliminación de ruido.

Ejemplos

Aplicar una eliminación de ruido con un sigma de 4.5:

dctdnoiz = 4.5

La misma operación se puede lograr usando el sistema de expresión:

dctdnoiz = e = 'gte (c, 4.5 * 3)'

Eliminación de ruido violenta con un tamaño de bloque de "16x16":

dctdnoiz = 15: n = 4

desbandar
Elimine los artefactos de bandas del video de entrada. Funciona reemplazando píxeles con bandas con
valor medio de los píxeles referenciados.

El filtro acepta las siguientes opciones:





Establezca el umbral de detección de bandas para cada plano. El valor predeterminado es 0.02. El rango válido es
0.00003 a 0.5. Si la diferencia entre el píxel actual y el píxel de referencia es menor que
umbral, se considerará con bandas.

rango, r
Rango de detección de bandas en píxeles. El valor predeterminado es 16. Si es positivo, el número aleatorio está dentro del rango.
Se utilizará 0 para establecer el valor. Si es negativo, se utilizará el valor absoluto exacto. El
el rango define un cuadrado de cuatro píxeles alrededor del píxel actual.

dirección, d
Establezca la dirección en radianes desde la que se compararán cuatro píxeles. Si es positivo, aleatorio
Se seleccionará la dirección de 0 a la dirección establecida. Si es negativo, exacto del valor absoluto
será elegido. Por ejemplo, la dirección 0, -PI o -2 * PI radianes seleccionará solo píxeles en
misma fila y -PI / 2 seleccionará solo píxeles en la misma columna.

mancha
Si está habilitado, el píxel actual se compara con el valor promedio de los cuatro circundantes
píxeles. El valor predeterminado está habilitado. Si el píxel actual desactivado se compara con los cuatro
píxeles circundantes. El píxel se considera con bandas si solo las cuatro diferencias con
los píxeles circundantes son inferiores al umbral.

diezmar
Elimina fotogramas duplicados a intervalos regulares.

El filtro acepta las siguientes opciones:

Cycle
Establezca el número de fotogramas de los que se eliminará uno. Estableciendo esto en N significa uno
marco en cada lote de N se eliminarán los fotogramas. El valor predeterminado es 5.

duthresh
Establezca el umbral para la detección de duplicados. Si la métrica de diferencia para un marco es
menor o igual a este valor, entonces se declara como duplicado. El valor predeterminado es 1.1

trillar
Establecer umbral de cambio de escena. El valor predeterminado es 15.

bloquex
blocky
Establezca el tamaño de los bloques de los ejes X e Y utilizados durante los cálculos métricos. Más grande
Los bloques proporcionan una mejor supresión de ruido, pero también dan una peor detección de pequeños
movimientos. Debe ser una potencia de dos. El valor predeterminado es 32.

ppsrc
Marque la entrada principal como una entrada preprocesada y active el flujo de entrada de fuente limpia. Esta
permite que la entrada se procese previamente con varios filtros para ayudar a las métricas
cálculo manteniendo la selección de fotogramas sin pérdidas. Cuando se establece en 1, el primer
flujo es para la entrada preprocesada, y el segundo flujo es la fuente limpia de
donde se eligen los marcos guardados. El valor predeterminado es 0.

croma
Establezca si el croma se considera o no en los cálculos métricos. El valor predeterminado es 1.

desinflar
Aplicar efecto desinflar al video.

Este filtro reemplaza el píxel por el local(3x3) promedio teniendo en cuenta solo
valores inferiores al píxel.

Acepta las siguientes opciones:

umbral0
umbral1
umbral2
umbral3
Limite el cambio máximo para cada plano, el valor predeterminado es 65535. Si es 0, el plano permanecerá
sin alterar.

desjudder
Elimina la vibración producida por contenido telecine parcialmente entrelazado.

Judder puede ser introducido, por ejemplo, por levantar filtrar. Si la fuente original fue
contenido parcialmente telecine, la salida de "pullup, dejudder" tendrá una variable
cuadros por segundo. Puede cambiar la velocidad de fotogramas grabada del contenedor. Aparte de ese cambio,
este filtro no afectará el video de velocidad de fotogramas constante.

La opción disponible en este filtro es:

Cycle
Especifique la longitud de la ventana sobre la que se repite la vibración.

Acepta cualquier número entero mayor que 1. Los valores útiles son:

4 Si el original fue telecineado de 24 a 30 fps (Película a NTSC).

5 Si el original fue telecineado de 25 a 30 fps (PAL a NTSC).

20 Si es una mezcla de los dos.

El valor predeterminado es 4.

delogo
Suprima el logotipo de una estación de televisión mediante una simple interpolación de los píxeles circundantes. Solo establezca un
rectángulo que cubre el logotipo y verlo desaparecer (y, a veces, algo aún más feo
aparecer - su kilometraje puede variar).

Acepta los siguientes parámetros:

x
y Especifique las coordenadas de la esquina superior izquierda del logotipo. Deben especificarse.

w
h Especifique el ancho y el alto del logotipo para borrar. Deben especificarse.

banda, t
Especifique el grosor del borde difuso del rectángulo (agregado a w y h). La
el valor predeterminado es 4.

Mostrar
Cuando se establece en 1, se dibuja un rectángulo verde en la pantalla para simplificar la búsqueda de la
x, y, wy h parámetros. El valor predeterminado es 0.

El rectángulo se dibuja en los píxeles más externos que serán (parcialmente) reemplazados con
valores interpolados. Los valores de los siguientes píxeles inmediatamente fuera de este rectángulo
en cada dirección se utilizará para calcular los valores de píxeles interpolados dentro de la
rectángulo.

Ejemplos

· Establecer un rectángulo que cubra el área con las coordenadas de la esquina superior izquierda 0,0 y el tamaño
100x77 y una banda de tamaño 10:

delogo=x=0:y=0:w=100:h=77:band=10

deshacerse
Intente corregir pequeños cambios en el desplazamiento horizontal y / o vertical. Este filtro ayuda a eliminar
movimiento de la cámara por sostener una cámara con la mano, golpear un trípode, moverse en un vehículo, etc.

El filtro acepta las siguientes opciones:

x
y
w
h Especifique un área rectangular donde limitar la búsqueda de vectores de movimiento. Si es deseado
la búsqueda de vectores de movimiento se puede limitar a un área rectangular del marco
definido por su esquina superior izquierda, ancho y alto. Estos parámetros tienen el mismo
es decir, como el filtro de caja de dibujo que se puede utilizar para visualizar la posición de la
cuadro delimitador.

Esto es útil cuando el movimiento simultáneo de sujetos dentro del encuadre puede ser
confundido con el movimiento de la cámara por la búsqueda de vectores de movimiento.

Si alguno o todos x, y, w y h se establecen en -1, entonces se utiliza el fotograma completo. Esto permite
opciones posteriores que se establecerán sin especificar el cuadro delimitador para el vector de movimiento
buscar.

Predeterminado: busca en todo el marco.

rx
ry Especifique la extensión máxima de movimiento en las direcciones xey en el rango de 0 a 64 píxeles.
Predeterminado 16.

Edge
Especifique cómo generar píxeles para rellenar los espacios en blanco en el borde del marco. Disponible
los valores son:

blanco, 0
Llene ceros en ubicaciones en blanco

original, 1
Imagen original en ubicaciones en blanco

abrazadera, 2
Valor de borde extruido en ubicaciones en blanco

espejo, 3
Borde reflejado en ubicaciones en blanco

El valor predeterminado es espejo.

tamaño de bloque
Especifique el tamaño de bloque que se utilizará para la búsqueda de movimiento. Rango 4-128 píxeles, predeterminado 8.

contraste
Especifique el umbral de contraste para bloques. Solo bloques con más de lo especificado
Se considerará el contraste (diferencia entre los píxeles más oscuros y más claros). Rango
1-255, predeterminado 125.

Buscar
Especifique la estrategia de búsqueda. Los valores disponibles son:

exhaustivo, 0
Establecer búsqueda exhaustiva

Menos, 1
Establezca una búsqueda menos exhaustiva.

El valor predeterminado es exhaustivo.

nombre de archivo
Si se establece, se escribe un registro detallado de la búsqueda de movimiento en el archivo especificado.

OpenCL
Si se establece en 1, especifique el uso de capacidades OpenCL, solo disponible si FFmpeg fue
configurado con "--enable-opencl". El valor predeterminado es 0.

detelecine
Aplicar un inverso exacto de la operación de telecine. Requiere un patrón predefinido
especificado utilizando la opción de patrón que debe ser el mismo que se pasó al telecine
filtrar.

Este filtro acepta las siguientes opciones:

primer_campo
parte superior, t
campo superior primero

fondo, b
campo inferior primero El valor predeterminado es "superior".

patrón
Una serie de números que representan el patrón desplegable que desea aplicar. El valor por defecto
el valor es 23.

marco_de_inicio
Un número que representa la posición del primer fotograma con respecto al telecine.
patrón. Esto se debe utilizar si se corta la corriente. El valor predeterminado es 0.

dilatación
Aplica efecto de dilatación al video.

Este filtro reemplaza el píxel por el local(3x3) máximo.

Acepta las siguientes opciones:

umbral0
umbral1
umbral2
umbral3
Limite el cambio máximo para cada plano, el valor predeterminado es 65535. Si es 0, el plano permanecerá
sin alterar.

coordenadas
Bandera que especifica el píxel al que hacer referencia. El valor predeterminado es 255, es decir, los ocho píxeles son
usado.

Banderas a mapas de coordenadas locales 3x3 como este:

1 2 3
4 5
6 7 8

caja de tiro
Dibuja un cuadro de color en la imagen de entrada.

Acepta los siguientes parámetros:

x
y Las expresiones que especifican las coordenadas de la esquina superior izquierda del cuadro. Es predeterminado
a 0.

anchura, w
altura, h
Las expresiones que especifican el ancho y alto de la caja; si 0 son
interpretado como el ancho y alto de entrada. Su valor predeterminado es 0.

color, c
Especifique el color del cuadro para escribir. Para conocer la sintaxis general de esta opción, marque
la sección "Color" del manual ffmpeg-utils. Si se utiliza el valor especial "invertir",
el color del borde del cuadro es el mismo que el del video con luma invertido.

grosor, t
La expresión que establece el grosor del borde del cuadro. El valor predeterminado es 3.

Consulte a continuación la lista de constantes aceptadas.

Los parámetros para x, y, w y h y t son expresiones que contienen las siguientes constantes:

Dar La relación de aspecto de la pantalla de entrada es la misma que (w / h) * sar.

hsub
vssub
valores de submuestra de croma horizontal y vertical. Por ejemplo para el formato de píxeles
"yuv422p" hsub es 2 y vssub es 1.

en_h, ih
en W, iw
El ancho y alto de entrada.

sar La relación de aspecto de la muestra de entrada.

x
y Las coordenadas de desplazamiento xey donde se dibuja el cuadro.

w
h El ancho y alto del cuadro dibujado.

t El grosor de la caja dibujada.

Estas constantes permiten x, y, w, h y t expresiones para referirse entre sí, por lo que
puede, por ejemplo, especificar "y = x / dar" o "h = w / dar".

Ejemplos

· Dibuja un cuadro negro alrededor del borde de la imagen de entrada:

caja de tiro

· Dibuja un recuadro con color rojo y una opacidad del 50%:

caja de dibujo = 10: 20: 200: 60:[email protected]

El ejemplo anterior se puede especificar como:

caja de dibujo = x = 10: y = 20: w = 200: h = 60: color =[email protected]

· Rellena la caja de color rosa:

caja de dibujo = x = 10: y = 10: w = 100: h = 100: color =[email protected]: t = max

· Dibuja una máscara roja 2: 2.40 de 1 píxeles:

drawbox=x=-t:y=0.5*(ih-iw/2.4)-t:w=iw+t*2:h=iw/2.4+t*2:t=2:c=red

dibujo gráfico dibujografo
Dibuje un gráfico utilizando metadatos de audio o video de entrada.

Acepta los siguientes parámetros:

m1 Establezca la clave de metadatos del primer marco a partir de la cual se utilizarán los valores de metadatos para dibujar un gráfico.

fg1 Establece la primera expresión de color de primer plano.

m2 Establezca la clave de metadatos del segundo marco a partir de la cual se utilizarán los valores de metadatos para dibujar un gráfico.

fg2 Establece la segunda expresión de color de primer plano.

m3 Establezca la clave de metadatos del tercer marco a partir de la cual se utilizarán los valores de metadatos para dibujar un gráfico.

fg3 Establece la tercera expresión de color de primer plano.

m4 Establezca la clave de metadatos del cuarto marco a partir de la cual se utilizarán los valores de metadatos para dibujar un gráfico.

fg4 Establezca la cuarta expresión de color de primer plano.

min Establecer el valor mínimo del valor de los metadatos.

max Establece el valor máximo del valor de los metadatos.

bg Establecer el color de fondo del gráfico. El valor predeterminado es el blanco.

modo
Establecer el modo gráfico.

Los valores disponibles para el modo son:

de caramelos
punto
línea

El valor predeterminado es "línea".

diapositiva
Establecer el modo de diapositiva.

Los valores disponibles para la diapositiva son:

marco
Dibuja un nuevo marco cuando se alcanza el borde derecho.

reemplazar
Reemplace las columnas antiguas por otras nuevas.

mover
Desplácese de derecha a izquierda.

desplazamiento
Desplácese de izquierda a derecha.

El valor predeterminado es "marco".

tamaño
Establecer el tamaño del video gráfico. Para conocer la sintaxis de esta opción, marque la casilla "Video Talla" .
in las utilidades ffmpeg manual. El valor predeterminado es "900x256".

Las expresiones de color de primer plano pueden utilizar las siguientes variables:

MIN Valor mínimo del valor de los metadatos.

MAX Valor máximo del valor de los metadatos.

VAL Valor actual de la clave de metadatos.

El color se define como 0xAABBGGRR.

Ejemplo usando metadatos de estadísticas de señales filtro:

signalstats, drawgraph = lavfi.signalstats.YAVG: min = 0: max = 255

Ejemplo usando metadatos de ebur128 filtro:

ebur128=metadata=1,adrawgraph=lavfi.r128.M:min=-120:max=5

rejilla
Dibuja una cuadrícula en la imagen de entrada.

Acepta los siguientes parámetros:

x
y Las expresiones que especifican las coordenadas de algún punto de intersección de la cuadrícula.
(destinado a configurar el desplazamiento). Ambos valores predeterminados son 0.

anchura, w
altura, h
Las expresiones que especifican el ancho y alto de la celda de la cuadrícula, si 0 son
interpretado como el ancho y el alto de entrada, respectivamente, menos "grosor", por lo que la imagen
se enmarca. Predeterminado a 0.

color, c
Especifique el color de la cuadrícula. Para conocer la sintaxis general de esta opción, marque la casilla
Sección "Color" en el manual ffmpeg-utils. Si se utiliza el valor especial "invertir", el
el color de la cuadrícula es el mismo que el del video con luma invertido.

grosor, t
La expresión que establece el grosor de la línea de la cuadrícula. El valor predeterminado es 1.

Consulte a continuación la lista de constantes aceptadas.

Los parámetros para x, y, w y h y t son expresiones que contienen las siguientes constantes:

Dar La relación de aspecto de la pantalla de entrada es la misma que (w / h) * sar.

hsub
vssub
valores de submuestra de croma horizontal y vertical. Por ejemplo para el formato de píxeles
"yuv422p" hsub es 2 y vssub es 1.

en_h, ih
en W, iw
El ancho y alto de la celda de la cuadrícula de entrada.

sar La relación de aspecto de la muestra de entrada.

x
y Las coordenadas xey de algún punto de intersección de la cuadrícula (destinado a configurar
compensar).

w
h El ancho y alto de la celda dibujada.

t El grosor de la celda dibujada.

Estas constantes permiten x, y, w, h y t expresiones para referirse entre sí, por lo que
puede, por ejemplo, especificar "y = x / dar" o "h = w / dar".

Ejemplos

· Dibuja una cuadrícula con celda 100x100 píxeles, grosor 2 píxeles, con color rojo y un
opacidad del 50%:

cuadrícula = ancho = 100: alto = 100: espesor = 2: color =[email protected]

· Dibuja una cuadrícula blanca de 3x3 con una opacidad del 50%:

cuadrícula = w = iw / 3: h = ih / 3: t = 2: c =[email protected]

dibujar texto
Dibuja una cadena de texto o texto de un archivo específico encima de un video, usando libfreetype
biblioteca.

Para habilitar la compilación de este filtro, debe configurar FFmpeg con
"--enable-libfreetype". Para habilitar la reserva de fuente predeterminada y la fuente opción que necesitas
configure FFmpeg con "--enable-libfontconfig". Para habilitar el forma_texto opción, tu
necesita configurar FFmpeg con "--enable-libfribidi".

Sintaxis

Acepta los siguientes parámetros:

box Se usa para dibujar un cuadro alrededor del texto usando el color de fondo. El valor debe ser 1
(habilitar) o 0 (deshabilitar). El valor predeterminado de box es 0.

borde de caja
Establezca el ancho del borde que se dibujará alrededor del cuadro usando color de caja. El valor por defecto
valor de borde de caja es 0.

color de caja
El color que se utilizará para dibujar el cuadro alrededor del texto. Para conocer la sintaxis de esta opción, marque
la sección "Color" del manual ffmpeg-utils.

El valor predeterminado de color de caja es blanco".

frontera
Establezca el ancho del borde que se dibujará alrededor del texto usando color del borde.
valor predeterminado de frontera es 0.

color del borde
Defina el color que se utilizará para dibujar el borde alrededor del texto. Para la sintaxis de este
opción, consulte la sección "Color" en el manual ffmpeg-utils.

El valor predeterminado de color del borde es negro".

expansión
Seleccione cómo texto se expande. Puede ser "none", "strftime" (obsoleto) o
"normal" (predeterminado). Ver el dibujartexto_expansión, Texto expansión sección a continuación para
Detalles.

fijar_límites
Si es verdadero, verifique y corrija las coordenadas de texto para evitar recortes.

color de fuente
El color que se utilizará para dibujar fuentes. Para conocer la sintaxis de esta opción, marque la casilla
Sección "Color" en el manual ffmpeg-utils.

El valor predeterminado de color de fuente es negro".

fuentecolor_expr
Cadena que se expande de la misma manera que texto para obtener dinámica color de fuente valor. Por
por defecto, esta opción tiene un valor vacío y no se procesa. Cuando se establece esta opción,
anula color de fuente .

fuente
La familia de fuentes que se utilizará para dibujar texto. Por defecto Sans.

archivo de fuentes
El archivo de fuente que se utilizará para dibujar texto. Debe incluirse la ruta. Este parámetro
es obligatorio si el soporte de fontconfig está desactivado.

dibujar
Esta opción no existe, consulte el sistema de línea de tiempo

alfa
Dibuja el texto aplicando fusión alfa. El valor puede ser un número entre 0.0
y 1.0 La expresión acepta las mismas variables x, y hacer. El valor predeterminado es 1.
Consulte fontcolor_expr

tamaño de fuente
El tamaño de fuente que se utilizará para dibujar texto. El valor predeterminado de tamaño de fuente es 16.

forma_texto
Si se establece en 1, intente dar forma al texto (por ejemplo, invierta el orden de derecha a
texto izquierdo y unir caracteres árabes) antes de dibujarlo. De lo contrario, simplemente dibuja el
texto exactamente como se indica. Por defecto 1 (si es compatible).

ft_load_flags
Las banderas que se utilizarán para cargar las fuentes.

Las banderas mapean las banderas correspondientes admitidas por libfreetype, y son una combinación
de los siguientes valores:

tu préstamo estudiantil
sin_escala
sin_insinuaciones
ceder
no_mapa de bits
disposición_vertical
fuerza_autohint
mapa de bits de cultivo
pedante
ignorar_global_advance_width
no_recurso
ignorar_transformar
monocromo
diseño_lineal
no_autohint

El valor predeterminado es "predeterminado".

Para obtener más información, consulte la documentación de los indicadores FT_LOAD_ * libfreetype.

sombra de color
El color que se utilizará para dibujar una sombra detrás del texto dibujado. Para la sintaxis de
esta opción, consulte la sección "Color" en el manual ffmpeg-utils.

El valor predeterminado de sombra de color es negro".

sombrax
vago
Los desplazamientos xey para la posición de la sombra del texto con respecto a la posición del
texto. Pueden ser valores positivos o negativos. El valor predeterminado para ambos es
"0".

número_inicio
El número de fotograma inicial para la variable n / frame_num. El valor predeterminado es "0".

tamaño de tabulación
El tamaño en número de espacios que se utilizará para representar la pestaña. El valor predeterminado es 4.

Código de tiempo
Establezca la representación del código de tiempo inicial en formato "hh: mm: ss [:;.] Ff". Puede ser usado
con o sin parámetro de texto. tasa_de_código_de_tiempo se debe especificar la opción.

código de tiempo_tasa, Velocidad, r
Establezca la velocidad de fotogramas del código de tiempo (solo código de tiempo).

texto
La cadena de texto que se dibujará. El texto debe ser una secuencia de caracteres codificados en UTF-8.
Este parámetro es obligatorio si no se especifica ningún archivo con el parámetro Archivo de texto.

Archivo de texto
Un archivo de texto que contiene el texto que se va a dibujar. El texto debe ser una secuencia codificada en UTF-8.
personajes.

Este parámetro es obligatorio si no se especifica una cadena de texto con el parámetro texto.

Si ambos texto y Archivo de texto se especifican, se lanza un error.

recargar
Si se establece en 1, el Archivo de texto se recargará antes de cada fotograma. Asegúrate de actualizarlo
atómicamente, o puede leerse parcialmente, o incluso fallar.

x
y Las expresiones que especifican las compensaciones donde se dibujará el texto dentro del video.
marco. Son relativos al borde superior / izquierdo de la imagen de salida.

El valor predeterminado de x y y es "0".

Consulte a continuación la lista de constantes y funciones aceptadas.

Los parámetros para x y y son expresiones que contienen las siguientes constantes y
funciones:

Dar relación de aspecto de la pantalla de entrada, es la misma que (w / h) * sar

hsub
vssub
valores de submuestra de croma horizontal y vertical. Por ejemplo para el formato de píxeles
"yuv422p" hsub es 2 y vssub es 1.

línea_h, lh
la altura de cada línea de texto

principal_h, h, H
la altura de entrada

principal_w, w, W
el ancho de entrada

max_glifo_a, ascenso
la distancia máxima desde la línea de base a la coordenada de cuadrícula más alta / superior utilizada para
coloque un punto de contorno de glifo, para todos los glifos renderizados. Es un valor positivo, debido
a la orientación de la cuadrícula con el eje Y hacia arriba.

max_glifo_d, descendencia
la distancia máxima desde la línea de base a la coordenada de cuadrícula más baja utilizada para colocar un
punto de contorno de glifo, para todos los glifos renderizados. Este es un valor negativo, debido a
la orientación de la cuadrícula, con el eje Y hacia arriba.

max_glifo_h
altura máxima de glifo, que es la altura máxima para todos los glifos contenidos en el
texto renderizado, es equivalente a ascenso - descendencia.

max_glifo_w
ancho máximo de glifo, que es el ancho máximo para todos los glifos contenidos en el
texto renderizado

n el número de fotogramas de entrada, comenzando desde 0

rand (mínimo, máx.)
devuelve un número aleatorio incluido entre min y max

sar La relación de aspecto de la muestra de entrada.

t marca de tiempo expresada en segundos, NAN si se desconoce la marca de tiempo de entrada

texto_h, th
la altura del texto renderizado

texto_w, tw
el ancho del texto renderizado

x
y las coordenadas de desplazamiento xey donde se dibuja el texto.

Estos parámetros permiten x y y expresiones para referirse entre sí, por lo que puede
ejemplo especifique "y = x / dar".

Texto expansión

If expansión está configurado en "strftime", el filtro reconoce strftime () secuencias en el
texto proporcionado y los amplía en consecuencia. Consulta la documentación de strftime (). Esto
la característica está en desuso.

If expansión se establece en "ninguno", el texto se imprime palabra por palabra.

If expansión está configurado en "normal" (que es el predeterminado), el siguiente mecanismo de expansión
se utiliza.

El carácter de barra invertida \, seguido de cualquier carácter, siempre se expande al segundo
carácter.

Se expande la secuencia de la forma "% {...}". El texto entre llaves es una función
nombre, posiblemente seguido de argumentos separados por ':'. Si los argumentos contienen especial
caracteres o delimitadores (':' o '}'), deben ser de escape.

Tenga en cuenta que probablemente también deban escaparse como el valor de la texto opción en el
cadena de argumento de filtro y como argumento de filtro en la descripción del gráfico de filtro, y
posiblemente también para el caparazón, que hace hasta cuatro niveles de escape; usando un archivo de texto
evita estos problemas.

Están disponibles las siguientes funciones:

expr, e
El resultado de la evaluación de la expresión.

Debe tomar un argumento que especifique la expresión a evaluar, que acepta la
mismas constantes y funciones que el x y y valores. Tenga en cuenta que no todas las constantes deben
ser utilizado, por ejemplo, el tamaño del texto no se conoce al evaluar la expresión, por lo que el
constante texto_w y texto_h tendrá un valor indefinido.

expr_int_formato, eif
Evalúe el valor y la salida de la expresión como un entero formateado.

El primer argumento es la expresión a evaluar, al igual que para el expr función.
El segundo argumento especifica el formato de salida. Los valores permitidos son x, X, d y u.
Se tratan exactamente como en la función "printf". El tercer parámetro es opcional
y establece el número de posiciones tomadas por la salida. Se puede usar para agregar relleno.
con ceros desde la izquierda.

tiempo gm
La hora a la que se está ejecutando el filtro, expresada en UTC. Puede aceptar un argumento:
a strftime () cadena de formato.

hora local
La hora a la que se está ejecutando el filtro, expresada en la zona horaria local. Puede
aceptar un argumento: a strftime () cadena de formato.

metadatos
Metadatos de marco. Debe tomar un argumento que especifique la clave de metadatos.

n, núm_cuadro
El número de fotograma, comenzando desde 0.

tipo_pict
Una descripción de 1 carácter del tipo de imagen actual.

pts La marca de tiempo del fotograma actual. Puede llevar hasta dos argumentos.

El primer argumento es el formato de la marca de tiempo; por defecto es "flt" durante segundos como
un número decimal con precisión de microsegundos; "hms" significa un formato
[-] HH: MM: SS.mmm marca de tiempo con precisión de milisegundos.

El segundo argumento es un desplazamiento agregado a la marca de tiempo.

Ejemplos

· Dibuja "Texto de prueba" con la fuente FreeSerif, usando los valores predeterminados para el opcional
parámetros.

drawtext = "fontfile = / usr / share / fonts / truetype / freefont / FreeSerif.ttf: text = 'Texto de prueba'"

· Dibuje 'Texto de prueba' con fuente FreeSerif de tamaño 24 en la posición x = 100 ey = 50 (contando
desde la esquina superior izquierda de la pantalla), el texto es amarillo con un cuadro rojo alrededor. Ambos
el texto y el cuadro tienen una opacidad del 20%.

drawtext = "fontfile = / usr / share / fonts / truetype / freefont / FreeSerif.ttf: text = 'Texto de prueba': \
x = 100: y = 50: tamaño de fuente = 24: color de fuente =[email protected]: caja = 1: cajacolor =[email protected]"

Tenga en cuenta que las comillas dobles no son necesarias si no se utilizan espacios dentro del
lista de parámetros.

· Muestra el texto en el centro del cuadro de video:

drawtext = "tamaño de fuente = 30: archivo de fuente = FreeSerif.ttf: texto = 'hola mundo': x = (w-text_w) / 2: y = (h-text_h) / 2"

· Muestra una línea de texto que se desliza de derecha a izquierda en la última fila del cuadro de video. El
presentar LINEA LARGA se supone que contiene una sola línea sin nuevas líneas.

drawtext = "fontsize = 15: fontfile = FreeSerif.ttf: text = LONG_LINE: y = h-line_h: x = -50 * t"

· Muestra el contenido del archivo CRÉDITOS fuera de la parte inferior del marco y desplácese hacia arriba.

drawtext = "tamaño de fuente = 20: archivo de fuente = FreeSerif.ttf: archivo de texto = CRÉDITOS: y = h-20 * t"

· Dibuja una sola letra verde "g", en el centro del video de entrada. La línea de base del glifo
se coloca a media altura de la pantalla.

drawtext = "tamaño de fuente = 60: archivo de fuente = FreeSerif.ttf: color de fuente = verde: texto = g: x = (w-max_glyph_w) / 2: y = h / 2-ascenso"

· Mostrar texto durante 1 segundo cada 3 segundos:

drawtext = "fontfile = FreeSerif.ttf: fontcolor = white: x = 100: y = x / dar: enable = lt (mod (t \, 3) \, 1): text = 'blink'"

· Utilice fontconfig para establecer la fuente. Tenga en cuenta que es necesario escapar de los dos puntos.

drawtext = 'fontfile = Linux Libertine O-40 \: style = Semibold: text = FFmpeg'

· Imprime la fecha de una codificación en tiempo real (ver Strftime(3)):

drawtext = 'fontfile = FreeSans.ttf: text =% {localtime \:% a% b% d% Y}'

· Mostrar texto que aparece y desaparece (aparece / desaparece):

#!/ Bin / sh
DS = 1.0 # inicio de visualización
DE = 10.0 # final de la pantalla
FID = 1.5 # desvanecimiento en duración
FOD = 5 # duración del desvanecimiento
ffplay -f lavfi "color, drawtext = text = TEST: fontsize = 50: fontfile = FreeSerif.ttf: fontcolor_expr = ff0000% {eif \\\\: clip (255 * (1 * entre (t \\, $ DS + $ FID \\, $ DE - $ FOD) + ((t - $ DS) / $ FID) * entre (t \\, $ DS \\, $ DS + $ FID) + (- (t - $ DE) / $ FOD) * entre (t \\, $ DE - $ FOD \\, $ DE)) \\, 0 \\, 255) \\\\: x \\\\: 2} "

Para obtener más información sobre libfreetype, consulte:http://www.freetype.org/>.

Para obtener más información sobre fontconfig, consulte:
<http://freedesktop.org/software/fontconfig/fontconfig-user.html>.

Para obtener más información sobre libfribidi, consulte:http://fribidi.org/>.

detección de bordes
Detecta y dibuja bordes. El filtro utiliza el algoritmo Canny Edge Detection.

El filtro acepta las siguientes opciones:

bajo
high
Establezca los valores de umbral bajo y alto que utiliza el algoritmo de umbral de Canny.

El umbral alto selecciona los píxeles de borde "fuertes", que luego se conectan a través de
8-conectividad con los píxeles de borde "débiles" seleccionados por el umbral bajo.

bajo y high los valores de umbral deben elegirse en el rango [0,1], y bajo debiera ser
menor o igual a high.

Valor predeterminado para bajo es "20/255" y el valor predeterminado para high es "50/255".

modo
Defina el modo de dibujo.

alambres
Dibuja cables blancos / grises sobre fondo negro.

mezcla de colores
Mezcle los colores para crear un efecto de pintura / dibujos animados.

El valor predeterminado es alambres.

Ejemplos

· Detección de bordes estándar con valores personalizados para el umbral de histéresis:

edgedetect = bajo = 0.1: alto = 0.4

· Efecto de pintura sin umbral:

edgedetect = modo = mezcla de colores: alto = 0

eq
Configure el brillo, el contraste, la saturación y el ajuste de gamma aproximado.

El filtro acepta las siguientes opciones:

contraste
Establece la expresión de contraste. El valor debe ser un valor flotante en el rango "-2.0" a 2.0.
El valor predeterminado es "0".

brillo
Establece la expresión de brillo. El valor debe ser un valor flotante en el rango de "-1.0" a 1.0.
El valor predeterminado es "0".

saturación
Establece la expresión de saturación. El valor debe ser un valor flotante en el rango de 0.0 a 3.0. El
el valor predeterminado es "1".

gama
Establezca la expresión gamma. El valor debe ser un valor flotante en el rango de 0.1 a 10.0. El valor por defecto
el valor es "1".

gamma_r
Establezca la expresión gamma para el rojo. El valor debe ser un valor flotante en el rango de 0.1 a 10.0. El
el valor predeterminado es "1".

gamma_g
Establezca la expresión gamma para el verde. El valor debe ser un valor flotante en el rango de 0.1 a 10.0.
El valor predeterminado es "1".

gamma_b
Establezca la expresión gamma para el azul. El valor debe ser un valor flotante en el rango de 0.1 a 10.0. El
el valor predeterminado es "1".

peso_gamma
Establezca la expresión de peso gamma. Se puede utilizar para reducir el efecto de una gama alta.
valor en áreas de imagen brillante, por ejemplo, evitar que se amplifiquen demasiado y simplemente
blanco. El valor debe ser un valor flotante en el rango de 0.0 a 1.0. Un valor de 0.0 convierte la gamma
corrección hasta el final, mientras que 1.0 lo deja con toda su fuerza. El valor predeterminado es "1".

eval
Establecer cuándo las expresiones de brillo, contraste, saturación y gamma
son evaluados.

Acepta los siguientes valores:

init
solo evalúa expresiones una vez durante la inicialización del filtro o cuando un comando
es procesado

marco
evaluar expresiones para cada marco entrante

El valor predeterminado es init.

Las expresiones aceptan los siguientes parámetros:

n recuento de fotogramas del fotograma de entrada a partir de 0

pos posición del byte del paquete correspondiente en el archivo de entrada, NAN si no se especifica

r velocidad de fotogramas del vídeo de entrada, NAN si se desconoce la velocidad de fotogramas de entrada

t marca de tiempo expresada en segundos, NAN si se desconoce la marca de tiempo de entrada

Comandos

El filtro admite los siguientes comandos:

contraste
Establece la expresión de contraste.

brillo
Establece la expresión de brillo.

saturación
Establece la expresión de saturación.

gama
Establezca la expresión gamma.

gamma_r
Establezca la expresión gamma_r.

gamma_g
Establecer expresión gamma_g.

gamma_b
Establecer expresión gamma_b.

peso_gamma
Establece la expresión gamma_weight.

El comando acepta la misma sintaxis de la opción correspondiente.

Si la expresión especificada no es válida, se mantiene en su valor actual.

erosión
Aplica efecto de erosión al video.

Este filtro reemplaza el píxel por el local(3x3) mínimo.

Acepta las siguientes opciones:

umbral0
umbral1
umbral2
umbral3
Limite el cambio máximo para cada plano, el valor predeterminado es 65535. Si es 0, el plano permanecerá
sin alterar.

coordenadas
Bandera que especifica el píxel al que hacer referencia. El valor predeterminado es 255, es decir, los ocho píxeles son
usado.

Banderas a mapas de coordenadas locales 3x3 como este:

1 2 3
4 5
6 7 8

aviones de extracción
Extraiga los componentes del canal de color del flujo de vídeo de entrada en un vídeo en escala de grises independiente
arroyos.

El filtro acepta la siguiente opción:

planos
Establecer plano (s) para extraer.

Los valores disponibles para aviones son:

y
u
v
a
r
g
b

La elección de planos no disponibles en la entrada resultará en un error. Eso significa tu
no se pueden seleccionar planos "r", "g", "b" con planos "y", "u", "v" al mismo tiempo.

Ejemplos

· Extrae el componente de canal de color luma, uyv del fotograma de vídeo de entrada en 3 escalas de grises
salidas:

ffmpeg -i video.avi -filter_complex 'extractplanes = y + u + v [y] [u] [v]' -map '[y]' y.avi -map '[u]' u.avi -map '[ v] 'v.avi

elbg
Aplique un efecto de posterización utilizando el algoritmo ELBG (Enhanced LBG).

Para cada imagen de entrada, el filtro calculará el mapeo óptimo de la entrada a la
salida dada la longitud del libro de códigos, que es el número de colores de salida distintos.

Este filtro acepta las siguientes opciones.

longitud_del libro de códigos, l
Establecer la longitud del libro de códigos. El valor debe ser un entero positivo y representa el número
de distintos colores de salida. El valor predeterminado es 256.

nb_pasos, n
Establezca el número máximo de iteraciones que se aplicarán para calcular el mapeo óptimo. El
cuanto mayor sea el valor, mejor será el resultado y mayor será el tiempo de cálculo. Defecto
el valor es 1.

semilla, s
Establezca una semilla aleatoria, debe ser un número entero incluido entre 0 y UINT32_MAX. Que no
especificado, o si se establece explícitamente en -1, el filtro intentará utilizar una buena semilla aleatoria
sobre la base del mejor esfuerzo.

pal8
Establece el formato de píxeles de salida de pal8. Esta opción no funciona con una longitud de libro de códigos mayor
que 256.

se desvanecen
Aplique un efecto de aparición / desaparición gradual al video de entrada.

Acepta los siguientes parámetros:

tipo, t
El tipo de efecto puede ser "in" para un fundido de entrada o "out" para un efecto de fundido de salida.
El valor predeterminado es "en".

marco_de_inicio, s
Especifique el número del fotograma en el que comenzar a aplicar el efecto de desvanecimiento. El valor predeterminado es 0.

nb_frames, n
El número de fotogramas que dura el efecto de desvanecimiento. Al final del efecto de aparición gradual, el
El video de salida tendrá la misma intensidad que el video de entrada. Al final del desvanecimiento
transición de salida, el vídeo de salida se rellenará con el seleccionado Color. El valor predeterminado es
25.

alfa
Si se establece en 1, se desvanece solo el canal alfa, si existe uno en la entrada. El valor predeterminado es 0.

hora de inicio, st
Especifique la marca de tiempo (en segundos) del fotograma para comenzar a aplicar el efecto de desvanecimiento. Si
se especifican tanto start_frame como start_time, el desvanecimiento comenzará en lo que ocurra
ultimo. El valor predeterminado es 0.

duración, d
La cantidad de segundos que debe durar el efecto de desvanecimiento. Al final del fade-in
efecto, el video de salida tendrá la misma intensidad que el video de entrada, al final de
la transición de desvanecimiento el vídeo de salida se rellenará con el seleccionado Color. Si
se especifican tanto la duración como nb_frames, se utiliza la duración. El valor predeterminado es 0 (nb_frames
se utiliza de forma predeterminada).

color, c
Especifique el color del fundido. El valor predeterminado es "negro".

Ejemplos

· Se desvanecen en los primeros 30 fotogramas de video:

fade = in: 0:30

El comando anterior es equivalente a:

desvanecimiento = t = en: s = 0: n = 30

· Desvanece los últimos 45 fotogramas de un video de 200 fotogramas:

desvanecimiento = salida: 155: 45
fade = type = out: start_frame = 155: nb_frames = 45

· Desvanece los primeros 25 fotogramas y desaparece los últimos 25 fotogramas de un video de 1000 fotogramas:

fade = in: 0: 25, fade = out: 975: 25

· Haz que los primeros 5 fotogramas sean amarillos, luego difumina desde el fotograma 5-24:

fundido = en: 5: 20: color = amarillo

· Se desvanece en alfa sobre los primeros 25 fotogramas de video:

fade = in: 0: 25: alpha = 1

· Hace que los primeros 5.5 segundos sean negros, luego se desvanecen durante 0.5 segundos:

desvanecimiento = t = en: st = 5.5: d = 0.5

filtrar
Aplicar expresiones arbitrarias a muestras en el dominio de la frecuencia

dc_Y
Ajuste el valor de CC (ganancia) del plano de luminancia de la imagen. El filtro acepta un
valor entero en el rango de 0 a 1000. El valor predeterminado se establece en 0.

dc_u
Ajuste el valor dc (ganancia) del primer plano cromático de la imagen. El filtro acepta un
valor entero en el rango de 0 a 1000. El valor predeterminado se establece en 0.

CC_V
Ajuste el valor de CC (ganancia) del segundo plano cromático de la imagen. El filtro acepta un
valor entero en el rango de 0 a 1000. El valor predeterminado se establece en 0.

pesado
Establezca la expresión de ponderación en el dominio de la frecuencia para el plano de luminancia.

peso_U
Establezca la expresión de ponderación en el dominio de la frecuencia para el primer plano cromático.

peso_V
Establezca la expresión de ponderación en el dominio de la frecuencia para el segundo plano cromático.

El filtro acepta las siguientes variables:

X
Y Las coordenadas de la muestra actual.

W
H El ancho y alto de la imagen.

Ejemplos

· Paso alto:

fftfilt = dc_Y = 128: weight_Y = 'aplastar (1- (Y + X) / 100)'

· Paso bajo:

fftfilt = dc_Y = 0: weight_Y = 'aplastar ((Y + X) / 100-1)'

· Afilar:

fftfilt = dc_Y = 0: weight_Y = '1 + squish (1- (Y + X) / 100)'

campo
Extraiga un solo campo de una imagen entrelazada utilizando la aritmética de zancadas para evitar el desperdicio
Tiempo de CPU. Los fotogramas de salida se marcan como no entrelazados.

El filtro acepta las siguientes opciones:

tipo
Especifique si extraer el campo superior (si el valor es 0 o "superior") o el campo inferior
(si el valor es 1 o "inferior").

campo
Filtro de coincidencia de campo para telecine inverso. Está destinado a reconstruir el progresivo
fotogramas de una secuencia telecine. El filtro no elimina fotogramas duplicados, por lo que para lograr
un telecine inverso completo "fieldmatch" debe ir seguido de un filtro de diezmado como
as diezmar en el gráfico de filtros.

La separación de la coincidencia de campos y la aniquilación está motivada notablemente por la
posibilidad de insertar un filtro desentrelazado de retorno entre los dos. Si la fuente
tiene contenido entrelazado real y telecine mixto, "fieldmatch" no podrá coincidir
campos para las partes entrelazadas. Pero estos marcos peinados restantes se marcarán como
entrelazado, y por lo tanto puede ser desentrelazado por un filtro posterior como yadif antes
ejecución.

Además de las diversas opciones de configuración, "fieldmatch" puede tomar un segundo opcional
corriente, activada a través del ppsrc opción. Si está habilitada, la reconstrucción de las tramas será
basado en los campos y cuadros de este segundo flujo. Esto permite que la primera entrada sea
preprocesado para ayudar a los diversos algoritmos del filtro, manteniendo el
salida sin pérdidas (suponiendo que los campos coincidan correctamente). Normalmente, un campo consciente
eliminar el ruido o los ajustes de brillo / contraste pueden ayudar.

Tenga en cuenta que este filtro utiliza los mismos algoritmos que TIVTC / TFM (proyecto AviSynth) y
VIVTC / VFM (proyecto VapourSynth). El último es un clon ligero de TFM del que "fieldmatch"
está basado en. Si bien la semántica y el uso están muy cerca, algunos nombres de opciones y comportamientos
puede diferir.

El diezmar Actualmente, el filtro solo funciona para una entrada de velocidad de fotogramas constante. Si su entrada tiene
contenido telecine mixto (30 fps) y progresivo con una velocidad de fotogramas más baja, como 24 fps, utiliza el
siguiente cadena de filtros para producir el flujo cfr necesario:
"dejudder, fps = 30000/1001, fieldmatch, diezmar".

El filtro acepta las siguientes opciones:

solicite
Especifique el orden de campo asumido del flujo de entrada. Los valores disponibles son:

auto
Detecta automáticamente la paridad (usa el valor de paridad interno de FFmpeg).

bff Suponga primero el campo inferior.

tff Suponga primero el campo superior.

Tenga en cuenta que a veces se recomienda no confiar en la paridad anunciada por la transmisión.

El valor predeterminado es auto.

modo
Establezca el modo o la estrategia de coincidencia que se utilizará. pc El modo es el más seguro en el sentido de que
no se arriesgará a crear sacudidas debido a fotogramas duplicados cuando sea posible, pero si hay
ediciones incorrectas o campos combinados, terminará generando fotogramas combinados cuando una buena coincidencia
realmente podría existir. Por otro lado, pcn_ub El modo es el más arriesgado en términos de
creando sacudidas, pero casi siempre encontrará un buen encuadre si lo hay. El
otros valores están todos en algún punto intermedio pc y pcn_ub en términos de riesgo de sacudidas
y crear fotogramas duplicados en lugar de encontrar buenas coincidencias en secciones con ediciones incorrectas,
campos huérfanos, campos mixtos, etc.

Más detalles sobre p / c / n / u / b están disponibles en p / c / n / u / b sentido .

Los valores disponibles son:

pc Emparejamiento bidireccional (p / c)

pc_n
Emparejamiento bidireccional y prueba del tercer emparejamiento si aún está peinado (p / c + n)

pc_u
Emparejamiento bidireccional y prueba del tercer emparejamiento (mismo orden) si aún está peinado (p / c + u)

pc_n_ub
Emparejamiento bidireccional, probando el tercer partido si todavía está peinado, y probando el cuarto / quinto partido si
todavía peinado (p / c + n + u / b)

pCN Coincidencia de 3 vías (p / c / n)

pcn_ub
Emparejamiento de 3 vías, y probando partidos 4º / 5º si los 3 partidos originales son
detectado como peinado (p / c / n + u / b)

Los paréntesis al final indican las coincidencias que se usarían para ese modo.
asumiendo solicite=tff (y campo on auto or parte superior).

En términos de velocidad pc El modo es, con mucho, el más rápido y pcn_ub es el más lento.

El valor predeterminado es pc_n.

ppsrc
Marque el flujo de entrada principal como una entrada preprocesada y habilite la entrada secundaria
stream como la fuente limpia para recoger los campos. Consulte la introducción al filtro para
más detalles. Es similar al clip2 característica de VFM / TFM.

El valor predeterminado es 0 (deshabilitado).

campo
Configure el campo para que coincida. Se recomienda establecer esto en el mismo valor que solicite
a menos que experimente fallas coincidentes con esa configuración. En ciertas circunstancias
cambiar el campo que se utiliza para hacer coincidir puede tener un gran impacto en la coincidencia
rendimiento. Los valores disponibles son:

auto
Automático (mismo valor que solicite).

fondo
Coincidir desde el campo inferior.

parte superior Coincidir desde el campo superior.

El valor predeterminado es auto.

mcroma
Establezca si se incluye o no el croma durante las comparaciones de coincidencias. En la mayoría de los casos
Se recomienda dejar esto habilitado. Debe establecer esto en 0 solo si su clip tiene
Problemas de croma incorrectos, como arco iris intenso u otros artefactos. Establecer esto en 0
también podría usarse para acelerar las cosas a costa de cierta precisión.

El valor predeterminado es 1.

y0
y1 Estos definen una banda de exclusión que excluye las líneas entre y0 y y1 de ser
incluido en la decisión de coincidencia de campo. Se puede usar una banda de exclusión para ignorar
subtítulos, un logotipo u otras cosas que puedan interferir con la coincidencia. y0 establece el
comenzando la línea de escaneo y y1 establece la línea final; todas las líneas en el medio y0 y y1
disponibles (Incluyendo y0 y y1) será ignorado. Ajuste y0 y y1 al mismo valor será
desactivar la función. y0 y y1 el valor predeterminado es 0.

trillar
Establezca el umbral de detección de cambio de escena como un porcentaje del cambio máximo en el luma
avión. Los buenos valores están en el rango "[8.0, 14.0]". La detección de cambio de escena es solo
relevante en caso combinación de peine=sc. El rango para trillar es "[0.0, 100.0]".

El valor predeterminado es 12.0.

combinación de peine
Cuándo combate no es ninguna, "fieldmatch" tendrá en cuenta las puntuaciones combinadas de
coincidencias al decidir qué partido utilizar como partido final. Los valores disponibles son:

ninguna
No hay coincidencia final basada en puntajes combinados.

sc Las puntuaciones peinadas solo se utilizan cuando se detecta un cambio de escena.

ser completados
Utilice partituras peinadas todo el tiempo.

El valor predeterminado es sc.

peinar
Forzar "fieldmatch" para calcular las métricas combinadas para ciertas coincidencias e imprimirlas.
Esta configuración se conoce como micrófono en el vocabulario TFM / VFM. Los valores disponibles son:

ninguna
Sin cálculo forzado.

pCN Forzar cálculos de p / c / n.

pcnub
Forzar cálculos de p / c / n / u / b.

El valor predeterminado es ninguna.

trillar
Este es el umbral de combinación de áreas utilizado para la detección de cuadros combinados. Esto esencialmente
controla qué tan "fuerte" o "visible" debe ser el peinado para ser detectado. Los valores más grandes significan
El peinado debe ser más visible y los valores más pequeños significan que el peinado puede ser menos visible o
fuerte y aún ser detectado. Las configuraciones válidas son de "-1" (cada píxel será
detectado como peinado) a 255 (no se detectará ningún píxel como peinado). Esto es básicamente un
valor de diferencia de píxeles. Un buen rango es "[8, 12]".

El valor predeterminado es 9.

croma
Establece si el croma se considera o no en la decisión del marco peinado. Solo deshabilitar
esto si su fuente tiene problemas de croma (arco iris, etc.) que están causando problemas
para la detección de fotogramas combinados con croma habilitado. En realidad, usando croma=0 is
generalmente más confiable, excepto en el caso en el que el croma solo se peina en el
.

El valor predeterminado es 0.

bloquex
blocky
Establezca respectivamente el tamaño del eje xy del eje y de la ventana utilizada durante el marco peinado
detección. Esto tiene que ver con el tamaño del área en la que peinar los píxeles son
requiere ser detectado como peinado para que una trama se declare peinado. Ver el peinar
descripción del parámetro para obtener más información. Los valores posibles son cualquier número que sea una potencia
de 2 a partir de 4 y hasta 512.

El valor predeterminado es 16.

peinar
El número de píxeles peinados dentro de cualquiera de los blocky by bloquex bloques de tamaño en el
marco para que el marco se detecte como peinado. Mientras trillar controla qué tan "visible" el
peinar debe ser, este ajuste controla "cuánto" peinado debe haber en cualquier
área localizada (una ventana definida por el bloquex y blocky ajustes) en el marco.
El valor mínimo es 0 y el máximo es "bloque x bloquex" (momento en el que no se
ser detectado como peinado). Esta configuración se conoce como MI en el vocabulario TFM / VFM.

El valor predeterminado es 80.

p / c / n / u / b sentido

p / c / n

Asumimos la siguiente secuencia telecine:

Campos superiores: 1 2 2 3 4
Campos inferiores: 1 2 3 4 4

Los números corresponden al marco progresivo al que se refieren los campos. Aquí, los dos primeros
los fotogramas son progresivos, el 3º y 4º están peinados, etc.

Cuando "fieldmatch" está configurado para ejecutar una coincidencia desde abajo (campo=fondo) así es como
este flujo de entrada se transforma:

Flujo de entrada:
Teléfono 1 2 2 3 4
B 1 2 3 4 4 <- referencia coincidente

Coincidencias: ccnnc

Flujo de salida:
Teléfono 1 2 3 4 4
1 2 3 4 4

Como resultado de la coincidencia de campos, podemos ver que algunos marcos se duplican. Actuar
un telecine inverso completo, debe confiar en un filtro de diezmado después de esta operación.
Ver, por ejemplo, el diezmar filtrar.

La misma operación ahora coincide con los campos superiores (campo=parte superior) Se ve como esto:

Flujo de entrada:
T 1 2 2 3 4 <- referencia coincidente
1 2 3 4 4

Coincidencias: ccppc

Flujo de salida:
Teléfono 1 2 2 3 4
1 2 2 3 4

En estos ejemplos, podemos ver qué p, c y n significar; Básicamente, se refieren al marco y
campo de la paridad opuesta:

*<p coincide con el campo de la paridad opuesta en el cuadro anterior>
*<c coincide con el campo de la paridad opuesta en el marco actual>
*<n coincide con el campo de la paridad opuesta en el siguiente cuadro>

u / b

El u y b las coincidencias son un poco especiales en el sentido de que coinciden con las del lado opuesto
bandera de paridad. En los siguientes ejemplos, asumimos que actualmente estamos haciendo coincidir el segundo
marco (Superior: 2, Inferior: 2). Según la coincidencia, se coloca una 'x' arriba y abajo de cada
campos coincidentes.

Con fondo a juego (campo=fondo):

Coincidencia: cpnbu

xxxxx
Arriba 1 2 2 1 2 2 1 2 2 1 2 2 1 2 2
Inferior 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3
xxxxx

Cuadros de salida:
2 1 2 2 2
2 2 2 1 3

Con top a juego (campo=parte superior):

Coincidencia: cpnbu

xxxxx
Arriba 1 2 2 1 2 2 1 2 2 1 2 2 1 2 2
Inferior 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3
xxxxx

Cuadros de salida:
2 2 2 1 2
2 1 3 2 2

Ejemplos

IVTC simple de un primer flujo telecineado de campo superior:

fieldmatch = order = tff: combmatch = ninguno, diezmar

IVTC avanzado, con respaldo activado yadif para cuadros todavía peinados:

fieldmatch = order = tff: combmatch = completo, yadif = deint = entrelazado, diezmar

orden de campo
Transforma el orden de los campos del video de entrada.

Acepta los siguientes parámetros:

solicite
El orden de los campos de salida. Los valores válidos son tff para el campo superior primero o bff para el fondo
campo primero.

El valor predeterminado es tff.

La transformación se realiza desplazando el contenido de la imagen hacia arriba o hacia abajo en una línea, y
llenando la línea restante con el contenido apropiado de la imagen. Este método es consistente
con la mayoría de los convertidores de órdenes de campo de difusión.

Si el vídeo de entrada no está marcado como entrelazado o ya está marcado como
del orden de campo de salida requerido, este filtro no altera el video entrante.

Es muy útil al convertir hacia o desde material PAL DV, que es el campo inferior primero.

Por ejemplo:

ffmpeg -i in.vob -vf "fieldorder = bff" out.dv

fifo
Almacene las imágenes de entrada y envíelas cuando se soliciten.

Es principalmente útil cuando se inserta automáticamente mediante el marco libavfilter.

No toma parámetros.

encontrar_rect
Encuentra un objeto rectangular

Acepta las siguientes opciones:

objeto
Ruta de archivo de la imagen del objeto, debe estar en gris 8.

umbral
Umbral de detección, el valor predeterminado es 0.5.

mapas mip
Número de mapas MIP, el valor predeterminado es 3.

xmín, ymín, xmáx, ymax
Especifica el rectángulo en el que buscar.

Ejemplos

· Genere una paleta representativa de un video dado usando ffmpeg:

ffmpeg -i file.ts -vf find_rect = newref.pgm, cover_rect = cover.jpg: mode = cover new.mkv

portada_rect
Cubrir un objeto rectangular

Acepta las siguientes opciones:

Protectora
La ruta de archivo de la imagen de portada opcional debe estar en yuv420.

modo
Establecer el modo de cobertura.

Acepta los siguientes valores:

Protectora
cúbralo con la imagen suministrada

mancha
cúbralo interpolando los píxeles circundantes

El valor predeterminado es mancha.

Ejemplos

· Genere una paleta representativa de un video dado usando ffmpeg:

ffmpeg -i file.ts -vf find_rect = newref.pgm, cover_rect = cover.jpg: mode = cover new.mkv

formato
Convierta el video de entrada a uno de los formatos de píxeles especificados. Libavfilter intentará
elija uno que sea adecuado como entrada para el siguiente filtro.

Acepta los siguientes parámetros:

pix_fmts
Una lista separada '|' de nombres de formato de píxeles, como "pix_fmts = yuv420p | monow | rgb24".

Ejemplos

· Convierta el video de entrada al yuv420p formato

formato = pix_fmts = yuv420p

Convierta el video de entrada a cualquiera de los formatos de la lista

formato = pix_fmts = yuv420p | yuv444p | yuv410p

fps
Convierta el video a la velocidad de fotogramas constante especificada duplicando o soltando fotogramas como
necesario.

Acepta los siguientes parámetros:

fps La velocidad de fotogramas de salida deseada. El valor predeterminado es 25.

redondo
Método de redondeo.

Los valores posibles son:

cero
cero redondo hacia 0

inf redondear lejos de 0

DE INSCRIPCIÓN
ronda hacia el infinito

up redondear hacia + infinito

cerca
redondear a la más cercana

El valor predeterminado es "cerca".

hora de inicio
Suponga que el primer PTS debe ser el valor dado, en segundos. Esto permite
relleno / recorte al inicio de la transmisión. Por defecto, no se hace ninguna suposición sobre el
PTS esperado del primer fotograma, por lo que no se realiza ningún relleno ni recorte. Por ejemplo, este
podría establecerse en 0 para rellenar el comienzo con duplicados del primer fotograma si un video
la secuencia comienza después de la secuencia de audio o para recortar cualquier fotograma con un PTS negativo.

Alternativamente, las opciones se pueden especificar como una cadena plana: fps[:redondo].

Vea también el conjuntos filtrar.

Ejemplos

· Un uso típico para establecer los fps en 25:

fps = fps = 25

· Establece los fps en 24, utilizando la abreviatura y el método de redondeo para redondear al más cercano:

fps = fps = película: redondo = cerca

paquete de marcos
Empaquete dos transmisiones de video diferentes en un video estereoscópico, estableciendo metadatos adecuados en
códecs compatibles. Las dos vistas deben tener el mismo tamaño, velocidad de fotogramas y procesamiento
se detendrá cuando termine el video más corto. Tenga en cuenta que puede ajustar la vista cómodamente
propiedades con el escala y fps filtros.

Acepta los siguientes parámetros:

formato
El formato de embalaje deseado. Los valores admitidos son:

Sbs Las vistas están una al lado de la otra (predeterminado).

de la pestaña. Las vistas están una encima de la otra.

líneas
Las vistas están empaquetadas por línea.

columnas
Las vistas están empaquetadas por columna.

secuencia de fotogramas
Las vistas están temporalmente intercaladas.

Algunos ejemplos:

# Convierta las vistas izquierda y derecha en un video secuencial de cuadros
ffmpeg -i IZQUIERDA -i DERECHA -filter_complex framepack = frameseq SALIDA

# Convierta las vistas en un video lado a lado con la misma resolución de salida que la entrada
ffmpeg -i IZQUIERDA -i DERECHA -filter_complex [0: v] scale = w = iw / 2 [left], [1: v] scale = w = iw / 2 [right], [left] [right] framepack = sbs PRODUCCIÓN

framerate
Cambie la velocidad de fotogramas interpolando nuevos fotogramas de salida de vídeo de los fotogramas de origen.

Este filtro no está diseñado para funcionar correctamente con medios entrelazados. Si quieres
cambie la velocidad de fotogramas de los medios entrelazados, entonces debe desentrelazar antes de esto
filtrar y volver a entrelazar después de este filtro.

A continuación, se incluye una descripción de las opciones aceptadas.

fps Especifique los fotogramas de salida por segundo. Esta opción también se puede especificar como un valor
solo. El valor predeterminado es 50.

inicio_interp
Especifique el inicio de un rango donde el marco de salida se creará como lineal
interpolación de dos fotogramas. El rango es [0-255], el valor predeterminado es 15.

interp_end
Especifique el final de un rango donde el marco de salida se creará como lineal
interpolación de dos fotogramas. El rango es [0-255], el valor predeterminado es 240.

escena
Especifique el nivel en el que se detecta un cambio de escena como un valor entre 0 y 100 para
indicar una nueva escena; un valor bajo refleja una baja probabilidad de que el marco actual
introducir una nueva escena, mientras que un valor más alto significa que es más probable que el fotograma actual
ser uno. El valor predeterminado es 7.

banderas
Especifique las banderas que influyen en el proceso de filtrado.

Valor disponible para banderas :

escena_cambio_detectar, scd
Habilite la detección de cambio de escena usando el valor de la opción escena. Esta bandera es
habilitado por defecto.

paso de fotograma
Seleccione un fotograma cada enésimo fotograma.

Este filtro acepta la siguiente opción:

paso
Seleccione el fotograma después de cada fotograma "paso". Los valores permitidos son números enteros positivos más altos
que 0. El valor predeterminado es 1.

frei0r
Aplique un efecto frei0r al video de entrada.

Para habilitar la compilación de este filtro, debe instalar el encabezado frei0r y
configure FFmpeg con "--enable-frei0r".

Acepta los siguientes parámetros:

nombre_filtro
El nombre del efecto frei0r que se cargará. Si la variable de entorno FREI0R_PATH is
definido, el efecto frei0r se busca en cada uno de los directorios especificados por el
lista separada por dos puntos en RUTA_FREIOR. De lo contrario, las rutas frei0r estándar son
buscado, en este orden: INICIO / .frei0r-1 / lib /, / usr / local / lib / frei0r-1 /,
/ usr / lib / frei0r-1 /.

parámetros_de_filtro
Una lista separada '|' de parámetros para pasar al efecto frei0r.

Un parámetro de efecto frei0r puede ser un booleano (su valor es "y" o "n"), un doble, un
color (especificado como R/G/B, Donde R, Gy B son números de coma flotante entre 0.0 y
1.0, inclusive) o por una descripción de color especificada en la sección "Color" en el ffmpeg-
utils manual), un puesto (especificado como X/Y, Donde X y Y son números de coma flotante)
y / o una cuerda.

El número y los tipos de parámetros dependen del efecto cargado. Si un parámetro de efecto es
no especificado, se establece el valor predeterminado.

Ejemplos

· Aplicar el efecto distorsionador, configurando los dos primeros parámetros dobles:

frei0r = nombre_filtro = distorsionar: parámetros_filtro = 0 | 0.5

· Aplicar el efecto de resistencia al color, tomando un color como primer parámetro:

frei0r = colordistance: 0.2 / 0.3 / 0.4
frei0r = colordistance: violeta
frei0r = colordistance: 0x112233

· Aplicar el efecto de perspectiva, especificando las posiciones de la imagen superior izquierda y superior derecha:

frei0r=perspective:0.2/0.2|0.8/0.2

Para más información, verhttp://frei0r.dyne.org>

fsp
Aplicar un posprocesamiento rápido y sencillo. Es una versión más rápida de spp.

Divide (I) DCT en pasadas horizontales / verticales. A diferencia del postprocesamiento simple
filtro, uno de ellos se realiza una vez por bloque, no por píxel. Esto permite mucho
mayor velocidad.

El filtro acepta las siguientes opciones:

calidad
Establecer la calidad. Esta opción define el número de niveles para promediar. Acepta un
entero en el rango 4-5. El valor predeterminado es 4.

qp Forzar un parámetro de cuantificación constante. Acepta un número entero en el rango 0-63. Que no
configurado, el filtro usará el QP de la secuencia de video (si está disponible).

fuerza
Configure la fuerza del filtro. Acepta un número entero en el rango de -15 a 32. Los valores más bajos significan más
detalles pero también más artefactos, mientras que los valores más altos hacen que la imagen sea más suave pero también
más borroso. El valor predeterminado es 0 X PSNR óptimo.

use_bframe_qp
Habilite el uso de QP desde B-Frames si está configurado en 1. El uso de esta opción puede causar
parpadeo, ya que los fotogramas B suelen tener un QP más grande. El valor predeterminado es 0 (no habilitado).

geq
El filtro acepta las siguientes opciones:

lum_expr, lum
Establezca la expresión de luminancia.

cb_expr, cb
Establezca la expresión de crominancia azul.

cr_expr, cr
Establezca la expresión de rojo de crominancia.

alfa_expr, a
Establezca la expresión alfa.

expr_rojo, r
Establezca la expresión roja.

verde_expr, g
Establezca la expresión verde.

azul_expr, b
Establezca la expresión azul.

El espacio de color se selecciona de acuerdo con las opciones especificadas. Si uno de los lum_expr,
cb_expro cr_expr se especifican las opciones, el filtro seleccionará automáticamente un YCbCr
espacio de color. Si uno de los expr_rojo, verde_expro azul_expr se especifican las opciones,
seleccione un espacio de color RGB.

Si una de las expresiones de crominancia no está definida, recurre a la otra. Si no
se especifica una expresión alfa que se evaluará a un valor opaco. Si nada de crominancia
se especifican expresiones, se evaluarán a la expresión de luminancia.

Las expresiones pueden utilizar las siguientes variables y funciones:

N El número secuencial del fotograma filtrado, comenzando desde 0.

X
Y Las coordenadas de la muestra actual.

W
H El ancho y alto de la imagen.

SW
SH Escala de ancho y alto según el plano filtrado actualmente. Es la razon
entre el número de píxeles del plano de luminancia correspondiente y los del plano actual. P.ej
para YUV4: 2: 0 los valores son "1,1" para el plano de luminancia y "0.5,0.5" para los planos de crominancia.

T Tiempo del fotograma actual, expresado en segundos.

p (x, y)
Devuelve el valor del píxel en la ubicación (x,y) del plano actual.

lum (x, y)
Devuelve el valor del píxel en la ubicación (x,y) del plano de luminancia.

cb (x, y)
Devuelve el valor del píxel en la ubicación (x,y) del plano cromático de diferencia de azul.
Devuelve 0 si no existe tal plano.

cr (x, y)
Devuelve el valor del píxel en la ubicación (x,y) del plano cromático de diferencia de rojo.
Devuelve 0 si no existe tal plano.

r (x, y)
g (x, y)
b (x, y)
Devuelve el valor del píxel en la ubicación (x,y) del componente rojo / verde / azul.
Devuelve 0 si no existe tal componente.

alfa (x, y)
Devuelve el valor del píxel en la ubicación (x,y) del plano alfa. Devuelve 0 si hay
no hay tal avión.

Para funciones, si x y y están fuera del área, el valor se recortará automáticamente a
el borde más cercano.

Ejemplos

· Voltea la imagen horizontalmente:

geq = p (WX \, Y)

· Genera una onda senoidal bidimensional, con ángulo "PI / 3" y una longitud de onda de 100 píxeles:

geq=128 + 100*sin(2*(PI/100)*(cos(PI/3)*(X-50*T) + sin(PI/3)*Y)):128:128

· Genera una luz en movimiento enigmática y elegante:

nullsrc = s = 256x256, geq =azar(1)/hypot(X-cos(N*0.07)*W/2-W/2\,Y-sin(N*0.09)*H/2-H/2)^2*1000000*sin(N*0.02):128:128

· Genera un efecto de relieve rápido:

formato = gris, geq = lum_expr = '(p (X, Y) + (256-p (X-4, Y-4))) / 2'

· Modifica los componentes RGB según la posición de los píxeles:

geq = r = 'X / W * r (X, Y)': g = '(1-X / W) * g (X, Y)': b = '(HY) / H * b (X, Y ) '

· Cree un degradado radial que tenga el mismo tamaño que la entrada (consulte también la viñeta
filtrar):

geq=lum=255*gauss((X/W-0.5)*3)*gauss((Y/H-0.5)*3)/gauss(0) /gauss(0), formato = gris

· Cree un degradado lineal para usarlo como máscara para otro filtro, luego componga con
superposición. En este ejemplo, el video se volverá gradualmente más borroso de arriba a abajo.
la parte inferior del eje y como se define por el gradiente lineal:

ffmpeg -i input.mp4 -filter_complex "geq = lum = 255 * (Y / H), format = gray [grad]; [0: v] boxblur = 4 [blur]; [blur] [grad] alphamerge [alpha] ; [0: v] [alpha] superposición "output.mp4

graduado
Corrija los artefactos de bandas que a veces se introducen en regiones casi planas por
truncamiento a una profundidad de color de 8 bits. Interpolar los gradientes que deben ir donde las bandas
son, y los difumina.

Está diseñado solo para reproducción. No lo use antes de la compresión con pérdida, porque
la compresión tiende a perder el dither y traer de vuelta las bandas.

Acepta los siguientes parámetros:

fuerza
La cantidad máxima por la que el filtro cambiará un píxel. Este es también el
umbral para detectar regiones casi planas. Los valores aceptables oscilan entre .51 y 64;
el valor predeterminado es 1.2. Los valores fuera de rango se recortarán al rango válido.

radius
El vecindario al que se ajustará el gradiente. Un radio más grande genera gradientes más suaves,
pero también evita que el filtro modifique los píxeles cerca de las regiones detalladas.
Los valores aceptables son 8-32; el valor predeterminado es 16. Los valores fuera de rango serán
recortado al rango válido.

Alternativamente, las opciones se pueden especificar como una cadena plana: fuerza[:radius]

Ejemplos

· Aplicar el filtro con una fuerza de 3.5 y un radio de 8:

gradfun = 3.5: 8

· Especifique el radio, omitiendo la fuerza (que volverá al valor predeterminado):

gradfun = radio = 8

mediocre
Aplique Hald CLUT a una transmisión de video.

La primera entrada es el flujo de video a procesar y la segunda es Hald CLUT. La Hald
La entrada CLUT puede ser una imagen simple o un flujo de video completo.

El filtro acepta las siguientes opciones:

más corto
Forzar la terminación cuando termina la entrada más corta. El valor predeterminado es 0.

repetir último
Continúe aplicando el último CLUT después del final de la secuencia. Un valor de 0 deshabilita el
filtro después de que se alcanza el último fotograma de CLUT. El valor predeterminado es 1.

"haldclut" también tiene las mismas opciones de interpolación que lut3d (ambos filtros comparten lo mismo
internos).

Puede encontrar más información sobre Hald CLUT en el sitio web de Eskil Steenberg (Hald CLUT
autor) enhttp://www.quelsolaar.com/technology/clut.html>.

Flujo de trabajo ejemplos

Transmisión de video Hald CLUT

Genere una secuencia de Hald CLUT de identidad alterada con varios efectos:

ffmpeg -f lavfi -i B = 8 -vf "tono = H = 2 * PI * t: s = sin (2 * PI * t) +1, curvas = cross_process" -t 10 -c: v ffv1 tuerca de embrague

Nota: asegúrese de utilizar un códec sin pérdidas.

Luego úselo con "haldclut" para aplicarlo en alguna secuencia aleatoria:

ffmpeg -f lavfi -i mandelbrot -i clut.nut -filter_complex '[0] [1] haldclut' -t 20 mandelclut.mkv

El Hald CLUT se aplicará a los 10 primeros segundos (duración de tuerca de embrague), entonces el
La última imagen de esa secuencia CLUT se aplicará a los fotogramas restantes del
corriente "mandelbrot".

Hald CLUT con vista previa

Se supone que un Hald CLUT es una imagen cuadrada de "Nivel * Nivel * Nivel" por
Píxeles "Nivel * Nivel * Nivel". Para un Hald CLUT dado, FFmpeg seleccionará el mayor posible
cuadrado comenzando en la parte superior izquierda de la imagen. Los píxeles de relleno restantes (inferior o
derecha) serán ignorados. Esta área se puede utilizar para agregar una vista previa de Hald CLUT.

Normalmente, el siguiente Hald CLUT generado será compatible con el filtro "haldclut":

ffmpeg -f lavfi -i B = 8 -vf "
pad = iw + 320 [padded_clut];
smptebars = s = 320x256, split [a] [b];
[padded_clut] [a] superposición = W-320: h, curvas = color_negative [principal];
[principal] [b] superposición = W-320 "-frames: v 1 clut.png

Contiene el original y una vista previa del efecto de CLUT: las barras de color SMPTE son
que se muestran en la parte superior derecha y debajo de las mismas barras de color procesadas por los cambios de color.

Entonces, el efecto de este Hald CLUT se puede visualizar con:

ffplay input.mkv -vf "película = clut.png, [in] haldclut"

voltear
Voltea el video de entrada horizontalmente.

Por ejemplo, para voltear horizontalmente el video de entrada con ffmpeg:

ffmpeg -i in.avi -vf "hflip" out.avi

historia
Este filtro aplica una ecualización de histograma de color global por fotograma.

Se puede usar para corregir videos que tienen un rango comprimido de intensidades de píxeles. El
filtro redistribuye las intensidades de píxeles para igualar su distribución a través de la
rango de intensidad. Puede verse como un "filtro de contraste de ajuste automático". Esta
El filtro es útil solo para corregir videos de origen degradados o mal capturados.

El filtro acepta las siguientes opciones:

fuerza
Determine la cantidad de ecualización que se aplicará. A medida que se reduce la fuerza, la
La distribución de las intensidades de los píxeles se acerca cada vez más a la del cuadro de entrada.
El valor debe ser un número flotante en el rango [0,1] y el valor predeterminado es 0.200.

intensidad
Establecer la intensidad máxima que se puede generar y escalar los valores de salida
adecuadamente. La fuerza debe establecerse como se desee y luego la intensidad puede ser
limitado si es necesario para evitar el lavado. El valor debe ser un número flotante en el rango
[0,1] y el valor predeterminado es 0.210.

contra bandas
Establezca el nivel antibanding. Si está habilitado, el filtro variará aleatoriamente la luminancia de
píxeles de salida en una pequeña cantidad para evitar la formación de bandas en el histograma. Los valores posibles son
"ninguno", "débil" o "fuerte". Su valor predeterminado es "ninguno".

histograma
Calcule y dibuje un histograma de distribución de color para el video de entrada.

El histograma calculado es una representación de la distribución del componente de color en un
imagen.

El filtro acepta las siguientes opciones:

modo
Configure el modo de histograma.

Acepta los siguientes valores:


Histograma estándar que muestra la distribución de los componentes de color en una imagen.
Muestra un gráfico de color para cada componente de color. Muestra la distribución de Y, U, V,
Componentes A o R, G, B, según el formato de entrada, en el cuadro actual. Debajo
en cada gráfico se muestra un medidor de escala de componentes de color.

Color
Muestra los valores de croma (ubicación del color U / V) en un gráfico bidimensional (que es
llamado vectorscopio). Cuanto más brillante es un píxel en el vectorscopio, más píxeles de
el fotograma de entrada corresponde a ese píxel (es decir, más píxeles tienen este croma
valor). El componente V se muestra en el eje horizontal (X), con el extremo izquierdo
el lado es V = 0 y el lado más a la derecha es V = 255. El componente U es
se muestra en el eje vertical (Y), con la parte superior representando U = 0 y la parte inferior
representando U = 255.

La posición de un píxel blanco en el gráfico corresponde al valor de croma de un
píxel del clip de entrada. Por lo tanto, el gráfico se puede utilizar para leer el tono (color
sabor) y la saturación (el predominio del tono en el color). Como el tono de
un color cambia, se mueve alrededor del cuadrado. En el centro de la plaza el
la saturación es cero, lo que significa que el píxel correspondiente no tiene color. Si el
se aumenta la cantidad de un color específico (dejando los otros colores sin cambios)
la saturación aumenta y el indicador se mueve hacia el borde del cuadrado.

color2
Los valores cromáticos en el vectorscopio, similares a "color", pero los valores cromáticos reales son
desplegado.

forma de onda
Gráfico de componente de color por fila / columna. En el modo de fila, el gráfico del lado izquierdo
representa el valor 0 del componente de color y el lado derecho representa el valor = 255. En
modo de columna, el lado superior representa el valor del componente de color = 0 y el lado inferior
representa valor = 255.

El valor predeterminado es "niveles".

nivel_altura
Establezca la altura del nivel en "niveles". El valor predeterminado es 200. El rango permitido es [50, 2048].

altura_escala
Establezca la altura de la escala de colores en "niveles". El valor predeterminado es 12. El rango permitido es [0, 40].

paso
Configure el paso para el modo "forma de onda". Los valores más pequeños son útiles para averiguar cuántos valores de
la misma luminancia se distribuye en las filas / columnas de entrada. El valor predeterminado es 10.
El rango permitido es [1, 255].

modo de forma de onda
Ajuste el modo para "forma de onda". Puede ser "fila" o "columna". El valor predeterminado es "fila".

espejo_forma de onda
Configure el modo de espejo para "forma de onda". 0 significa no reflejado, 1 significa reflejado. En espejo
modo, los valores más altos se representarán en el lado izquierdo para el modo "fila" y en la parte superior
para el modo "columna". El valor predeterminado es 0 (no reflejado).

modo de visualización
Configure el modo de visualización para "forma de onda" y "niveles". Acepta los siguientes valores:

desfile
Muestra un gráfico separado para los componentes de color uno al lado del otro en forma de onda de "fila"
modo o uno debajo del otro en el modo de forma de onda "columna" para el histograma de "forma de onda"
modo. Para el modo de histograma de "niveles", los gráficos de componentes por color se colocan debajo
El uno al otro.

El uso de este modo de visualización en el modo de histograma de "forma de onda" facilita la localización de colores
proyecta las luces y sombras de una imagen, comparando los contornos de la
gráficos superior e inferior de cada forma de onda. Dado que los blancos, grises y negros son
caracterizado por cantidades exactamente iguales de rojo, verde y azul, áreas neutrales de
la imagen debe mostrar tres formas de onda de aproximadamente el mismo ancho / alto. Que no,
la corrección es fácil de realizar haciendo ajustes de nivel en las tres formas de onda.

superposición
Presenta información idéntica a la del "desfile", excepto que los gráficos
Los componentes que representan el color se superponen directamente entre sí.

Este modo de visualización en el modo de histograma de "forma de onda" facilita la localización relativa
diferencias o similitudes en áreas superpuestas de los componentes de color que son
se supone que son idénticos, como blancos neutros, grises o negros.

El valor predeterminado es "desfile".

modo_niveles
Establecer el modo de "niveles". Puede ser "lineal" o "logarítmico". El valor predeterminado es "lineal".

componentes
Establezca los componentes de color que se mostrarán para los "niveles" de modo. El valor predeterminado es 7.

Ejemplos

· Calcular y dibujar histograma:

ffplay -i entrada -vf histograma

hqdn3d
Este es un filtro de eliminación de ruido 3d de alta precisión / calidad. Tiene como objetivo reducir el ruido de la imagen,
produciendo imágenes suaves y haciendo imágenes fijas realmente quietas. Debería mejorar
compresibilidad.

Acepta los siguientes parámetros opcionales:

luma_espacial
Un número de punto flotante no negativo que especifica la intensidad de luminancia espacial. Eso
el valor predeterminado es 4.0.

croma_espacial
Un número de punto flotante no negativo que especifica la intensidad del croma espacial. Eso
predeterminado a 3.0 *luma_espacial/ 4.0.

luma_tmp
Un número de coma flotante que especifica la intensidad temporal de la luminancia. Por defecto es
6.0*luma_espacial/ 4.0.

croma_tmp
Un número de coma flotante que especifica la fuerza temporal del croma. Por defecto es
luma_tmp*croma_espacial/luma_espacial.

hqx
Aplique un filtro de aumento de alta calidad diseñado para pixel art. Este filtro fue
creado originalmente por Maxim Stepin.

Acepta la siguiente opción:

n Establezca la dimensión de escala: 2 para "hq2x", 3 para "hq3x" y 4 para "hq4x". El valor predeterminado es 3.

pila
Apila los videos de entrada horizontalmente.

Todas las transmisiones deben tener el mismo formato de píxeles y la misma altura.

Tenga en cuenta que este filtro es más rápido que usar superposición y almohadilla filtrar para crear la misma salida.

El filtro acepta la siguiente opción:

nb_entradas
Establecer el número de flujos de entrada. El valor predeterminado es 2.

matiz
Modifica el tono y / o la saturación de la entrada.

Acepta los siguientes parámetros:

h Especifique el ángulo de tono como una cantidad de grados. Acepta una expresión y los valores predeterminados
a "0".

s Especifique la saturación en el rango [-10,10]. Acepta una expresión y por defecto es
"1".

H Especifique el ángulo de tono como una cantidad de radianes. Acepta una expresión y los valores predeterminados
a "0".

b Especifique el brillo en el rango [-10,10]. Acepta una expresión y por defecto es
"0".

h y H son mutuamente excluyentes y no se pueden especificar al mismo tiempo.

El b, h, H y s Los valores de las opciones son expresiones que contienen las siguientes constantes:

n recuento de fotogramas del fotograma de entrada a partir de 0

pts marca de tiempo de presentación del marco de entrada expresada en unidades de base de tiempo

r velocidad de fotogramas del vídeo de entrada, NAN si se desconoce la velocidad de fotogramas de entrada

t marca de tiempo expresada en segundos, NAN si se desconoce la marca de tiempo de entrada

tb base de tiempo del video de entrada

Ejemplos

· Establece el tono en 90 grados y la saturación en 1.0:

matiz = h = 90: s = 1

· Mismo comando pero expresando el tono en radianes:

matiz = H = PI / 2: s = 1

· Gire el tono y haga que la saturación oscile entre 0 y 2 durante un período de 1 segundo:

matiz = "H = 2 * PI * t: s = sin (2 * PI * t) +1"

· Aplique un efecto de atenuación de saturación de 3 segundos comenzando en 0:

matiz = "s = min (t / 3 \, 1)"

La expresión general de aparición gradual se puede escribir como:

hue = "s = min (0 \, max ((t-START) / DURATION \, 1))"

· Aplique un efecto de desvanecimiento de saturación de 3 segundos a partir de los 5 segundos:

matiz = "s = max (0 \, min (1 \, (8-t) / 3))"

La expresión general de desvanecimiento se puede escribir como:

matiz = "s = max (0 \, min (1 \, (INICIO + DURACIÓN-t) / DURACIÓN))"

Comandos

Este filtro admite los siguientes comandos:

b
s
h
H Modifique el tono y / o la saturación y / o brillo del video de entrada. El
El comando acepta la misma sintaxis de la opción correspondiente.

Si la expresión especificada no es válida, se mantiene en su valor actual.

idea
Detecta el tipo de video entrelazado.

Este filtro intenta detectar si los fotogramas de entrada están entrelazados, progresivos, superiores o inferiores.
campo primero. También intentará detectar campos que se repiten entre fotogramas adyacentes.
(un signo de telecine).

La detección de un solo cuadro considera solo los cuadros inmediatamente adyacentes al clasificar cada uno
marco. La detección de fotogramas múltiples incorpora el historial de clasificación de
marcos

El filtro registrará estos valores de metadatos:

marco_actual_único
Tipo de fotograma actual detectado mediante detección de fotograma único. Uno de: `` tff '' (arriba
campo primero), `` bff '' (campo inferior primero), `` progresivo '' o `` indeterminado ''

soltero.tff
Número acumulativo de fotogramas detectados como campo superior primero mediante la detección de fotogramas únicos.

múltiples.tff
Número acumulativo de fotogramas detectados como campo superior primero utilizando fotogramas múltiples
de patógenos.

soltera.bff
Número acumulativo de fotogramas detectados como campo inferior primero utilizando un solo fotograma
de patógenos.

multiple.fotograma_actual
Tipo de fotograma actual detectado mediante detección de fotogramas múltiples. Uno de: `` tff '' (arriba
campo primero), `` bff '' (campo inferior primero), `` progresivo '' o `` indeterminado ''

múltiples.bff
Número acumulativo de fotogramas detectados como campo inferior primero utilizando fotogramas múltiples
de patógenos.

sencillo.progresivo
Número acumulado de fotogramas detectados como progresivos mediante la detección de fotogramas únicos.

múltiple.progresivo
Número acumulado de fotogramas detectados como progresivos mediante la detección de fotogramas múltiples.

soltero.indeterminado
Número acumulado de fotogramas que no se pudieron clasificar mediante la detección de fotogramas únicos.

múltiple.indeterminado
Número acumulado de fotogramas que no se pudieron clasificar con varios fotogramas
de patógenos.

Repeat.current_frame
Qué campo en el fotograma actual se repite desde el último. Uno de `` ninguno '',
`` arriba '' o `` abajo ''.

repetido tampoco
Número acumulado de fotogramas sin campo repetido.

repetido arriba
Número acumulado de fotogramas con el campo superior repetido desde la parte superior del fotograma anterior
campo.

repetido.
Número acumulativo de fotogramas con el campo inferior repetido desde el fotograma anterior.
campo inferior.

El filtro acepta las siguientes opciones:

intl_tres
Establecer umbral de entrelazado.

prog_thres
Establecer umbral progresivo.

repetir_umbral
Umbral para detección de campo repetida.

media vida
Número de fotogramas después de los cuales la contribución de un fotograma determinado a las estadísticas se reduce a la mitad
(es decir, contribuye solo 0.5 a su clasificación). El valor predeterminado de 0 significa que
todos los fotogramas que se ven tienen un peso total de 1.0 para siempre.

analyse_interlaced_flag
Cuando no es 0, idet utilizará el número especificado de fotogramas para determinar si
la bandera entrelazada es precisa, no contará los fotogramas indeterminados. Si la bandera
se determina que es precisa, se utilizará sin más cálculos, si es
Si se encuentra inexacta, se borrará sin más cálculos. Esta
permite insertar el filtro idet como un método computacional bajo para limpiar el
bandera entrelazada

il
Desentrelazar o intercalar campos.

Este filtro permite procesar campos de imágenes entrelazados sin desentrelazarlos.
El desintercalado divide el marco de entrada en 2 campos (las llamadas medias imágenes). Líneas impares
se mueven a la mitad superior de la imagen de salida, incluso las líneas a la mitad inferior. Usted puede
procesarlos (filtrarlos) de forma independiente y luego volver a intercalarlos.

El filtro acepta las siguientes opciones:

modo luma, l
modo_croma, c
modo alfa, a
Valores disponibles para modo luma, modo_croma y modo_alfa son:

ninguna
Hacer nada.

desentrelazar, d
Desentrelazar campos, colocando uno encima del otro.

intercalar i
Intercalar campos. Invierte el efecto del desintercalado.

El valor predeterminado es "ninguno".

luma_swap, ls
intercambio de croma, cs
intercambio alfa, as
Intercambia campos de luminancia / crominancia / alfa. Intercambia líneas pares e impares. El valor predeterminado es 0.

inflar
Aplicar efecto de inflado al video.

Este filtro reemplaza el píxel por el local(3x3) promedio teniendo en cuenta solo
valores superiores al píxel.

Acepta las siguientes opciones:

umbral0
umbral1
umbral2
umbral3
Limite el cambio máximo para cada plano, el valor predeterminado es 65535. Si es 0, el plano permanecerá
sin alterar.

entrelazar
Filtro entrelazado simple de contenidos progresivos. Esto entrelaza superior (o inferior)
líneas de fotogramas impares con líneas inferiores (o superiores) de fotogramas pares, reduciendo a la mitad la velocidad de fotogramas
y preservando la altura de la imagen.

Original nuevo marco original
Cuadro 'j' Cuadro 'j + 1' (tff)
========== =========== ===================
Línea 0 --------------------> Cuadro 'j' Línea 0
Línea 1 Línea 1 ----> Cuadro 'j + 1' Línea 1
Línea 2 ---------------------> Cuadro 'j' Línea 2
Línea 3 Línea 3 ----> Cuadro 'j + 1' Línea 3
... ...
El nuevo Frame + 1 será generado por Frame 'j + 2' y Frame 'j + 3' y así sucesivamente

Acepta los siguientes parámetros opcionales:

escanear
Esto determina si el fotograma entrelazado se toma del par (tff - predeterminado) o
líneas impares (bff) del cuadro progresivo.

paso bajo
Habilite (predeterminado) o deshabilite el filtro de paso bajo vertical para evitar el entrelazado de Twitter
y reducir los patrones de muaré.

Kerndeint
Desentrelaza el vídeo de entrada aplicando el desentrelazado adaptativo del kernel de Donald Graft. Trabajar en
partes entrelazadas de un video para producir cuadros progresivos.

A continuación se muestra la descripción de los parámetros aceptados.

trillar
Establezca el umbral que afecta la tolerancia del filtro al determinar si un píxel
la línea debe ser procesada. Debe ser un número entero en el rango [0,255] y el valor predeterminado es 10.
Un valor de 0 dará como resultado la aplicación del proceso en todos los píxeles.

mapa Pinte los píxeles que exceden el valor de umbral a blanco si se establece en 1. El valor predeterminado es 0.

solicite
Establecer el orden de los campos. Intercambiar campos si se establece en 1, dejar los campos solo si es 0. El valor predeterminado es 0.

agudo
Habilite el afilado adicional si se establece en 1. El valor predeterminado es 0.

bidireccional
Habilite el afilado bidireccional si se establece en 1. El valor predeterminado es 0.

Ejemplos

· Aplicar valores predeterminados:

kerndeint=thresh=10:map=0:order=0:sharp=0:twoway=0

· Habilite el afilado adicional:

kerndeint = agudo = 1

· Pintar píxeles procesados ​​en blanco:

kerndeint = mapa = 1

corrección de lentes
Corrija la distorsión radial de la lente

Este filtro se puede utilizar para corregir la distorsión radial que puede resultar del uso de
lentes gran angular y, por lo tanto, volver a rectificar la imagen. Para encontrar los parámetros correctos, uno puede
utilice herramientas disponibles, por ejemplo, como parte de opencv o simplemente prueba y error. Usar
opencv use la muestra de calibración (en samples / cpp) de las fuentes opencv y extraiga
los coeficientes k1 y k2 de la matriz resultante.

Tenga en cuenta que efectivamente el mismo filtro está disponible en las herramientas de código abierto Krita y
Digikam del proyecto KDE.

En contraste con el viñeta filtro, que también se puede utilizar para compensar errores de lente, este
El filtro corrige la distorsión de la imagen, mientras que viñeta corrige el brillo
distribución, por lo que es posible que desee utilizar ambos filtros juntos en ciertos casos, aunque
tendrá que encargarse del pedido, es decir, si se debe aplicar viñeteado antes o
después de la corrección de la lente.

Opciones

El filtro acepta las siguientes opciones:

cx Coordenada x relativa del punto focal de la imagen y, por lo tanto, el centro de la
distorsión. Este valor tiene un rango [0,1] y se expresa como fracciones de la imagen.
anchura.

cy Coordenada y relativa del punto focal de la imagen y, por lo tanto, el centro de la
distorsión. Este valor tiene un rango [0,1] y se expresa como fracciones de la imagen.
altura.

k1 Coeficiente del término de corrección cuadrática. 0.5 significa que no hay corrección.

k2 Coeficiente del término de corrección cuadrática doble. 0.5 significa que no hay corrección.

La fórmula que genera la corrección es:

r_src = r_tgt * (1 + k1 * (r_tgt / r_0) ^ 2 + k2 * (r_tgt / r_0) ^ 4)

donde r_0 es la mitad de la diagonal de la imagen y r_src y r_tgt son las distancias desde el
punto focal en las imágenes de origen y destino, respectivamente.

lut3d
Aplicar una LUT 3D a un video de entrada.

El filtro acepta las siguientes opciones:

presentar
Establezca el nombre del archivo 3D LUT.

Formatos soportados actualmente:

3dl Despues de los efectos

cubo
iridas

dat DaVinci

m3d Pandora

interpretar
Seleccione el modo de interpolación.

Los valores disponibles son:

más cercano
Utilice valores del punto definido más cercano.

trilineal
Interpolar valores usando los 8 puntos que definen un cubo.

tetraédrico
Interpolar valores usando un tetraedro.

pero lurgb, Lutyuv
Calcule una tabla de búsqueda para vincular el valor de entrada de cada componente de píxel a un valor de salida,
y aplíquelo al video de entrada.

Lutyuv aplica una tabla de búsqueda a un video de entrada YUV, lurgb a un video de entrada RGB.

Estos filtros aceptan los siguientes parámetros:

c0 establecer la primera expresión del componente de píxel

c1 establecer la expresión del segundo componente de píxel

c2 establecer la expresión del tercer componente de píxel

c3 establece la expresión del cuarto componente de píxel, corresponde al componente alfa

r establecer la expresión del componente rojo

g establecer la expresión del componente verde

b establecer la expresión del componente azul

a expresión del componente alfa

y establecer la expresión del componente Y / luminancia

u establecer la expresión del componente U / Cb

v establecer la expresión del componente V / Cr

Cada uno de ellos especifica la expresión que se utilizará para calcular la tabla de búsqueda para el
valores de componente de píxel correspondientes.

El componente exacto asociado a cada uno de los c* Las opciones dependen del formato de entrada.

El lut El filtro requiere formatos de píxeles YUV o RGB en la entrada, lurgb requiere RGB
formatos de píxeles en la entrada, y Lutyuv requiere YUV.

Las expresiones pueden contener las siguientes constantes y funciones:

w
h El ancho y alto de entrada.

val El valor de entrada para el componente de píxeles.

clipval
El valor de entrada, recortado al mínimo-maxval rango.

maxval
El valor máximo del componente de píxeles.

mínimo
El valor mínimo del componente de píxeles.

negativo
El valor negado del valor del componente de píxel, recortado al mínimo-maxval rango;
corresponde a la expresión "maxval-clipval + minval".

clip (val)
El valor calculado en val, recortado a la mínimo-maxval rango.

gammaval (gamma)
El valor de corrección de gamma calculado del valor del componente de píxel, recortado al
mínimo-maxval rango. Corresponde a la expresión
"pow ((clipval-minval) / (maxval-minval) \,gama) * (maxval-minval) + minval "

Todas las expresiones están predeterminadas a "val".

Ejemplos

· Negar entrada de video:

lutrgb = "r = maxval + minval-val: g = maxval + minval-val: b = maxval + minval-val"
lutyuv = "y = maxval + minval-val: u = maxval + minval-val: v = maxval + minval-val"

Lo anterior es lo mismo que:

lutrgb = "r = negval: g = negval: b = negval"
lutyuv = "y = negval: u = negval: v = negval"

· Negar luminancia:

lutyuv = y = negval

· Elimina los componentes cromáticos, convirtiendo el video en una imagen de tono gris:

lutyuv = "u = 128: v = 128"

· Aplicar un efecto quemador de luma:

lutyuv = "y = 2 * val"

· Eliminar los componentes verde y azul:

lutrgb = "g = 0: b = 0"

· Establecer un valor de canal alfa constante en la entrada:

formato = rgba, lutrgb = a = "maxval-minval / 2"

· Corrija la gamma de luminancia en un factor de 0.5:

lutyuv = y = gammaval (0.5)

· Descarte las partes menos significativas de luma:

lutyuv = y = 'bitand (val, 128 + 64 + 32)'

fusionar aviones
Fusionar componentes de canal de color de varias transmisiones de video.

El filtro acepta hasta 4 flujos de entrada y fusiona los planos de entrada seleccionados con la salida
vídeo.

Este filtro acepta las siguientes opciones:

cartografía
Establezca la entrada en el mapeo del plano de salida. El valor predeterminado es 0.

Las asignaciones se especifican como un mapa de bits. Debe especificarse como un número hexadecimal.
en la forma 0xAa [Bb [Cc [Dd]]]. 'Aa' describe el mapeo para el primer plano del
flujo de salida. 'A' establece el número de flujo de entrada que se utilizará (de 0 a 3), y 'a'
el número de plano de la entrada correspondiente a utilizar (de 0 a 3). El resto de
mappings es similar, 'Bb' describe el mapeo para el segundo plano del flujo de salida,
'Cc' describe el mapeo para el tercer plano del flujo de salida y 'Dd' describe el
mapeo para el cuarto plano del flujo de salida.

formato
Establece el formato de píxeles de salida. El valor predeterminado es "yuva444p".

Ejemplos

· Combina tres transmisiones de video grises del mismo ancho y alto en una sola transmisión de video:

[a0][a1][a2]mergeplanes=0x001020:yuv444p

· Fusiona la primera transmisión yuv1p y la segunda transmisión de video gris en la transmisión de video yuva444p:

[a0][a1]mergeplanes=0x00010210:yuva444p

· Intercambia el plano Y y A en la secuencia yuva444p:

format = yuva444p, mergeplanes = 0x03010200: yuva444p

· Intercambia el plano U y V en la secuencia yuv420p:

format = yuv420p, mergeplanes = 0x000201: yuv420p

· Transmite un clip rgb24 a yuv444p:

format = rgb24, mergeplanes = 0x000102: yuv444p

Mcdeint
Aplicar desentrelazado de compensación de movimiento.

Necesita un campo por cuadro como entrada y, por lo tanto, debe usarse junto con yadif = 1/3 o
equivalente.

Este filtro acepta las siguientes opciones:

modo
Configure el modo de desentrelazado.

Acepta uno de los siguientes valores:

rápido
mediano
lento
utilizar estimación de movimiento iterativo

extra_lento
como lento, pero utilice varios marcos de referencia.

El valor predeterminado es rápido.

paridad
Establezca la paridad de campo de imagen asumida para el video de entrada. Debe ser uno de los
siguientes valores:

0, tff
asumir el campo superior primero

1, bff
asumir el campo inferior primero

El valor predeterminado es bff.

qp Establezca el parámetro de cuantificación por bloque (QP) utilizado por el codificador interno.

Los valores más altos deberían resultar en un campo de vector de movimiento más suave pero menos óptimo
vectores individuales. El valor predeterminado es 1.

mpdecimar
Elimine los fotogramas que no difieran mucho del fotograma anterior para reducir el fotograma
tarifa.

El uso principal de este filtro es para la codificación de tasa de bits muy baja (por ejemplo, transmisión por acceso telefónico
módem), pero en teoría podría usarse para arreglar películas que fueron telecineadas a la inversa
incorrectamente.

A continuación, se incluye una descripción de las opciones aceptadas.

max Establezca el número máximo de fotogramas consecutivos que se pueden descartar (si es positivo), o
el intervalo mínimo entre fotogramas descartados (si es negativo). Si el valor es 0, el
el fotograma se descarta sin tener en cuenta el número de fotogramas descartados secuencialmente anteriores.

El valor predeterminado es 0.

hi
lo
cruz
Establezca los valores de umbral de caída.

Valores para hi y lo son para bloques de 8x8 píxeles y representan el valor real de los píxeles
diferencias, por lo que un umbral de 64 corresponde a 1 unidad de diferencia por cada píxel,
o el mismo repartido de forma diferente sobre el bloque.

Una trama es candidata a descartarse si ningún bloque de 8x8 difiere en más de un umbral
of hi, y si no mas de cruz bloques (1 significa la imagen completa) difieren en más de
un umbral de lo.

Valor predeterminado para hi es 64 * 12, valor predeterminado para lo es 64 * 5, y el valor predeterminado para
cruz es 0.33.

negar
Niega el video de entrada.

Acepta un número entero en la entrada; si no es cero, niega el componente alfa (si está disponible).
El valor predeterminado en la entrada es 0.

noformato
Obligar a libavfilter a no utilizar ninguno de los formatos de píxeles especificados para la entrada al siguiente
filtrar.

Acepta los siguientes parámetros:

pix_fmts
Una lista separada '|' de nombres de formato de píxeles, como apix_fmts = yuv420p | monow | rgb24 ".

Ejemplos

· Obligar a libavfilter a utilizar un formato diferente al yuv420p para la entrada al vflip
filtro:

noformat = pix_fmts = yuv420p, vflip

· Convierte el video de entrada a cualquiera de los formatos que no están incluidos en la lista:

noformat = yuv420p | yuv444p | yuv410p

ruido
Agregue ruido en el marco de entrada de video.

El filtro acepta las siguientes opciones:

todas_las_semillas
c0_semilla
c1_semilla
c2_semilla
c3_semilla
Establezca la semilla de ruido para un componente de píxel específico o todos los componentes de píxel en caso de
todas_las_semillas. El valor predeterminado es 123457.

toda la fuerza, ajos
c0_fuerza, c0s
c1_fuerza, c1s
c2_fuerza, c2s
c3_fuerza, c3s
Establezca la intensidad del ruido para un componente de píxel específico o para todos los componentes de píxel en caso de que
toda_fuerza. El valor predeterminado es 0. El rango permitido es [0, 100].

todas las_banderas, todo
c0_banderas, c0f
c1_banderas, c1f
c2_banderas, c2f
c3_banderas, c3f
Establecer indicadores de componentes de píxeles o establecer indicadores para todos los componentes si todas_las_banderas. Disponible
Los valores de las banderas de los componentes son:

a ruido temporal promediado (más suave)

p mezclar ruido aleatorio con un patrón (semi) regular

t ruido temporal (el patrón de ruido cambia entre fotogramas)

u ruido uniforme (gaussiano de lo contrario)

Ejemplos

Agregue ruido temporal y uniforme al video de entrada:

ruido = alls = 20: allf = t + u

nulo
Pase la fuente de video sin cambios a la salida.

ov
Aplique una transformación de video usando libopencv.

Para habilitar este filtro, instale la biblioteca libopencv y los encabezados y configure FFmpeg con
"--enable-libopencv".

Acepta los siguientes parámetros:

nombre_filtro
El nombre del filtro libopencv que se aplicará.

parámetros_de_filtro
Los parámetros para pasar al filtro libopencv. Si no se especifica, los valores predeterminados
se asumen.

Consulte la documentación oficial de libopencv para obtener información más precisa:
<http://docs.opencv.org/master/modules/imgproc/doc/filtering.html>

Se admiten varios filtros libopencv; consulte las siguientes subsecciones.

se expande

Dilatar una imagen utilizando un elemento estructurante específico. Corresponde a la libopencv
función "cvDilate".

Acepta los parámetros: estructura_el|nb_iteraciones.

estructura_el representa un elemento estructurante y tiene la sintaxis:
colsxfilas+ancla_xxancla_y/dar forma a

cols y filas representar el número de columnas y filas del elemento estructurante,
ancla_x y ancla_y el punto de anclaje, y dar forma a la forma del elemento estructurante.
dar forma a debe ser "rect", "cruz", "elipse" o "personalizado".

Si el valor de dar forma a es "personalizado", debe ir seguido de una cadena con el formato
"=nombre de archivo". El archivo con nombre nombre de archivo se supone que representa una imagen binaria, con cada
carácter imprimible correspondiente a un píxel brillante. Cuando una costumbre dar forma a es usado cols y
filas se ignoran, en su lugar se asume el número de columnas y filas del archivo leído.

El valor predeterminado para estructura_el es "3x3 + 0x0 / rect".

nb_iteraciones especifica el número de veces que se aplica la transformación a la imagen, y
el valor predeterminado es 1.

Algunos ejemplos:

# Utilice los valores predeterminados
ocv = dilatar

# Dilatar usando un elemento estructurante con una cruz de 5x5, iterando dos veces
ocv=filter_name=dilate:filter_params=5x5+2x2/cross|2

# Lea la forma del archivo diamond.shape, iterando dos veces.
# El archivo diamond.shape puede contener un patrón de caracteres como este
# *
# ***
#*****
# ***
# *
# Las columnas y filas especificadas se ignoran
# pero las coordenadas del punto de ancla no son
ocv=dilate:0x0+2x2/custom=diamond.shape|2

erosionar

Erosiona una imagen mediante el uso de un elemento estructurante específico. Corresponde a la libopencv
función "cvErode".

Acepta los parámetros: estructura_el:nb_iteraciones, con la misma sintaxis y semántica que
las se expande filtrar.

sencillo.

Suaviza el video de entrada.

El filtro toma los siguientes parámetros: tipo|param1|param2|param3|param4.

tipo es el tipo de filtro suave que se aplicará y debe tener uno de los siguientes valores:
"desenfoque", "desenfoque_no_escala", "mediana", "gaussiana" o "bilateral". El valor predeterminado es
"gaussiano".

El significado de param1, param2, param3y param4 Dependen del tipo liso. param1 y
param2 aceptar valores enteros positivos o 0. param3 y param4 aceptar punto flotante
valores.

El valor predeterminado para param1 es 3. El valor predeterminado para los otros parámetros es 0.

Estos parámetros corresponden a los parámetros asignados a la función libopencv
"cvSmooth".

superposición
Superponga un video sobre otro.

Toma dos entradas y tiene una salida. La primera entrada es el vídeo "principal" en el que
la segunda entrada está superpuesta.

Acepta los siguientes parámetros:

A continuación, se incluye una descripción de las opciones aceptadas.

x
y Establezca la expresión para las coordenadas xey del video superpuesto en la pantalla principal.
video. El valor predeterminado es "0" para ambas expresiones. En caso de que la expresión no sea válida,
se establece en un valor enorme (lo que significa que la superposición no se mostrará dentro de la
salida área visible).

eof_acción
La acción a tomar cuando se encuentra EOF en la entrada secundaria; acepta uno de
los siguientes valores:

repetir
Repite el último fotograma (predeterminado).

acabar todo
Finaliza ambas transmisiones.

pass
Pase la entrada principal.

eval
Establecer cuando las expresiones para xy y son evaluados.

Acepta los siguientes valores:

init
solo evalúa expresiones una vez durante la inicialización del filtro o cuando un comando
es procesado

marco
evaluar expresiones para cada marco entrante

El valor predeterminado es marco.

más corto
Si se establece en 1, fuerza la salida a terminar cuando termina la entrada más corta. Defecto
el valor es 0.

formato
Configure el formato para el video de salida.

Acepta los siguientes valores:

yuv420
forzar salida YUV420

yuv422
forzar salida YUV422

yuv444
forzar salida YUV444

RGB forzar salida RGB

El valor predeterminado es yuv420.

RGB (obsoleto)
Si se establece en 1, fuerce al filtro a aceptar entradas en el espacio de color RGB. Valor por defecto
es 0. Esta opción está obsoleta, utilice formato preferiblemente.

repetir último
Si se establece en 1, fuerce al filtro a dibujar el último marco superpuesto sobre la entrada principal hasta que
el final de la corriente. Un valor de 0 desactiva este comportamiento. El valor predeterminado es 1.

El xy y Las expresiones pueden contener los siguientes parámetros.

principal_w, W
principal_h, H
El ancho y alto de entrada principal.

superposición_w, w
superposición_h, h
La superposición de entrada de ancho y alto.

x
y Los valores calculados para x y y. Se evalúan para cada nuevo cuadro.

hsub
vssub
valores de submuestra de croma horizontal y vertical del formato de salida. Por ejemplo para
el formato de píxeles "yuv422p" hsub es 2 y vssub es 1.

n el número de fotogramas de entrada, comenzando desde 0

pos la posición en el archivo del marco de entrada, NAN si se desconoce

t La marca de tiempo, expresada en segundos. Es NAN si se desconoce la marca de tiempo de entrada.

Tenga en cuenta que n, pos, t las variables están disponibles solo cuando se realiza la evaluación para marco,
y evaluará a NAN cuando eval se establece a init.

Tenga en cuenta que los fotogramas se toman de cada vídeo de entrada en orden de marca de tiempo, por lo tanto, si su
las marcas de tiempo iniciales difieren, es una buena idea pasar las dos entradas a través de un
setpts = PTS-STARTPTS filtrar para que comiencen con la misma marca de tiempo cero, como en el ejemplo
para película el filtro lo hace.

Puede encadenar más superposiciones, pero debe probar la eficacia de dicho enfoque.

Comandos

Este filtro admite los siguientes comandos:

x
y Modifique la xey de la entrada de superposición. El comando acepta la misma sintaxis del
opción correspondiente.

Si la expresión especificada no es válida, se mantiene en su valor actual.

Ejemplos

· Dibuja la superposición a 10 píxeles de la esquina inferior derecha del video principal:

overlay = main_w-overlay_w-10: main_h-overlay_h-10

Usando opciones nombradas, el ejemplo anterior se convierte en:

overlay = x = main_w-overlay_w-10: y = main_h-overlay_h-10

· Inserte un logo PNG transparente en la esquina inferior izquierda de la entrada, usando el ffmpeg
herramienta con la opción "-filter_complex":

ffmpeg -i entrada -i logo -filter_complex 'overlay = 10: main_h-overlay_h-10' salida

· Inserte 2 logotipos PNG transparentes diferentes (segundo logotipo en la esquina inferior derecha) usando
las ffmpeg herramienta:

ffmpeg -i entrada -i logo1 -i logo2 -filter_complex 'superposición = x = 10: y = Hh-10, superposición = x = Ww-10: y = Hh-10' salida

· Agrega una capa de color transparente encima del video principal; "WxH" debe especificar el tamaño de
la entrada principal al filtro de superposición:

[email protected]:tamaño=AnchoxAlto [sobre]; [entrada][sobre] superposición [salida]

· Reproduce un video original y una versión filtrada (aquí con el filtro deshake) uno al lado del otro
lado usando el ffplay herramienta:

ffplay input.avi -vf 'dividir [a] [b]; [a] almohadilla = iw * 2: ih [src]; [b] deshake [filt]; [src] [filt] superposición = w '

El comando anterior es el mismo que:

ffplay input.avi -vf 'split [b], pad = iw * 2 [src], [b] deshake, [src] overlay = w'

· Hacer una superposición deslizante que aparece de izquierda a derecha en la parte superior de la pantalla
comenzando desde el tiempo 2:

superposición = x = 'if (gte (t, 2), -w + (t-2) * 20, NAN)': y = 0

· Componga la salida colocando dos videos de entrada uno al lado del otro:

ffmpeg -i left.avi -i right.avi -filter_complex "
nullsrc = tamaño = 200x100 [fondo];
[0: v] setpts = PTS-STARTPTS, escala = 100x100 [izquierda];
[1: v] setpts = PTS-STARTPTS, escala = 100x100 [derecha];
[fondo] [izquierda] superposición = más corto = 1 [fondo + izquierda];
[fondo + izquierda] [derecha] superposición = más corto = 1: x = 100 [izquierda + derecha]
"

· Enmascara de 10 a 20 segundos de un video aplicando el filtro delogo a una sección

ffmpeg -i test.avi -codec: v: 0 wmv2 -ar 11025 -b: v 9000k
-vf '[in]split[split_main][split_delogo];[split_delogo]trim=start=360:end=371,delogo=0:0:640:480[delogoed];[split_main][delogoed]overlay=eof_action=pass[out]'
enmascarado.avi

· Encadena varias superposiciones en cascada:

nullsrc = s = 200x200 [bg];
testsrc=s=100x100, split=4 [in0][in1][in2][in3];
[in0] lutrgb = r = 0, [bg] superposición = 0: 0 [mid0];
[in1] lutrgb = g = 0, [mid0] superposición = 100: 0 [mid1];
[in2] lutrgb = b = 0, [mid1] superposición = 0: 100 [mid2];
[in3] nulo, [mid2] superposición = 100: 100 [out0]

ruidoso
Aplique un eliminador de ruido Overcomplete Wavelet.

El filtro acepta las siguientes opciones:

profundidad
Establecer profundidad.

Los valores de profundidad más grandes eliminarán más el ruido de los componentes de frecuencia más baja, pero disminuirán la velocidad.
filtración.

Debe ser un int en el rango 8-16, el valor predeterminado es 8.

luma_fuerza, ls
Establezca la intensidad luminosa.

Debe ser un valor doble en el rango 0-1000, el valor predeterminado es 1.0.

croma_fuerza, cs
Establece la intensidad del croma.

Debe ser un valor doble en el rango 0-1000, el valor predeterminado es 1.0.

almohadilla
Agregue rellenos a la imagen de entrada y coloque la entrada original en el lugar proporcionado. x, y
coordenadas

Acepta los siguientes parámetros:

anchura, w
altura, h
Especifique una expresión para el tamaño de la imagen de salida con los rellenos agregados. Si el
valor por anchura or altura es 0, el tamaño de entrada correspondiente se utiliza para la salida.

El anchura expresión puede hacer referencia al valor establecido por el altura expresión y vicio
versa.

El valor predeterminado de anchura y altura es 0.

x
y Especifique las compensaciones para colocar la imagen de entrada dentro del área acolchada, con respecto
al borde superior / izquierdo de la imagen de salida.

El x expresión puede hacer referencia al valor establecido por el y expresión y viceversa.

El valor predeterminado de x y y es 0.

Color
Especifique el color del área acolchada. Para conocer la sintaxis de esta opción, marque la casilla "Color"
sección en el manual ffmpeg-utils.

El valor predeterminado de Color es negro".

El valor para el anchura, altura, xy y Las opciones son expresiones que contienen lo siguiente
constantes:

en W
en_h
El ancho y alto del video de entrada.

iw
ih Estos son los mismos que en W y en_h.

fuera_w
fuera_h
El ancho y alto de salida (el tamaño del área acolchada), según lo especificado por el anchura
y altura expresiones

ow
oh Estos son los mismos que fuera_w y fuera_h.

x
y Las compensaciones xey especificadas por el x y y expresiones, o NAN si aún no
especificado.

a mismo como iw / ih

sar relación de aspecto de muestra de entrada

Dar relación de aspecto de la pantalla de entrada, es la misma que (iw / ih) * sar

hsub
vssub
Los valores de submuestra de croma horizontal y vertical. Por ejemplo para el formato de píxeles
"yuv422p" hsub es 2 y vssub es 1.

Ejemplos

· Agrega almohadillas con el color "violeta" al video de entrada. El tamaño del video de salida es
640x480, y la esquina superior izquierda del video de entrada se coloca en la columna 0, fila 40

pad = 640: 480: 0: 40: violeta

El ejemplo anterior es equivalente al siguiente comando:

pad = ancho = 640: alto = 480: x = 0: y = 40: color = violeta

· Rellene la entrada para obtener una salida con dimensiones aumentadas en 3/2 y coloque la entrada
video en el centro del área acolchada:

pad="3/2*iw:3/2*ih:(ow-iw)/2:(oh-ih)/2"

· Rellene la entrada para obtener una salida al cuadrado con un tamaño igual al valor máximo entre
ingrese ancho y alto, y coloque el video de entrada en el centro del área acolchada:

pad = "max (iw \, ih): ow: (ow-iw) / 2: (oh-ih) / 2"

· Rellene la entrada para obtener una relación a / h final de 16: 9:

pad = "ih * 16/9: ih: (ow-iw) / 2: (oh-ih) / 2"

· En el caso de vídeo anamórfico, para configurar correctamente el aspecto de la pantalla de salida,
es necesario usar sar en la expresión, según la relación:

(ih * X / ih) * sar = salida_dar
X = salida_dar / sar

Por lo tanto, el ejemplo anterior debe modificarse para:

pad = "ih * 16/9 / sar: ih: (ow-iw) / 2: (oh-ih) / 2"

· Duplique el tamaño de salida y coloque el video de entrada en la esquina inferior derecha del
área acolchada de salida:

pad = "2 * iw: 2 * ih: ow-iw: oh-ih"

paletgen
Genere una paleta para una transmisión de video completa.

Acepta las siguientes opciones:

max_colores
Establezca el número máximo de colores para cuantificar en la paleta. Nota: la paleta
todavía contiene 256 colores; las entradas de la paleta no utilizadas serán negras.

reserva_transparente
Crea una paleta de 255 colores como máximo y reserva la última para transparencia.
Reservar el color de transparencia es útil para la optimización de GIF. Si no se configura, el
el máximo de colores en la paleta será 256. Probablemente desee deshabilitar esta opción
para una imagen independiente. Establecido por defecto.

modo_estadísticas
Establecer el modo de estadísticas.

Acepta los siguientes valores:

ser completados
Calcule histogramas de fotograma completo.

diff
Calcule histogramas solo para la parte que difiera del marco anterior. Esto podría
Ser relevante para dar más importancia a la parte móvil de su entrada si el
el fondo es estático.

El valor predeterminado es ser completados.

El filtro también exporta los metadatos del marco "lavfi.color_quant_ratio" ("nb_color_in /
nb_color_out ") que puede utilizar para evaluar el grado de cuantificación del color del
paleta. Esta información también es visible en info nivel de registro.

Ejemplos

· Genere una paleta representativa de un video dado usando ffmpeg:

ffmpeg -i entrada.mkv -vf paletagen paleta.png

paleta de colores
Utilice una paleta para reducir la resolución de un flujo de vídeo de entrada.

El filtro toma dos entradas: una secuencia de video y una paleta. La paleta debe ser un 256
imagen de píxeles.

Acepta las siguientes opciones:

dither
Seleccione el modo de difuminado. Los algoritmos disponibles son:

Bávaro
Dithering bayer ordenado de 8x8 (determinista)

heckberto
Dithering según lo definido por Paul Heckbert en 1982 (difusión de error simple). Nota:
este difuminado a veces se considera "incorrecto" y se incluye como referencia.

floyd_steinberg
Dithering de Floyd y Steingberg (difusión de errores)

sierra2
Frankie Sierra dithering v2 (difusión de errores)

sierra2_4a
Frankie Sierra dithering v2 "Lite" (difusión de errores)

El valor predeterminado es sierra2_4a.

bayer_escala
Cuándo Bávaro se selecciona el tramado, esta opción define la escala del patrón (cómo
mucho el patrón de rayado es visible). Un valor bajo significa un patrón más visible para
menos bandas y un valor más alto significan un patrón menos visible a costa de más bandas.

La opción debe ser un valor entero en el rango [0,5]. El valor predeterminado es 2.

modo_diff
Si está configurado, defina la zona a procesar

rectángulo
Solo se reprocesará el rectángulo cambiante. Esto es similar a GIF
mecanismo de compresión de recorte / compensación. Esta opción puede ser útil para la velocidad si
solo una parte de la imagen está cambiando y tiene casos de uso como limitar el alcance
de la difusión del error dither al rectángulo que delimita la escena en movimiento (es
conduce a una salida más determinista si la escena no cambia mucho, y como un
resultan menos ruido en movimiento y mejor compresión GIF).

El valor predeterminado es ninguna.

Ejemplos

· Utilice una paleta (generada, por ejemplo, con paletgen) para codificar un GIF usando ffmpeg:

ffmpeg -i input.mkv -i palette.png -lavfi paletteuse salida.gif

la perspectiva
Perspectiva correcta del video no grabado perpendicular a la pantalla.

A continuación, se incluye una descripción de los parámetros aceptados.

x0
y0
x1
y1
x2
y2
x3
y3 Establecer expresión de coordenadas para la parte superior izquierda, superior derecha, inferior izquierda e inferior derecha
esquinas. Los valores predeterminados son "0: 0: W: 0: 0: H: W: H" con la que se mantendrá la perspectiva
sin alterar. Si la opción "sentido" se establece en "fuente", los puntos especificados
ser enviado a los rincones del destino. Si la opción "sentido" está configurada en
"destino", las esquinas de la fuente se enviarán a la ubicación especificada.
coordenadas

Las expresiones pueden utilizar las siguientes variables:

W
H el ancho y alto del fotograma de video.

interpolación
Configure la interpolación para la corrección de perspectiva.

Acepta los siguientes valores:

lineal
cúbico

El valor predeterminado es lineal.

sentido
Establecer la interpretación de las opciones de coordenadas.

Acepta los siguientes valores:

0, fuente
Envíe el punto en la fuente especificada por las coordenadas dadas a las esquinas del
destino.

1, destino
Envíe las esquinas de la fuente al punto en el destino especificado por el
coordenadas dadas.

El valor predeterminado es fuente.

fase
Retrase el vídeo entrelazado un tiempo de campo para que cambie el orden de los campos.

El uso previsto es arreglar películas PAL capturadas con el campo opuesto
para la transferencia de película a video.

A continuación, se incluye una descripción de los parámetros aceptados.

modo
Establecer el modo de fase.

Acepta los siguientes valores:

t Capture el orden de campo de arriba primero, transfiera de abajo primero. El filtro retrasará el
campo inferior.

b Capture el orden de campo de abajo primero, transfiera de arriba primero. El filtro retrasará la parte superior
campo.

p Capture y transfiera con el mismo orden de campo. Este modo solo existe para
documentación de las otras opciones para consultar, pero si realmente la selecciona, la
El filtro fielmente no hará nada.

a Capturar el orden de los campos determinado automáticamente por las banderas de campo, transferir al lado opuesto.
El filtro selecciona entre t y b modos cuadro por cuadro utilizando indicadores de campo. Si
no hay información de campo disponible, entonces esto funciona igual que u.

u Captura desconocida o variable, transfiere lo opuesto. El filtro selecciona entre t y b en un
fotograma a fotograma analizando las imágenes y seleccionando la alternativa que
produce la mejor coincidencia entre los campos.

T Capture primero, transfiera desconocido o variable. El filtro selecciona entre t y p
utilizando análisis de imágenes.

B Capturar desde abajo primero, transferir desconocido o variable. El filtro selecciona entre b y p
utilizando análisis de imágenes.

A Captura determinada por banderas de campo, transferencia desconocida o variable. Filtrar selecciones
entre t, b y p utilizando indicadores de campo y análisis de imágenes. Si no hay información de campo
disponible, entonces esto funciona igual que U. Este es el modo por defecto.

U Ambos capturan y transfieren desconocidos o variables. El filtro selecciona entre t, b y p
utilizando únicamente análisis de imágenes.

prueba de píxeles
Filtro de prueba de descriptor de formato de píxel, principalmente útil para pruebas internas. El video de salida
debe ser igual al video de entrada.

Por ejemplo:

formato = monow, pixdesctest

se puede utilizar para probar la definición del descriptor de formato de píxeles monocromáticos.

pp
Habilite la cadena especificada de subfiltros de posprocesamiento mediante libpostproc. Esta biblioteca
debe seleccionarse automáticamente con una compilación GPL ("--enable-gpl"). Los subfiltros deben estar
separados por '/' y pueden desactivarse anteponiendo un '-'. Cada subfiltro y algunas opciones
tienen un nombre corto y uno largo que se pueden usar indistintamente, es decir, dr / dering son los
misma.

Los filtros aceptan las siguientes opciones:

subfiltros
Establecer cadena de subfiltros de posprocesamiento.

Todos los subfiltros comparten opciones comunes para determinar su alcance:

a / autoq
Honre los comandos de calidad para este subfiltro.

c / crom
También realice filtrado de crominancia (predeterminado).

y / nochrom
Realice únicamente filtrado de luminancia (sin crominancia).

n / noluma
Realice solo filtrado de crominancia (sin luminancia).

Estas opciones se pueden agregar después del nombre del subfiltro, separadas por un '|'.

Los subfiltros disponibles son:

hb / hdeblock [| diferencia [| planitud]]
Filtro de desbloqueo horizontal

un cambio
Factor de diferencia donde los valores más altos significan más desbloqueo (predeterminado: 32).

llanura
Umbral de planitud donde los valores más bajos significan más desbloqueo (predeterminado: 39).

vb / vdeblock [| diferencia [| planitud]]
Filtro de desbloqueo vertical

un cambio
Factor de diferencia donde los valores más altos significan más desbloqueo (predeterminado: 32).

llanura
Umbral de planitud donde los valores más bajos significan más desbloqueo (predeterminado: 39).

ha / hadeblock [| diferencia [| planitud]]
Filtro de desbloqueo horizontal preciso

un cambio
Factor de diferencia donde los valores más altos significan más desbloqueo (predeterminado: 32).

llanura
Umbral de planitud donde los valores más bajos significan más desbloqueo (predeterminado: 39).

va / vadeblock [| diferencia [| planitud]]
Filtro de desbloqueo vertical preciso

un cambio
Factor de diferencia donde los valores más altos significan más desbloqueo (predeterminado: 32).

llanura
Umbral de planitud donde los valores más bajos significan más desbloqueo (predeterminado: 39).

Los filtros de desbloqueo horizontal y vertical comparten los valores de diferencia y planitud, por lo que
no puede establecer diferentes umbrales horizontales y verticales.

h1 / x1hdeblock
Filtro de desbloqueo horizontal experimental

v1 / x1vdeblock
Filtro de desbloqueo vertical experimental

dr / dering
Filtro Deringing

tn / tmpnoise [| umbral1 [| umbral2 [| umbral3]]], temporal ruido reductor
umbral1
más grande -> filtrado más fuerte

umbral2
más grande -> filtrado más fuerte

umbral3
más grande -> filtrado más fuerte

al / autolevels [: f / rango completo], y automática brillo / contraste elimina necesidad de pilares angulados
f / rango completo
Estire la luminancia a "0-255".

lb / linblenddeint
Filtro de desentrelazado de mezcla lineal que desentrelaza el bloque dado filtrando todos
líneas con un filtro "(1 2 1)".

li / linipoldeint
Filtro de desentrelazado de interpolación lineal que desentrelaza el bloque dado por
interpolando linealmente cada segunda línea.

ci / cubicipoldeint
El filtro de desentrelazado de interpolación cúbica desentrelaza el bloque dado cúbicamente
interpolando cada segunda línea.

md / mediandeint
Filtro de desentrelazado de mediana que desentrelaza el bloque dado aplicando una mediana
filtrar a cada segunda línea.

fd / ffmpegdeint
Filtro de desentrelazado FFmpeg que desentrelaza el bloque dado filtrando cada
segunda línea con un filtro "(-1 4 2 4 -1)".

l5 / paso bajo5
Filtro de desentrelazado de paso bajo FIR aplicado verticalmente que desentrelaza el bloque dado
filtrando todas las líneas con un filtro "(-1 2 6 2 -1)".

fq / forceQuant [| cuantificador]
Anula la tabla del cuantificador de la entrada con el cuantificador constante que especifique.

cuantificador
Cuantizador para usar

de / default
Combinación de filtro de pp predeterminada ("hb | a, vb | a, dr | a")

fa / rápido
Combinación de filtro pp rápido ("h1 | a, v1 | a, dr | a")

ac Combinación de filtros pp de alta calidad ("ha | a | 128 | 7, va | a, dr | a")

Ejemplos

· Aplicar desbloqueo horizontal y vertical, deringing y brillo / contraste automático:

pp = hb / vb / dr / al

· Aplicar filtros predeterminados sin corrección de brillo / contraste:

pp = de / -al

· Aplicar filtros predeterminados y eliminador de ruido temporal:

pp = predeterminado / tmpnoise | 1 | 2 | 3

· Aplique el desbloqueo solo en la luminancia y active o desactive el desbloqueo vertical
automáticamente dependiendo del tiempo de CPU disponible:

pp = hb | y / vb | a

pp7
Aplicar filtro de posprocesamiento 7. Es una variante del spp filtro, similar a spp = 6 con 7
punto DCT, donde solo se usa la muestra central después de IDCT.

El filtro acepta las siguientes opciones:

qp Forzar un parámetro de cuantificación constante. Acepta un número entero en el rango de 0 a 63. Si
no configurado, el filtro usará el QP de la secuencia de video (si está disponible).

modo
Establecer el modo de umbral. Los modos disponibles son:

en las
Establezca umbrales estrictos.

suave
Establezca un umbral suave (mejor efecto de eliminación del timbre, pero probablemente más borroso).

mediano
Establezca un umbral medio (buenos resultados, predeterminado).

psnr
Obtenga el PSNR promedio, máximo y mínimo (relación señal pico a ruido) entre dos
videos de entrada.

Este filtro toma en la entrada dos videos de entrada, la primera entrada se considera la "principal"
source y se pasa sin cambios a la salida. La segunda entrada se utiliza como "referencia".
video para calcular el PSNR.

Ambas entradas de video deben tener la misma resolución y formato de píxel para que este filtro funcione
correctamente. También asume que ambas entradas tienen el mismo número de cuadros, que son
comparado uno por uno.

El PSNR promedio obtenido se imprime a través del sistema de registro.

El filtro almacena el MSE acumulado (error cuadrático medio) de cada cuadro, y al final
del procesamiento se promedia en todos los fotogramas por igual, y la siguiente fórmula es
aplicado para obtener el PSNR:

PSNR = 10 * log10 (MAX ^ 2 / MSE)

Donde MAX es el promedio de los valores máximos de cada componente de la imagen.

A continuación se muestra la descripción de los parámetros aceptados.

archivo de estadísticas, f
Si se especifica, el filtro utilizará el archivo con nombre para guardar el PSNR de cada individuo.
marco.

El archivo impreso si archivo_estadísticas está seleccionado, contiene una secuencia de pares clave / valor del
formulario clave:propuesta de para cada par de fotogramas comparados.

A continuación, se incluye una descripción de cada parámetro mostrado:

n número secuencial de la trama de entrada, comenzando desde 1

mse_avg
Error cuadrático medio, diferencia promedio píxel por píxel de los fotogramas comparados, promediado
sobre todos los componentes de la imagen.

mse_y, mse_u, mse_v, mse_r, mse_g, mse_g, mse_a
Error cuadrático medio de la diferencia promedio píxel por píxel de los fotogramas comparados para el
componente especificado por el sufijo.

psnr_y, psnr_u, psnr_v, psnr_r, psnr_g, psnr_b, psnr_a
Relación señal pico a ruido de los fotogramas comparados para el componente especificado por el
sufijo.

Por ejemplo:

película = ref_movie.mpg, setpts = PTS-STARTPTS [principal];
[principal] [ref] psnr = "stats_file = stats.log" [out]

En este ejemplo, el archivo de entrada que se está procesando se compara con el archivo de referencia.
ref_película.mpg. El PSNR de cada trama individual se almacena en estadísticas.log.

levantar
Filtro de inversión de pulldown (telecine inverso), capaz de manejar telecine duro mixto,
Contenido progresivo de 24000/1001 fps y progresivo de 30000/1001 fps.

El filtro pullup está diseñado para aprovechar el contexto futuro al tomar sus decisiones.
Este filtro no tiene estado en el sentido de que no se fija en un patrón a seguir, sino
en cambio, espera los siguientes campos para identificar coincidencias y reconstruir
fotogramas progresivos.

Para producir contenido con una velocidad de fotogramas uniforme, inserte el filtro fps después de la extracción, utilice
"fps = 24000/1001" si la velocidad de fotogramas de entrada es 29.97 fps, "fps = 24" para 30 fps y el (raro)
Entrada telecine a 25 fps.

El filtro acepta las siguientes opciones:

jl
jr
jt
jb Estas opciones establecen la cantidad de "basura" que se ignorará en la parte izquierda, derecha, superior e inferior
de la imagen, respectivamente. La izquierda y la derecha están en unidades de 8 píxeles, mientras que la parte superior y
la parte inferior está en unidades de 2 líneas. El valor predeterminado es de 8 píxeles en cada lado.

sb Establezca las pausas estrictas. Establecer esta opción en 1 reducirá las posibilidades de filtrar
generando un marco no coincidente ocasional, pero también puede causar un número excesivo
de fotogramas que se eliminarán durante las secuencias de alto movimiento. Por el contrario, configurándolo en -1
hará que los campos de coincidencia de filtros sean más fáciles. Esto puede ayudar a procesar el video donde
hay un ligero desenfoque entre los campos, pero también puede causar que se entrelacen
fotogramas en la salida. El valor predeterminado es 0.

mp Establezca el plano métrico que se utilizará. Acepta los siguientes valores:

l Utilice el plano de luminancia.

u Utilice un plano de croma azul.

v Utilice un plano rojo croma.

Esta opción se puede configurar para usar el plano de croma en lugar del plano de luminancia predeterminado para hacer
cálculos del filtro. Esto puede mejorar la precisión en material de origen muy limpio, pero
Es más probable que disminuya la precisión, especialmente si hay ruido cromático (arco iris
efecto) o cualquier video en escala de grises. El objetivo principal de la configuración mp a un plano cromático es
para reducir la carga de la CPU y hacer que el pullup se pueda utilizar en tiempo real en máquinas lentas.

Para obtener los mejores resultados (sin fotogramas duplicados en el archivo de salida) es necesario cambiar
la velocidad de fotogramas de salida. Por ejemplo, para invertir la entrada NTSC de telecine:

ffmpeg -i entrada -vf pullup -r 24000/1001 ...

qp
Cambie los parámetros de cuantificación de video (QP).

El filtro acepta la siguiente opción:

qp Establecer expresión para el parámetro de cuantificación.

La expresión se evalúa a través de la API eval y puede contener, entre otros, los
siguientes constantes:

conocido
1 si el índice no es 129, 0 en caso contrario.

qp Índice secuencial a partir de -129 a 128.

Ejemplos

· Alguna ecuación como:

qp = 2 + 2 * sin (PI * qp)

azar
Elimine los fotogramas de vídeo de la memoria caché interna de fotogramas en un orden aleatorio. No hay marco
descartado. Inspirado por frei0r filtro nervioso.

marcos
Establezca el tamaño en el número de fotogramas de la caché interna, en un rango de 2 a 512. El valor predeterminado es 30.

dispersores
Establecer semilla para generador de números aleatorios, debe ser un número entero incluido entre 0 y
"UINT32_MAX". Si no se especifica, o si se establece explícitamente en menos de 0, el filtro
intente utilizar una buena semilla aleatoria con el mejor esfuerzo posible.

quitar grano
El filtro removegrain es un eliminador de ruido espacial para video progresivo.

m0 Establecer modo para el primer avión.

m1 Establecer el modo para el segundo plano.

m2 Establecer el modo para el tercer plano.

m3 Modo de ajuste para el cuarto plano.

El rango de modo es de 0 a 24. A continuación se describe cada modo:

0 No modifique el plano de entrada. Defecto.

1 Recorta el píxel con el mínimo y el máximo de los 8 píxeles vecinos.

2 Recorta el píxel con el segundo mínimo y máximo de los 8 píxeles vecinos.

3 Recorta el píxel con el tercer mínimo y máximo de los 8 píxeles vecinos.

4 Recorta el píxel con el cuarto mínimo y máximo de los 8 píxeles vecinos. Esta
es equivalente a un filtro de mediana.

5 Recorte sensible a la línea que da el cambio mínimo.

6 Recorte sensible a la línea, intermedio.

7 Recorte sensible a la línea, intermedio.

8 Recorte sensible a la línea, intermedio.

9 Recorte sensible a la línea en una línea donde los píxeles vecinos son los más cercanos.

10 Reemplaza el píxel de destino con el vecino más cercano.

11 [1 2 1] desenfoque de kernel horizontal y vertical.

12 Igual que el modo 11.

13 Modo Bob, interpola el campo superior de la línea donde los píxeles vecinos son los
más cercano.

14 Modo Bob, interpola el campo inferior de la línea donde los píxeles vecinos son los
más cercano.

15 Modo Bob, interpola el campo superior. Igual que 13 pero con una interpolación más complicada
fórmula.

16 Modo Bob, interpola el campo inferior. Igual que el 14 pero con un aspecto más complicado.
fórmula de interpolación.

17 Recorta el píxel con el mínimo y el máximo de respectivamente el máximo y el mínimo
de cada par de píxeles vecinos opuestos.

18 Recorte sensible a la línea utilizando vecinos opuestos cuya mayor distancia desde el
el píxel actual es mínimo.

19 Reemplaza el píxel con el promedio de sus 8 vecinos.

20 Promedia los 9 píxeles ([1 1 1] desenfoque horizontal y vertical).

21 Recorta píxeles utilizando los promedios del vecino opuesto.

22 Igual que el modo 21 pero más sencillo y rápido.

23 Eliminación de aristas y aureolas pequeñas, pero supuestamente inútiles.

24 Similar a 23.

remover
Suprima el logotipo de una estación de TV, utilizando un archivo de imagen para determinar qué píxeles comprenden el
logo. Funciona rellenando los píxeles que componen el logotipo con píxeles vecinos.

El filtro acepta las siguientes opciones:

nombre del archivo, f
Configure el archivo de mapa de bits de filtro, que puede ser cualquier formato de imagen compatible con libavformat.
El ancho y el alto del archivo de imagen deben coincidir con los de la secuencia de video que se está
procesado.

Los píxeles de la imagen de mapa de bits proporcionada con un valor de cero no se consideran parte del
logotipo, los píxeles distintos de cero se consideran parte del logotipo. Si usa blanco (255) para el logo
y negro (0) para el resto, estarás a salvo. Para hacer el mapa de bits del filtro, es
Se recomienda tomar una captura de pantalla de un marco negro con el logotipo visible, y luego
utilizando un filtro de umbral seguido del filtro de erosión una o dos veces.

Si es necesario, las pequeñas manchas se pueden arreglar manualmente. Recuerde que si los píxeles del logotipo no están
cubierto, la calidad del filtro se reducirá mucho. Marcar demasiados píxeles como parte del
el logotipo no duele tanto, pero aumentará la cantidad de desenfoque necesario para cubrir
sobre la imagen y destruirá más información de la necesaria, y los píxeles adicionales
ralentizar las cosas en un logotipo grande.

campos repetidos
Este filtro usa el indicador repeat_field de los encabezados de Video ES y los campos de repeticiones duras
basado en su valor.

marcha atrás, areverso
Invierta un clip.

Advertencia: este filtro requiere memoria para almacenar en búfer todo el clip, por lo que se sugiere recortarlo.

Ejemplos

· Tome los primeros 5 segundos de un clip e inviértalo.

recortar = final = 5, reverso

rotar
Gire el video en un ángulo arbitrario expresado en radianes.

El filtro acepta las siguientes opciones:

A continuación, se incluye una descripción de los parámetros opcionales.

ángulo, a
Establezca una expresión para el ángulo con el que rotar el video de entrada en el sentido de las agujas del reloj,
expresado como una cantidad de radianes. Un valor negativo resultará en un sentido contrario a las agujas del reloj.
rotación. De forma predeterminada, se establece en "0".

Esta expresión se evalúa para cada fotograma.

fuera_w, ow
Establezca la expresión de ancho de salida, el valor predeterminado es "iw". Esta expresión se evalúa
solo una vez durante la configuración.

fuera_h, oh
Establezca la expresión de altura de salida, el valor predeterminado es "ih". Esta expresión se evalúa
solo una vez durante la configuración.

bilineal
Habilite la interpolación bilineal si se establece en 1, un valor de 0 la deshabilita. El valor predeterminado es
1.

color de relleno, c
Establezca el color utilizado para rellenar el área de salida que no está cubierta por la imagen girada. Para el
sintaxis general de esta opción, consulte la sección "Color" en el manual ffmpeg-utils.
Si se selecciona el valor especial "ninguno", no se imprime ningún fondo (útil para
ejemplo si el fondo nunca se muestra).

El valor predeterminado es "negro".

Las expresiones para el ángulo y el tamaño de salida pueden contener las siguientes constantes y
funciones:

n número secuencial de la trama de entrada, comenzando desde 0. Siempre es NAN antes de la
se filtra el primer fotograma.

t tiempo en segundos del marco de entrada, se establece en 0 cuando se configura el filtro. Eso
es siempre NAN antes de que se filtre el primer fotograma.

hsub
vssub
valores de submuestra de croma horizontal y vertical. Por ejemplo para el formato de píxeles
"yuv422p" hsub es 2 y vssub es 1.

en W, iw
en_h, ih
el ancho y alto del video de entrada

fuera_w, ow
fuera_h, oh
el ancho y alto de salida, que es el tamaño del área acolchada según lo especificado por el
anchura y altura expresiones

rotw (a)
roth (a)
el ancho / alto mínimo requerido para contener completamente el video de entrada girado por
a radianes

Estos solo están disponibles al calcular el fuera_w y fuera_h expresiones

Ejemplos

· Gire la entrada por PI / 6 radianes en el sentido de las agujas del reloj:

rotar = PI / 6

· Gire la entrada PI / 6 radianes en sentido antihorario:

rotar = -PI / 6

· Gire la entrada 45 grados en el sentido de las agujas del reloj:

rotar = 45 * PI / 180

· Aplicar una rotación constante con período T, partiendo de un ángulo de PI / 3:

rotar = PI / 3 + 2 * PI * t / T

· Hacer que la rotación del video de entrada oscile con un período de T segundos y una amplitud
de A radianes:

rotar = A * sin (2 * PI / T * t)

· Gire el video, el tamaño de salida se elige para que todo el video de entrada giratorio sea
siempre completamente contenido en la salida:

rotar = '2 * PI * t: ow = hypot (iw, ih): oh = ow'

· Gire el video, reduzca el tamaño de salida para que nunca se muestre el fondo:

rotar = 2 * PI * t: ow = 'min (iw, ih) /sqrt(2) ': oh = ow: c = ninguno

Comandos

El filtro admite los siguientes comandos:

a, ángulo
Establece la expresión del ángulo. El comando acepta la misma sintaxis del correspondiente
.

Si la expresión especificada no es válida, se mantiene en su valor actual.

SAB
Aplicar desenfoque adaptable a la forma.

El filtro acepta las siguientes opciones:

luma_radio, lr
Establecer la intensidad del filtro de desenfoque de luminancia, debe ser un valor en el rango de 0.1 a 4.0, el valor predeterminado es 1.0.
Un valor mayor dará como resultado una imagen más borrosa y un procesamiento más lento.

luma_pre_filter_radius, lpfr
Establecer el radio del prefiltro de luminancia, debe ser un valor en el rango de 0.1-2.0, el valor predeterminado es
1.0.

luma_fuerza, ls
Establezca la diferencia máxima de luminancia entre píxeles para que aún se considere, debe ser un valor en
el rango 0.1-100.0, el valor predeterminado es 1.0.

croma_radio, cr
Establecer la fuerza del filtro de desenfoque cromático, debe ser un valor en el rango de 0.1 a 4.0. Un mayor valor
dará como resultado una imagen más borrosa y un procesamiento más lento.

croma_pre_filtro_radio, cpfr
Establecer el radio del prefiltro de croma, debe ser un valor en el rango de 0.1 a 2.0.

croma_fuerza, cs
Establecer la diferencia máxima de croma entre píxeles para que se considere, debe ser un valor
en el rango de 0.1-100.0.

Cada valor de opción de croma, si no se especifica explícitamente, se establece en el luma correspondiente
valor de la opción.

escala
Escale (cambie el tamaño) del video de entrada, usando la biblioteca libswscale.

El filtro de escala fuerza la relación de aspecto de la pantalla de salida a ser la misma que la de entrada, por
cambiar la relación de aspecto de la muestra de salida.

Si el formato de la imagen de entrada es diferente del formato solicitado por el siguiente filtro, el
El filtro de escala convertirá la entrada al formato solicitado.

Opciones

El filtro acepta las siguientes opciones, o cualquiera de las opciones admitidas por el
escalador libswscale.

See las escalador de ffmpeg manual para obtener la lista completa de opciones de escalador.

anchura, w
altura, h
Establezca la expresión de la dimensión del video de salida. El valor predeterminado es la dimensión de entrada.

Si el valor es 0, el ancho de entrada se usa para la salida.

Si uno de los valores es -1, el filtro de escala utilizará un valor que mantenga la
relación de aspecto de la imagen de entrada, calculada a partir de la otra dimensión especificada. Si
ambos son -1, se usa el tamaño de entrada

Si uno de los valores es -n con n> 1, el filtro de escala también usará un valor que
mantiene la relación de aspecto de la imagen de entrada, calculada a partir de la otra especificada
dimensión. Después de eso, sin embargo, se asegurará de que la dimensión calculada sea
divisible por ny ajuste el valor si es necesario.

Consulte a continuación la lista de constantes aceptadas para su uso en la expresión de dimensión.

interno
Configure el modo de entrelazado. Acepta los siguientes valores:

1 Forzar escalamiento consciente entrelazado.

0 No aplique escamas entrelazadas.

-1 Seleccione el escalado consciente entrelazado en función de si los fotogramas de origen están marcados
como entrelazados o no.

El valor predeterminado es 0.

banderas
Establecer indicadores de escala libswscale. Ver las escalador de ffmpeg manual para la lista completa de
valores. Si no se especifica explícitamente, el filtro aplica las banderas predeterminadas.

tamaño, s
Establece el tamaño del video. Para conocer la sintaxis de esta opción, marque la casilla "Video Talla" . in
las utilidades ffmpeg manual.

matriz_en_color
matriz_color_fuera
Configure el tipo de espacio de color de entrada / salida YCbCr.

Esto permite anular el valor detectado automáticamente y también permite forzar una
valor específico utilizado para la salida y el codificador.

Si no se especifica, el tipo de espacio de color depende del formato de píxeles.

Valores posibles:

auto
Elija automáticamente.

bt709
Formato conforme a la Recomendación de la Unión Internacional de Telecomunicaciones (UIT)
BT.709.

fcc Establecer el espacio de color de acuerdo con la Comisión Federal de Comunicaciones de los Estados Unidos
(FCC) Código de Regulaciones Federales (CFR) Título 47 (2003) 73.682 (a).

bt601
Establecer el espacio de color conforme a:

· Recomendación BT.601 del Sector de Radiocomunicaciones de la UIT (UIT-R)

· Rec. UIT-R BT.470-6 (1998) Sistemas B, B1 y G

· Sociedad de Ingenieros de Cine y Televisión (SMPTE) ST 170: 2004

smpte240m
Configure el espacio de color de acuerdo con SMPTE ST 240: 1999.

en el rango
superar
Ajuste el rango de muestra de entrada / salida YCbCr.

Esto permite anular el valor detectado automáticamente y también permite forzar una
valor específico utilizado para la salida y el codificador. Si no se especifica, el rango depende de
el formato de píxeles. Valores posibles:

auto
Elija automáticamente.

jpeg / completo / pc
Configure el rango completo (0-255 en caso de luma de 8 bits).

mpeg / tv
Configure el rango "MPEG" (16-235 en caso de luma de 8 bits).

fuerza_original_aspect_ratio
Habilite la disminución o el aumento de la anchura o la altura del vídeo de salida si es necesario para mantener la
relación de aspecto original. Valores posibles:

inhabilitar
Escale el video como se especifica y desactive esta función.

disminuir
Las dimensiones del video de salida se reducirán automáticamente si es necesario.

incrementar
Las dimensiones del video de salida se incrementarán automáticamente si es necesario.

Un ejemplo útil de esta opción es que cuando conoces el máximo de un dispositivo específico
resolución permitida, puede usar esto para limitar la salida de video a eso, mientras
conservando la relación de aspecto. Por ejemplo, el dispositivo A permite la reproducción de 1280x720 y su
el video es de 1920x800. Usando esta opción (configúrela para disminuir) y especificando 1280x720 para
la línea de comando hace que la salida sea 1280x533.

Tenga en cuenta que esto es diferente a especificar -1 para w or h, tú todavía
es necesario especificar la resolución de salida para que funcione esta opción.

Los valores de la w y h Las opciones son expresiones que contienen las siguientes constantes:

en W
en_h
El ancho y alto de entrada

iw
ih Estos son los mismos que en W y en_h.

fuera_w
fuera_h
El ancho y alto de salida (escalados)

ow
oh Estos son los mismos que fuera_w y fuera_h

a Lo mismo que iw / ih

sar relación de aspecto de muestra de entrada

Dar La relación de aspecto de la pantalla de entrada. Calculado a partir de "(iw / ih) * sar".

hsub
vssub
valores de submuestra de croma de entrada horizontal y vertical. Por ejemplo para el pixel
formato "yuv422p" hsub es 2 y vssub es 1.

oh sub
ovsub
valores de submuestra de croma de salida horizontal y vertical. Por ejemplo para el pixel
formato "yuv422p" hsub es 2 y vssub es 1.

Ejemplos

· Escale el video de entrada a un tamaño de 200x100

escala = w = 200: h = 100

Esto es equivalente a:

escala = 200: 100

o bien:

escala = 200x100

· Especifique una abreviatura de tamaño para el tamaño de salida:

escala = qcif

que también se puede escribir como:

escala = tamaño = qcif

· Escale la entrada a 2x:

escala = w = 2 * iw: h = 2 * ih

· Lo anterior es lo mismo que:

escala = 2 * in_w: 2 * in_h

· Escale la entrada a 2x con escalado entrelazado forzado:

escala = 2 * iw: 2 * ih: interl = 1

· Escale la entrada a la mitad del tamaño:

escala = w = iw / 2: h = ih / 2

· Aumente el ancho y ajuste la altura al mismo tamaño:

escala = 3/2 * iw: ow

· Busca la armonía griega:

escala = iw: 1 / PHI * iw
escala = ih * PHI: ih

· Aumente la altura y establezca el ancho en 3/2 de la altura:

escala = w = 3/2 * oh: h = 3/5 * ih

· Aumente el tamaño, haciendo que el tamaño sea un múltiplo de los valores de la submuestra de croma:

scale = "trunc (3/2 * iw / hsub) * hsub: trunc (3/2 * ih / vsub) * vsub"

· Aumente el ancho hasta un máximo de 500 píxeles, manteniendo la misma relación de aspecto que el
entrada:

escala = w = 'min (500 \, iw * 3/2): h = -1'

Comandos

Este filtro admite los siguientes comandos:

anchura, w
altura, h
Establezca la expresión de la dimensión del video de salida. El comando acepta la misma sintaxis del
opción correspondiente.

Si la expresión especificada no es válida, se mantiene en su valor actual.

escala2ref
Escale (cambie el tamaño) del video de entrada, según un video de referencia.

Consulte el filtro de escala para ver las opciones disponibles, scale2ref admite lo mismo pero usa el
video de referencia en lugar de la entrada principal como base.

Ejemplos

· Escale un flujo de subtítulos para que coincida con el tamaño del video principal antes de superponerlo

'scale2ref [b] [a]; [a] [b] overlay'

campos separados
Los "campos separados" toman una entrada de video basada en cuadros y dividen cada cuadro en su
campos de componentes, produciendo un nuevo clip de media altura con el doble de velocidad de fotogramas y el doble
el recuento de fotogramas.

Este filtro usa información de dominio de campo en el marco para decidir cuál de cada par de
campos para colocar primero en la salida. Si se le da mal uso establecer campo filtrar antes
filtro "campos separados".

sedar, Setsar
El filtro "setdar" establece la relación de aspecto de la pantalla para el vídeo de salida del filtro.

Esto se hace cambiando la relación de aspecto de muestra (también conocida como píxel) especificada, de acuerdo con la
siguiente ecuación:

= / *

Tenga en cuenta que el filtro "setdar" no modifica las dimensiones en píxeles del video.
marco. Además, la relación de aspecto de la pantalla establecida por este filtro puede ser cambiada por filtros posteriores.
en la cadena de filtros, por ejemplo, en caso de escalado o si se utiliza otro filtro "setdar" o "setsar"
aplicado.

El filtro "setsar" establece la relación de aspecto de muestra (también conocida como píxel) para el vídeo de salida del filtro.

Tenga en cuenta que, como consecuencia de la aplicación de este filtro, el aspecto de visualización de salida
la relación cambiará de acuerdo con la ecuación anterior.

Tenga en cuenta que la relación de aspecto de muestra establecida por el filtro "setsar" puede cambiarse por
filtros posteriores en la cadena de filtros, por ejemplo, si se utiliza otro filtro "setsar" o "setdar"
aplicado.

Acepta los siguientes parámetros:

r, proporción, Dar ("setdar" solamente), sar ("setsar" solamente)
Establezca la relación de aspecto utilizada por el filtro.

El parámetro puede ser una cadena numérica de punto flotante, una expresión o una cadena del
formulario número:día, Donde número y día son el numerador y denominador de la relación de aspecto.
Si no se especifica el parámetro, se asume el valor "0". En caso de que la forma
"número:día"se utiliza, el carácter": "debe ser de escape.

max Establezca el valor entero máximo que se utilizará para expresar el numerador y el denominador cuando
reduciendo la relación de aspecto expresada a una racional. El valor predeterminado es 100.

El parámetro sar es una expresión que contiene las siguientes constantes:

E, PI, FI
Estos son valores aproximados para las constantes matemáticas e (número de Euler), pi
(Griego pi) y phi (la proporción áurea).

w, h
El ancho y alto de entrada.

a Estos son los mismos que w / h.

sar La relación de aspecto de la muestra de entrada.

Dar La relación de aspecto de la pantalla de entrada. Es lo mismo que (w / h) * sar.

sub, vssub
Valores de submuestra de croma horizontal y vertical. Por ejemplo, para el formato de píxeles
"yuv422p" hsub es 2 y vssub es 1.

Ejemplos

· Para cambiar la relación de aspecto de la pantalla a 16: 9, especifique una de las siguientes opciones:

setdar = dar = 1.77777
setdar = dar = 16/9
setdar = dar = 1.77777

· Para cambiar la relación de aspecto de la muestra a 10:11, especifique:

setsar = sar = 10/11

· Para establecer una relación de aspecto de pantalla de 16: 9 y especificar un valor entero máximo de 1000 en
la reducción de la relación de aspecto, use el comando:

setdar = ratio = 16/9: max = 1000

establecer campo
Campo de fuerza para el fotograma de vídeo de salida.

El filtro "setfield" marca el campo de tipo entrelazado para los fotogramas de salida. No es asi
cambiar el marco de entrada, pero solo establece la propiedad correspondiente, que afecta la forma en que
El marco se trata con los siguientes filtros (por ejemplo, "fieldorder" o "yadif").

El filtro acepta las siguientes opciones:

modo
Los valores disponibles son:

auto
Mantenga la misma propiedad de campo.

bff Marque el marco como el campo inferior primero.

tff Marque el marco como el campo superior primero.

prog
Marque el cuadro como progresivo.

showinfo
Muestra una línea que contiene información diversa para cada fotograma de vídeo de entrada. El video de entrada es
no modificado.

La línea mostrada contiene una secuencia de pares clave / valor de la forma clave:propuesta de.

Los siguientes valores se muestran en la salida:

n El número (secuencial) del marco de entrada, comenzando desde 0.

pts El TimeStamp de presentación del marco de entrada, expresado como un número de base de tiempo
unidades. La unidad de base de tiempo depende de la almohadilla de entrada del filtro.

hora_pts
El TimeStamp de presentación del marco de entrada, expresado como un número de segundos.

pos La posición del marco en el flujo de entrada, o -1 si esta información es
no disponible y / o sin sentido (por ejemplo, en el caso de un video sintético).

fmt El nombre del formato de píxeles.

sar La relación de aspecto de muestra del fotograma de entrada, expresada en la forma número/día.

s El tamaño del marco de entrada. Para conocer la sintaxis de esta opción, marque la casilla "Video Talla"
. in las utilidades ffmpeg manual.

i El tipo de modo entrelazado ("P" para "progresivo", "T" para el campo superior primero, "B" para
campo inferior primero).

es clave
Este es 1 si el fotograma es un fotograma clave, 0 en caso contrario.

tipo
El tipo de imagen del cuadro de entrada ("I" para un cuadro I, "P" para un cuadro P, "B" para un
B-frame, o "?" para un tipo desconocido). Consulte también la documentación del
Enumeración "AVPictureType" y de la función "av_get_picture_type_char" definida en
libavutil / avutil.h.

suma de comprobación
La suma de comprobación de Adler-32 (impresa en hexadecimal) de todos los planos del marco de entrada.

suma_de_comprobación del avión
La suma de comprobación Adler-32 (impresa en hexadecimal) de cada plano del marco de entrada,
expresado en la forma "[c0 c1 c2 c3] ".

paleta de colores
Muestra la paleta de 256 colores de cada fotograma. Este filtro solo es relevante para pal8 píxel
marcos de formato.

Acepta la siguiente opción:

s Establezca el tamaño del cuadro utilizado para representar una entrada de color de paleta. El valor predeterminado es 30 (para
un cuadro de píxeles de "30x30").

aviones aleatorios
Reordenar y / o duplicar planos de video.

Acepta los siguientes parámetros:

map0
El índice del plano de entrada que se utilizará como primer plano de salida.

map1
El índice del plano de entrada que se utilizará como segundo plano de salida.

map2
El índice del plano de entrada que se utilizará como tercer plano de salida.

map3
El índice del plano de entrada que se utilizará como cuarto plano de salida.

El primer plano tiene el índice 0. El valor predeterminado es mantener la entrada sin cambios.

Intercambia el segundo y tercer plano de la entrada:

ffmpeg -i ENTRADA -vf planos aleatorios = 0: 2: 1: 3 SALIDA

estadísticas de señales
Evaluar varias métricas visuales que ayudan a determinar los problemas asociados con el
digitalización de medios de video analógicos.

De forma predeterminada, el filtro registrará estos valores de metadatos:

YMIN
Muestra el valor Y mínimo contenido en el marco de entrada. Expresado en el rango de
[0-255].

AMARILLO
Muestre el valor Y en el percentil del 10% dentro del marco de entrada. Expresado en rango
de [0-255].

YAVG
Muestra el valor Y medio dentro del marco de entrada. Expresado en el rango [0-255].

ALTO
Muestre el valor Y en el percentil del 90% dentro del marco de entrada. Expresado en rango
de [0-255].

YMAX
Muestra el valor Y máximo contenido dentro del marco de entrada. Expresado en el rango de
[0-255].

UMIN
Muestra el valor U mínimo contenido en el marco de entrada. Expresado en el rango de
[0-255].

BAJO
Muestre el valor U en el percentil del 10% dentro del marco de entrada. Expresado en rango
de [0-255].

UAVG
Muestra el valor U promedio dentro del marco de entrada. Expresado en el rango [0-255].

ALTO
Muestre el valor U en el percentil del 90% dentro del marco de entrada. Expresado en rango
de [0-255].

UMAX
Muestra el valor U máximo contenido en el marco de entrada. Expresado en el rango de
[0-255].

VMIN
Muestra el valor V mínimo contenido en el marco de entrada. Expresado en el rango de
[0-255].

V BAJO
Muestre el valor V en el percentil del 10% dentro del marco de entrada. Expresado en rango
de [0-255].

VAVG
Muestra el valor V promedio dentro del marco de entrada. Expresado en el rango [0-255].

V ALTA
Muestre el valor V en el percentil del 90% dentro del marco de entrada. Expresado en rango
de [0-255].

Vmax
Muestra el valor V máximo contenido en el marco de entrada. Expresado en el rango de
[0-255].

SATMIN
Muestra el valor de saturación mínimo contenido en el marco de entrada. Expresado en
rango de [0- ~ 181.02].

SATLOW
Muestra el valor de saturación en el percentil del 10% dentro del marco de entrada. Expresado
en el rango de [0- ~ 181.02].

SATAVG
Muestra el valor de saturación promedio dentro del marco de entrada. Expresado en el rango de
[0- ~ 181.02].

SAHIGH
Muestra el valor de saturación en el percentil del 90% dentro del marco de entrada. Expresado
en el rango de [0- ~ 181.02].

SATMAX
Muestra el valor de saturación máximo contenido en el marco de entrada. Expresado en
rango de [0- ~ 181.02].

HUMEDO
Muestra el valor mediano del tono dentro del marco de entrada. Expresado en el rango de
[0-360].

HUEAVG
Muestra el valor medio del tono dentro del marco de entrada. Expresado en el rango de
[0-360].

YDIF
Muestra el promedio de la diferencia de valor de muestra entre todos los valores del plano Y en
el fotograma actual y los valores correspondientes del fotograma de entrada anterior. Expresado en
rango de [0-255].

UDIF
Muestra el promedio de la diferencia de valor de muestra entre todos los valores del plano U en
el fotograma actual y los valores correspondientes del fotograma de entrada anterior. Expresado en
rango de [0-255].

VDIF
Muestra el promedio de la diferencia de valor de muestra entre todos los valores del plano V en
el fotograma actual y los valores correspondientes del fotograma de entrada anterior. Expresado en
rango de [0-255].

El filtro acepta las siguientes opciones:

stat
salir stat especificar una forma adicional de análisis de imágenes. salir salida de video con el
tipo de píxel especificado resaltado.

Ambas opciones aceptan los siguientes valores:

tout
Identificar temporal outliers píxeles. A temporal atípico es un píxel a diferencia del
píxeles vecinos del mismo campo. Ejemplos de valores atípicos temporales incluyen
resultados de pérdidas de video, obstrucciones en la cabeza o problemas de seguimiento de la cinta.

Vrep
Identificar vertical línea repetición. La repetición de líneas verticales incluye filas similares
de píxeles dentro de un marco. En video nato digital, la repetición de línea vertical es
común, pero este patrón es poco común en video digitalizado desde una fuente analógica.
Cuando ocurre en un video que resulta de la digitalización de una fuente analógica,
puede indicar ocultación de un compensador de deserción.

traer
Identifique los píxeles que se encuentran fuera del rango de transmisión legal.

color, c
Establezca el color de resaltado para el salir opción. El color predeterminado es el amarillo.

Ejemplos

· Salida de datos de varias métricas de video:

ffprobe -f lavfi movie = example.mov, signalstats = "stat = tout + vrep + brng" -show_frames

· Salida de datos específicos sobre los valores mínimo y máximo del plano Y por fotograma:

ffprobe -f lavfi movie = example.mov, signalstats -show_entries frame_tags = lavfi.signalstats.YMAX, lavfi.signalstats.YMIN

· Reproduzca el video mientras resalta los píxeles que están fuera del rango de transmisión en rojo.

ffplay example.mov -vf signalstats = "out = brng: color = red"

· Reproducción de video con metadatos de signalstats dibujados sobre el marco.

ffplay example.mov -vf signalstats = stat = brng + vrep + tout, drawtext = fontfile = FreeSerif.ttf: textfile = signalstat_drawtext.txt

El contenido de signalstat_drawtext.txt usado en el comando es:

tiempo% {pts: hms}
Y (% {metadata: lavfi.signalstats.YMIN} -% {metadata: lavfi.signalstats.YMAX})
U (% {metadata: lavfi.signalstats.UMIN} -% {metadata: lavfi.signalstats.UMAX})
V (% {metadata: lavfi.signalstats.VMIN} -% {metadata: lavfi.signalstats.VMAX})
saturación máxima:% {metadata: lavfi.signalstats.SATMAX}

Smartblur
Difumina el video de entrada sin afectar los contornos.

Acepta las siguientes opciones:

luma_radio, lr
Establezca el radio de luminancia. El valor de la opción debe ser un número flotante en el rango [0.1,5.0]
que especifica la variación del filtro gaussiano utilizado para desenfocar la imagen (más lento si
más grande). El valor predeterminado es 1.0.

luma_fuerza, ls
Establezca la intensidad de la luminancia. El valor de la opción debe ser un número flotante en el rango [-1.0,1.0]
que configura el desenfoque. Un valor incluido en [0.0,1.0] desenfocará la imagen.
mientras que un valor incluido en [-1.0,0.0] agudizará la imagen. El valor predeterminado es 1.0.

luma_umbral, lt
Establezca el umbral de luminancia utilizado como coeficiente para determinar si un píxel debe
borrosa o no. El valor de la opción debe ser un número entero en el rango [-30,30]. Un valor de
0 filtrará toda la imagen, un valor incluido en [0,30] filtrará áreas planas y un
el valor incluido en [-30,0] filtrará los bordes. El valor predeterminado es 0.

croma_radio, cr
Establece el radio de croma. El valor de la opción debe ser un número flotante en el rango [0.1,5.0]
que especifica la variación del filtro gaussiano utilizado para desenfocar la imagen (más lento si
más grande). El valor predeterminado es 1.0.

croma_fuerza, cs
Establece la intensidad del croma. El valor de la opción debe ser un número flotante en el rango
[-1.0,1.0] que configura el desenfoque. Un valor incluido en [0.0,1.0] desenfocará la
imagen mientras que un valor incluido en [-1.0,0.0] agudizará la imagen. El valor predeterminado es
1.0.

croma_umbral, ct
Establezca el umbral de croma utilizado como coeficiente para determinar si un píxel debe
borrosa o no. El valor de la opción debe ser un número entero en el rango [-30,30]. Un valor de
0 filtrará toda la imagen, un valor incluido en [0,30] filtrará áreas planas y un
el valor incluido en [-30,0] filtrará los bordes. El valor predeterminado es 0.

Si una opción de croma no se establece explícitamente, se establece el valor de luminancia correspondiente.

SIM
Obtenga el SSIM (métrica de similitud estructural) entre dos videos de entrada.

Este filtro toma en la entrada dos videos de entrada, la primera entrada se considera la "principal"
source y se pasa sin cambios a la salida. La segunda entrada se utiliza como "referencia".
video para calcular el SSIM.

Ambas entradas de video deben tener la misma resolución y formato de píxel para que este filtro funcione
correctamente. También asume que ambas entradas tienen el mismo número de cuadros, que son
comparado uno por uno.

El filtro almacena el SSIM calculado de cada trama.

A continuación se muestra la descripción de los parámetros aceptados.

archivo de estadísticas, f
Si se especifica, el filtro utilizará el archivo con nombre para guardar el SSIM de cada individuo
marco.

El archivo impreso si archivo_estadísticas está seleccionado, contiene una secuencia de pares clave / valor del
formulario clave:propuesta de para cada par de fotogramas comparados.

A continuación, se incluye una descripción de cada parámetro mostrado:

n número secuencial de la trama de entrada, comenzando desde 1

Y, U, V, R, G, B
SSIM de las tramas comparadas para el componente especificado por el sufijo.

Todos SSIM de los fotogramas comparados para todo el fotograma.

dB Igual que el anterior pero en representación de dB.

Por ejemplo:

película = ref_movie.mpg, setpts = PTS-STARTPTS [principal];
[principal] [ref] ssim = "stats_file = stats.log" [out]

En este ejemplo, el archivo de entrada que se está procesando se compara con el archivo de referencia.
ref_película.mpg. El SSIM de cada trama individual se almacena en estadísticas.log.

Otro ejemplo con psnr y ssim al mismo tiempo:

ffmpeg -i main.mpg -i ref.mpg -lavfi "ssim; [0: v] [1: v] psnr" -f null -

estereo3d
Convierte entre diferentes formatos de imagen estereoscópica.

Los filtros aceptan las siguientes opciones:

in Configure el formato de imagen estereoscópico de entrada.

Los valores disponibles para los formatos de imagen de entrada son:

sbl
lado a lado paralelo (ojo izquierdo izquierdo, ojo derecho derecho)

sorber
ojo cruzado lado a lado (ojo derecho izquierdo, ojo izquierdo derecho)

sbs2l
lado a lado paralelo con resolución de medio ancho (ojo izquierdo izquierdo, ojo derecho derecho)

sbs2r
ojo cruzado de lado a lado con resolución de ancho medio (ojo derecho a la izquierda, ojo izquierdo a la derecha)

abl arriba-abajo (ojo izquierdo arriba, ojo derecho abajo)

abr arriba-abajo (ojo derecho arriba, ojo izquierdo abajo)

ab2l
arriba-abajo con resolución de media altura (ojo izquierdo arriba, ojo derecho abajo)

ab2r
arriba-abajo con resolución de media altura (ojo derecho arriba, ojo izquierdo abajo)

al fotogramas alternos (ojo izquierdo primero, ojo derecho segundo)

ar fotogramas alternos (ojo derecho primero, ojo izquierdo segundo)

El valor predeterminado es sbl.

salir Configure el formato de salida de imagen estereoscópica.

Los valores disponibles para los formatos de imagen de salida son todos los formatos de entrada, así como:

arbitraria
anaglifo rojo / azul gris (filtro rojo en el ojo izquierdo, filtro azul en el ojo derecho)

argg
anaglifo rojo / verde gris (filtro rojo en el ojo izquierdo, filtro verde en el ojo derecho)

arco
rojo anaglifo / gris cian (filtro rojo en el ojo izquierdo, filtro cian en el ojo derecho)

arco
anaglifo rojo / cian medio coloreado (filtro rojo en el ojo izquierdo, filtro cian en el ojo derecho)

arco
Anaglifo rojo / color cian (filtro rojo en el ojo izquierdo, filtro cian en el ojo derecho)

arco
Anaglifo rojo / color cian optimizado con la proyección de mínimos cuadrados de dubois (rojo
filtro en el ojo izquierdo, filtro cian en el ojo derecho)

Agmg
verde anaglifo / gris magenta (filtro verde en el ojo izquierdo, filtro magenta en el derecho
ojo)

agmh
anaglifo verde / magenta medio coloreado (filtro verde en el ojo izquierdo, filtro magenta en
Ojo derecho)

agmc
anaglifo verde / magenta (filtro verde en el ojo izquierdo, filtro magenta en el derecho
ojo)

agdm
color anaglifo verde / magenta optimizado con la proyección de mínimos cuadrados de dubois
(filtro verde en el ojo izquierdo, filtro magenta en el ojo derecho)

aybg
anaglifo amarillo / azul gris (filtro amarillo en el ojo izquierdo, filtro azul en el ojo derecho)

aybh
anaglifo amarillo / azul medio coloreado (filtro amarillo en el ojo izquierdo, filtro azul en el derecho
ojo)

aybc
anaglifo de color amarillo / azul (filtro amarillo en el ojo izquierdo, filtro azul en el ojo derecho)

aybd
color anaglifo amarillo / azul optimizado con la proyección de mínimos cuadrados de dubois
(filtro amarillo en el ojo izquierdo, filtro azul en el ojo derecho)

IRL filas intercaladas (el ojo izquierdo tiene la fila superior, el ojo derecho comienza en la siguiente fila)

irr filas intercaladas (el ojo derecho tiene la fila superior, el ojo izquierdo comienza en la siguiente fila)

ml salida mono (solo ojo izquierdo)

mr salida mono (solo ojo derecho)

El valor predeterminado es arco.

Ejemplos

· Convierte vídeo de entrada de lado a lado paralelo a anaglifo dubois amarillo / azul:

stereo3d = sbsl: aybd

· Convierte el video de entrada desde arriba hacia abajo (ojo izquierdo arriba, ojo derecho abajo) a lado a lado
bizco.

stereo3d = abl: sbsr

spp
Aplique un filtro de posprocesamiento simple que comprima y descomprima la imagen en varios
(o - en el caso de calidad nivel 6 - todos) turnos y promediar los resultados.

El filtro acepta las siguientes opciones:

calidad
Establecer la calidad. Esta opción define el número de niveles para promediar. Acepta un
entero en el rango 0-6. Si se establece en 0, el filtro no tendrá ningún efecto. Un valor de 6
significa la mayor calidad. Por cada incremento de ese valor, la velocidad cae en un factor.
de aproximadamente 2. El valor predeterminado es 3.

qp Forzar un parámetro de cuantificación constante. Si no se configura, el filtro usará el QP de
la secuencia de video (si está disponible).

modo
Establecer el modo de umbral. Los modos disponibles son:

en las
Establecer umbral estricto (predeterminado).

suave
Establezca un umbral suave (mejor efecto de eliminación del timbre, pero probablemente más borroso).

use_bframe_qp
Habilite el uso de QP desde B-Frames si está configurado en 1. El uso de esta opción puede causar
parpadeo, ya que los fotogramas B suelen tener un QP más grande. El valor predeterminado es 0 (no habilitado).

subtítulos
Dibuja subtítulos en la parte superior del video de entrada usando la biblioteca libass.

Para habilitar la compilación de este filtro, debe configurar FFmpeg con "--enable-libass".
Este filtro también requiere una compilación con libavcodec y libavformat para convertir el
archivo de subtítulos al formato de subtítulos ASS (Advanced Substation Alpha).

El filtro acepta las siguientes opciones:

nombre del archivo, f
Establezca el nombre de archivo del archivo de subtítulos para leer. Debe especificarse.

tamaño original
Especifique el tamaño del video original, el video para el cual se compuso el archivo ASS.
Para conocer la sintaxis de esta opción, marque la casilla "Video Talla" . in las utilidades ffmpeg
manual. Debido a un diseño incorrecto en la aritmética de la relación de aspecto ASS, esto es necesario para
escale correctamente las fuentes si se ha cambiado la relación de aspecto.

fuentesdir
Establezca una ruta de directorio que contenga fuentes que el filtro pueda utilizar. Estas fuentes
se utilizará además de lo que utilice el proveedor de fuentes.

Charenc
Configure la codificación de caracteres de entrada de subtítulos. filtro "subtítulos" solamente. Solo es útil si no
UTF-8.

flujo_índice, si
Establecer el índice de flujo de subtítulos. filtro "subtítulos" solamente.

estilo_fuerza
Anula los parámetros predeterminados de información de estilo o guión de los subtítulos. Acepta una cadena
que contiene el formato de estilo ASS "KEY = VALUE" parejas separadas por ",".

Si no se especifica la primera clave, se supone que el primer valor especifica la
nombre de archivo.

Por ejemplo, para renderizar el archivo sub.srt en la parte superior del video de entrada, use el comando:

subtítulos = sub.srt

que es equivalente a:

subtítulos = nombre de archivo = sub.srt

Para renderizar la secuencia de subtítulos predeterminada desde el archivo video.mkv, Use:

subtítulos = video.mkv

Para renderizar la segunda secuencia de subtítulos de ese archivo, use:

subtítulos = video.mkv: si = 1

Para hacer que los subtítulos fluyan desde sub.srt aparecen en verde transparente "DejaVu Serif", utilice:

subtítulos = sub.srt: force_style = 'FontName = DejaVu Serif, PrimaryColour = & HAA00FF00'

super2xsai
Escale la entrada 2x y suavícela usando el pixel art Super2xSaI (Escalar e Interpolar)
algoritmo de escalado.

Útil para ampliar imágenes de pixel art sin reducir la nitidez.

Swapuv
Intercambiar plano U & V.

telecine
Aplicar el proceso de telecine al video.

Este filtro acepta las siguientes opciones:

primer_campo
parte superior, t
campo superior primero

fondo, b
campo inferior primero El valor predeterminado es "superior".

patrón
Una serie de números que representan el patrón desplegable que desea aplicar. El valor por defecto
el valor es 23.

Algunos patrones típicos:

Salida NTSC (30i):
27.5p: 32222
24p: 23 (clásico)
24p: 2332 (preferido)
20p: 33
18p: 334
16p: 3444

Salida PAL (25i):
27.5p: 12222
24p: 222222222223 ("Euro pulldown")
16.67p: 33
16p: 33333334

uña del pulgar
Seleccione el fotograma más representativo en una secuencia determinada de fotogramas consecutivos.

El filtro acepta las siguientes opciones:

n Configure el tamaño del lote de cuadros para analizar; en un conjunto de n marcos, el filtro seleccionará uno
de ellos, y luego manejar el siguiente lote de n marcos hasta el final. El valor predeterminado es 100.

Dado que el filtro realiza un seguimiento de toda la secuencia de fotogramas, una mayor n el valor resultará en
un mayor uso de memoria, por lo que no se recomienda un valor alto.

Ejemplos

· Extrae una imagen cada 50 cuadros:

miniatura = 50

· Ejemplo completo de creación de una miniatura con ffmpeg:

ffmpeg -i in.avi -vf miniatura, escala = 300: 200 -frames: v 1 out.png

azulejo
Mosaico de varios fotogramas sucesivos juntos.

El filtro acepta las siguientes opciones:

diseño
Establezca el tamaño de la cuadrícula (es decir, el número de líneas y columnas). Para la sintaxis de este
opción, marque la "Video Talla" . in las utilidades ffmpeg manual.

nb_frames
Establezca el número máximo de fotogramas para renderizar en el área dada. Debe ser menor que o
igual a wxh. El valor predeterminado es 0, lo que significa que se utilizará toda el área.

margen
Establezca el margen del borde exterior en píxeles.

relleno
Establezca el grosor del borde interior (es decir, el número de píxeles entre fotogramas). Para más
opciones de relleno avanzadas (como tener diferentes valores para los bordes), consulte la
filtro de video pad.

Color
Especifique el color del área no utilizada. Para conocer la sintaxis de esta opción, marque la casilla "Color"
sección en el manual ffmpeg-utils. El valor predeterminado de Color es negro".

Ejemplos

· Produce mosaicos PNG de 8x8 de todos los fotogramas clave (-skip_frame no hay llave) en una película:

ffmpeg -skip_frame nokey -i file.avi -vf 'scale = 128: 72, tile = 8x8' -an -vsync 0 keyframes% 03d.png

El -vsync 0 es necesario prevenir ffmpeg desde duplicar cada fotograma de salida hasta
adaptarse a la velocidad de fotogramas detectada originalmente.

· Muestra 5 imágenes en un área de fotogramas "3x2", con 7 píxeles entre ellas, y 2
píxeles de margen inicial, utilizando opciones planas mixtas y con nombre:

tile=3x2:nb_frames=5:padding=7:margin=2

entrelazar
Realice varios tipos de entrelazado de campos temporales.

Los fotogramas se cuentan a partir de 1, por lo que el primer fotograma de entrada se considera impar.

El filtro acepta las siguientes opciones:

modo
Especifique el modo del entrelazado. Esta opción también se puede especificar como un valor
solo. Consulte a continuación una lista de valores para esta opción.

Los valores disponibles son:

unir, 0
Mueva los fotogramas impares al campo superior, incluso al campo inferior, generando una
fotograma de doble altura a la mitad de la velocidad de fotogramas.

------> tiempo
Entrada:
Cuadro 1 Cuadro 2 Cuadro 3 Cuadro 4

11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444

Salida:
11111 33333
22222 44444
11111 33333
22222 44444
11111 33333
22222 44444
11111 33333
22222 44444

soltar_impar, 1
Solo se generan cuadros pares, los cuadros impares se eliminan, lo que genera un cuadro sin cambios
altura a la mitad de la velocidad de fotogramas.

------> tiempo
Entrada:
Cuadro 1 Cuadro 2 Cuadro 3 Cuadro 4

11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444

Salida:
22222 44444
22222 44444
22222 44444
22222 44444

dejar caer incluso, 2
Solo se generan cuadros impares, los cuadros pares se eliminan, lo que genera un cuadro sin cambios
altura a la mitad de la velocidad de fotogramas.

------> tiempo
Entrada:
Cuadro 1 Cuadro 2 Cuadro 3 Cuadro 4

11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444

Salida:
11111 33333
11111 33333
11111 33333
11111 33333

almohadilla, 3
Expanda cada fotograma a la altura completa, pero rellene las líneas alternas con negro, generando un
fotograma con doble altura a la misma velocidad de fotogramas de entrada.

------> tiempo
Entrada:
Cuadro 1 Cuadro 2 Cuadro 3 Cuadro 4

11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444

Salida:
11111 ..... 33333 .....
..... 22222 ..... 44444
11111 ..... 33333 .....
..... 22222 ..... 44444
11111 ..... 33333 .....
..... 22222 ..... 44444
11111 ..... 33333 .....
..... 22222 ..... 44444

interleave_top, 4
Intercalar el campo superior de los fotogramas impares con el campo inferior de los fotogramas pares,
generando un fotograma con una altura sin cambios a la mitad de la velocidad de fotogramas.

------> tiempo
Entrada:
Cuadro 1 Cuadro 2 Cuadro 3 Cuadro 4

11111 <- 22222 33333 <- 44444
11111 22222 <- 33333 44444 <-
11111 <- 22222 33333 <- 44444
11111 22222 <- 33333 44444 <-

Salida:
11111 33333
22222 44444
11111 33333
22222 44444

interleave_bottom, 5
Intercalar el campo inferior de los fotogramas impares con el campo superior de los fotogramas pares,
generando un fotograma con una altura sin cambios a la mitad de la velocidad de fotogramas.

------> tiempo
Entrada:
Cuadro 1 Cuadro 2 Cuadro 3 Cuadro 4

11111 22222 <- 33333 44444 <-
11111 <- 22222 33333 <- 44444
11111 22222 <- 33333 44444 <-
11111 <- 22222 33333 <- 44444

Salida:
22222 44444
11111 33333
22222 44444
11111 33333

entrelazadox2, 6
Velocidad de fotogramas doble con altura sin cambios. Se insertan marcos, cada uno de los cuales contiene el
segundo campo temporal del marco de entrada anterior y el primer campo temporal
desde el siguiente fotograma de entrada. Este modo se basa en el indicador top_field_first. Útil
para pantallas de video entrelazadas sin sincronización de campo.

------> tiempo
Entrada:
Cuadro 1 Cuadro 2 Cuadro 3 Cuadro 4

11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444
11111 22222 33333 44444

Salida:
11111 22222 22222 33333 33333 44444 44444
11111 11111 22222 22222 33333 33333 44444
11111 22222 22222 33333 33333 44444 44444
11111 11111 22222 22222 33333 33333 44444

Los valores numéricos están en desuso, pero se aceptan por razones de compatibilidad con versiones anteriores.

El modo predeterminado es "fusionar".

banderas
Especifique las banderas que influyen en el proceso de filtrado.

Valor disponible para banderas :

filtro de paso bajo, vlfp
Habilite el filtrado de paso bajo vertical en el filtro. El filtrado de paso bajo vertical es
necesario al crear un destino entrelazado a partir de una fuente progresiva que
contiene detalles verticales de alta frecuencia. El filtrado reducirá el 'twitter' entrelazado
y patrones de muaré.

El filtrado de paso bajo vertical solo se puede habilitar para modo interleave_top y
interleave_bottom.

transponer
Transpone filas con columnas en el video de entrada y, opcionalmente, dale la vuelta.

Acepta los siguientes parámetros:

dir Especifique la dirección de transposición.

Puede asumir los siguientes valores:

0, 4, cclock_flip
Girar 90 grados en sentido antihorario y voltear verticalmente (predeterminado), es decir:

LR Ll
. . ->. .
lr Rr

1, 5, reloj
Gire 90 grados en el sentido de las agujas del reloj, es decir:

LR lL
. . ->. .
lr rR

2, 6, llave inglesa
Gire 90 grados en sentido antihorario, es decir:

LR Rr
. . ->. .
lr Ll

3, 7, reloj_flip
Gire 90 grados en el sentido de las agujas del reloj y voltee verticalmente, es decir:

LR rR
. . ->. .
lr lL

Para valores entre 4-7, la transposición solo se realiza si la geometría del video de entrada es
retrato y no paisaje. Estos valores están obsoletos, la opción "traspaso"
debe usarse en su lugar.

Los valores numéricos están en desuso y deberían descartarse en favor de las constantes simbólicas.

passthrough
No aplique la transposición si la geometría de entrada coincide con la especificada por el
valor específico. Acepta los siguientes valores:

ninguna
Aplique siempre la transposición.

retrato
Conservar la geometría del retrato (cuando altura >= anchura).

paisaje
Conservar la geometría del paisaje (cuando anchura >= altura).

El valor predeterminado es "ninguno".

Por ejemplo, para rotar 90 grados en el sentido de las agujas del reloj y conservar el diseño vertical:

transponer = dir = 1: passthrough = retrato

El comando anterior también se puede especificar como:

transpose = 1: retrato

recortar
Recorte la entrada para que la salida contenga una subparte continua de la entrada.

Acepta los siguientes parámetros:

comienzo
Especifique la hora del inicio de la sección guardada, es decir, el marco con la marca de tiempo
comienzo será el primer fotograma de la salida.

final Especifique la hora del primer fotograma que se eliminará, es decir, el fotograma inmediatamente
precede al que tiene la marca de tiempo final será el último fotograma de la salida.

puntos_inicio
Esto es lo mismo que comienzo, excepto que esta opción establece la marca de tiempo de inicio en la base de tiempo
unidades en lugar de segundos.

puntos_finales
Esto es lo mismo que final, excepto que esta opción establece la marca de tiempo de finalización en unidades de base de tiempo
en lugar de segundos.

duración
La duración máxima de la salida en segundos.

marco_de_inicio
El número del primer fotograma que se debe pasar a la salida.

marco_final
El número del primer fotograma que se debe descartar.

comienzo, finaly duración se expresan como especificaciones de duración de tiempo; ver las Horario
duración . in las utilidades ffmpeg(1) manual para la sintaxis aceptada.

Tenga en cuenta que los dos primeros conjuntos de opciones de inicio / fin y duración opción mira la
la marca de tiempo del fotograma, mientras que las variantes _frame simplemente cuentan los fotogramas que pasan por el
filtrar. También tenga en cuenta que este filtro no modifica las marcas de tiempo. Si desea el
marcas de tiempo de salida para comenzar en cero, inserte un filtro de configuración después del filtro de ajuste.

Si se establecen varias opciones de inicio o fin, este filtro intenta ser codicioso y mantener todos los
fotogramas que coinciden con al menos una de las restricciones especificadas. Para mantener solo la parte que
coincide con todas las restricciones a la vez, encadena varios filtros de recorte.

Los valores predeterminados son tales que se conservan todas las entradas. Por lo tanto, es posible establecer, por ejemplo, solo el
valores finales para mantener todo antes de la hora especificada.

Ejemplos:

· Suelta todo excepto el segundo minuto de entrada:

ffmpeg -i ENTRADA -vf recorte = 60: 120

· Conserve solo el primer segundo:

ffmpeg -i ENTRADA -vf recorte = duración = 1

desenfoque
Agudiza o difumina el video de entrada.

Acepta los siguientes parámetros:

luma_msize_x, lx
Establezca el tamaño horizontal de la matriz de luminancia. Debe ser un número entero impar entre 3 y 63. El
el valor predeterminado es 5.

luma_msize_y, ly
Establezca el tamaño vertical de la matriz de luminancia. Debe ser un número entero impar entre 3 y 63. El
el valor predeterminado es 5.

luma_cantidad, la
Establezca la intensidad del efecto de luminancia. Debe ser un número de coma flotante, valores razonables
se sitúa entre -1.5 y 1.5.

Los valores negativos desenfocarán el video de entrada, mientras que los valores positivos lo agudizarán, un
valor de cero desactivará el efecto.

El valor predeterminado es 1.0.

croma_msize_x, cx
Establezca el tamaño horizontal de la matriz de croma. Debe ser un número entero impar entre 3 y 63. El
el valor predeterminado es 5.

croma_msize_y, cy
Establezca el tamaño vertical de la matriz de croma. Debe ser un número entero impar entre 3 y 63. El
el valor predeterminado es 5.

cantidad_croma, ca
Establezca la intensidad del efecto de croma. Debe ser un número de coma flotante, valores razonables
se sitúa entre -1.5 y 1.5.

Los valores negativos desenfocarán el video de entrada, mientras que los valores positivos lo agudizarán, un
valor de cero desactivará el efecto.

El valor predeterminado es 0.0.

OpenCL
Si se establece en 1, especifique el uso de capacidades OpenCL, solo disponible si FFmpeg fue
configurado con "--enable-opencl". El valor predeterminado es 0.

Todos los parámetros son opcionales y por defecto equivalen a la cadena '5: 5: 1.0: 5: 5: 0.0'.

Ejemplos

· Aplicar un fuerte efecto de nitidez de luma:

unsharp = luma_msize_x = 7: luma_msize_y = 7: luma_amount = 2.5

· Aplique un fuerte desenfoque de los parámetros de luminancia y crominancia:

unsharp=7:7:-2:7:7:-2

uspp
Aplicar un filtro de posprocesamiento ultra lento / simple que comprime y descomprime la imagen
en varios (o - en el caso de calidad nivel 8 - todos) turnos y promediar los resultados.

La forma en que esto difiere del comportamiento de spp es que uspp realmente codifica y decodifica cada
caso con libavcodec Snow, mientras que spp utiliza una DCT intra simplificada de solo 8x8 similar a
MJPEG.

El filtro acepta las siguientes opciones:

calidad
Establecer la calidad. Esta opción define el número de niveles para promediar. Acepta un
entero en el rango 0-8. Si se establece en 0, el filtro no tendrá ningún efecto. Un valor de 8
significa la mayor calidad. Por cada incremento de ese valor, la velocidad cae en un factor.
de aproximadamente 2. El valor predeterminado es 3.

qp Forzar un parámetro de cuantificación constante. Si no se configura, el filtro usará el QP de
la secuencia de video (si está disponible).

vectorscope
Muestre 2 valores de componentes de color en el gráfico bidimensional (que se denomina
vectorscopio).

Este filtro acepta las siguientes opciones:

modo, m
Configure el modo de vectorscopio.

Acepta los siguientes valores:

gris
Los valores grises se muestran en el gráfico, un brillo más alto significa que más píxeles tienen el mismo
valor del color del componente en la ubicación en el gráfico. Este es el modo por defecto.

Color
Los valores grises se muestran en el gráfico. Valores de píxeles circundantes que no son
presentes en el fotograma de vídeo se dibujan en degradado de 2 componentes de color que se establecen
por la opción "x" e "y".

color2
Los valores reales de los componentes de color presentes en el cuadro de video se muestran en el gráfico.

color3
Similar al color2 pero con mayor frecuencia de los mismos valores "x" e "y" en el gráfico
aumenta el valor de otro componente de color, que es la luminancia por valores predeterminados
de "x" e "y".

color4
Los colores reales presentes en el cuadro de video se muestran en el gráfico. Si dos diferentes
los colores se asignan a la misma posición en el gráfico y luego el color con un valor más alto del componente no
presente en el gráfico.

x Establezca qué componente de color se representará en el eje X. El valor predeterminado es 1.

y Establezca qué componente de color se representará en el eje Y. El valor predeterminado es 2.

intensidad, i
Ajuste la intensidad, utilizada por los modos: gris, color y color3 para aumentar el brillo de
componente de color que representa la frecuencia de la ubicación (X, Y) en el gráfico.

sobre, e
ninguna
Sin sobre, esto es predeterminado.

instantáneo
Sobre instantáneo, incluso el píxel más oscuro se resaltará claramente.

pico
Mantenga los valores máximos y mínimos presentados en el gráfico a lo largo del tiempo. De esta manera puedes
todavía detecta valores fuera de rango sin mirar constantemente al vectorscopio.

pico + instantáneo
Pico y envolvente instantánea combinados.

vidstabdetectar
Analizar estabilización / deshaking de video. Realice el pase 1 de 2, consulte vidstabtransformar para pasar
2.

Este filtro genera un archivo con información relativa de transformación de rotación y traducción
sobre los fotogramas posteriores, que luego es utilizado por el vidstabtransformar filtrar.

Para habilitar la compilación de este filtro, debe configurar FFmpeg con
"--enable-libvidstab".

Este filtro acepta las siguientes opciones:

resultado
Establezca la ruta al archivo utilizado para escribir la información de las transformaciones. El valor predeterminado es
transforma.trf.

inestabilidad
Establezca qué tan inestable es el video y qué tan rápida es la cámara. Acepta un número entero en el
rango 1-10, un valor de 1 significa poca inestabilidad, un valor de 10 significa fuerte inestabilidad.
El valor predeterminado es 5.

la exactitud
Establezca la precisión del proceso de detección. Debe ser un valor en el rango de 1 a 15. A
un valor de 1 significa baja precisión, un valor de 15 significa alta precisión. El valor predeterminado es 15.

Numero de pie
Establezca el tamaño del paso del proceso de búsqueda. La región alrededor del mínimo se escanea con 1 píxel
resolución. El valor predeterminado es 6.

mincontraste
Establece el contraste mínimo. Por debajo de este valor se descarta un campo de medición local. Debe ser
un valor de coma flotante en el rango 0-1. El valor predeterminado es 0.3.

trípode
Establece el número de fotograma de referencia para el modo trípode.

Si está habilitado, el movimiento de los fotogramas se compara con un fotograma de referencia en el filtro
corriente, identificada por el número especificado. La idea es compensar todos los movimientos en
una escena más o menos estática y mantener la vista de la cámara absolutamente inmóvil.

Si se establece en 0, está deshabilitado. Los fotogramas se cuentan a partir de 1.

Mostrar
Muestre campos y transformaciones en los marcos resultantes. Acepta un número entero en el rango
0-2. El valor predeterminado es 0, que desactiva cualquier visualización.

Ejemplos

· Usar valores predeterminados:

vidstabdetectar

· Analiza películas muy inestables y guarda los resultados en un archivo mistransforms.trf:

vidstabdetect = temblores = 10: precisión = 15: resultado = "mytransforms.trf"

· Visualiza el resultado de las transformaciones internas en el video resultante:

vidstabdetect = mostrar = 1

· Analiza un video con temblores medios usando ffmpeg:

ffmpeg -i input -vf vidstabdetect = temblor = 5: show = 1 dummy.avi

vidstabtransformar
Estabilización de video / deshaking: pase 2 de 2, consulte vidstabdetectar para el pase 1.

Lea un archivo con información de transformación para cada fotograma y aplíquelos / compense. Juntos
con el vidstabdetectar filtrar esto se puede utilizar para deshacer videos. Ver también
<http://public.hronopik.de/vid.stab>. Es importante utilizar también el desenfoque filtrar, ver
abajo.

Para habilitar la compilación de este filtro, debe configurar FFmpeg con
"--enable-libvidstab".

Opciones

Las opciones de entrada
Establezca la ruta al archivo utilizado para leer las transformaciones. El valor predeterminado es transforma.trf.

suavizar
Establezca el número de fotogramas (valor * 2 + 1) utilizados para el filtrado de paso bajo de la cámara
movimientos. El valor predeterminado es 10.

Por ejemplo, un número de 10 significa que se utilizan 21 fotogramas (10 en el pasado y 10 en el
futuro) para suavizar el movimiento en el video. Un valor mayor conduce a un video más fluido,
pero limita la aceleración de la cámara (movimientos pan / tilt). 0 es un caso especial
donde se simula una cámara estática.

optalgo
Configure el algoritmo de optimización de la trayectoria de la cámara.

Los valores aceptados son:

gauss
filtro de paso bajo del kernel gaussiano en el movimiento de la cámara (predeterminado)

avg promediando las transformaciones

cambio máximo
Establezca el número máximo de píxeles para traducir fotogramas. El valor predeterminado es -1, lo que significa que no
límite.

ángulo máximo
Establezca el ángulo máximo en radianes (grados * PI / 180) para rotar fotogramas. El valor predeterminado es -1,
es decir, sin límite.

cultivo
Especifique cómo tratar los bordes que pueden ser visibles debido a la compensación de movimiento.

Los valores disponibles son:

guardar
mantener la información de la imagen del fotograma anterior (predeterminado)

negro
llenar el borde negro

invertir
Invertir transforma si se establece en 1. El valor predeterminado es 0.

relativo
Considere las transformaciones como relativas al fotograma anterior si se establece en 1, absoluto si se establece en 0.
El valor predeterminado es 0.

Zoom
Establecer porcentaje para hacer zoom. Un valor positivo resultará en un efecto de zoom, un negativo
valor en un efecto de alejamiento. El valor predeterminado es 0 (sin zoom).

zoom óptico
Establezca un zoom óptimo para evitar bordes.

Los valores aceptados son:

0 discapacitados

1 Se determina el valor de zoom estático óptimo (solo movimientos muy fuertes conducirán a
bordes visibles) (predeterminado)

2 Se determina el valor de zoom adaptativo óptimo (no se verán bordes), consulte
velocidad del zoom

Tenga en cuenta que el valor dado en el zoom se suma al calculado aquí.

velocidad del zoom
Establezca el porcentaje para acercar al máximo cada cuadro (habilitado cuando zoom óptico está establecido en 2). El rango es
de 0 a 5, el valor predeterminado es 0.25.

interpol
Especifique el tipo de interpolación.

Los valores disponibles son:

no sin interpolación

lineal
lineal solo horizontal

bilineal
lineal en ambas direcciones (predeterminado)

bicúbico
cúbico en ambas direcciones (lento)

trípode
Habilite el modo de trípode virtual si se establece en 1, que es equivalente a
"relativo = 0: suavizado = 0". El valor predeterminado es 0.

Utilice también la opción "trípode" de vidstabdetectar.

depurar
Aumente la verbosidad del registro si se establece en 1. Además, los movimientos globales detectados se escriben en
el archivo temporal global_motions.trf. El valor predeterminado es 0.

Ejemplos

· Usar ffmpeg para una estabilización típica con valores predeterminados:

ffmpeg -i inp.mpeg -vf vidstabtransform, unsharp = 5: 5: 0.8: 3: 3: 0.4 inp_stabilized.mpeg

Tenga en cuenta el uso de la desenfoque filtro que siempre se recomienda.

· Acerque un poco más y cargue los datos de transformación de un archivo determinado:

vidstabtransform = zoom = 5: input = "mytransforms.trf"

· Suaviza aún más el video:

vidstabtransform = suavizado = 30

voltear
Voltea el video de entrada verticalmente.

Por ejemplo, para voltear verticalmente un video con ffmpeg:

ffmpeg -i in.avi -vf "vflip" out.avi

viñeta
Crea o revierte un efecto de viñeteado natural.

El filtro acepta las siguientes opciones:

ángulo, a
Establezca la expresión del ángulo de la lente como una cantidad de radianes.

El valor se recorta en el rango "[0, PI / 2]".

Valor predeterminado: "PI / 5"

x0
y0 Establecer expresiones de coordenadas centrales. Respectivamente "w / 2" y "h / 2" por defecto.

modo
Configure el modo de avance / retroceso.

Los modos disponibles son:

HACIA EL FUTURO
Cuanto mayor es la distancia desde el punto central, más oscura se vuelve la imagen.

hacia atrás
Cuanto mayor es la distancia desde el punto central, más brillante se vuelve la imagen.
Esto se puede utilizar para revertir un efecto de viñeta, aunque no hay
detección para extraer la lente ángulo y otros escenarios (todavía). También se puede utilizar
para crear un efecto ardiente.

El valor predeterminado es HACIA EL FUTURO.

eval
Establecer el modo de evaluación para las expresiones (ángulo, x0, y0).

Acepta los siguientes valores:

init
Evalúe expresiones solo una vez durante la inicialización del filtro.

marco
Evalúe expresiones para cada fotograma entrante. Esto es mucho más lento que el init
modo ya que requiere que todos los escaladores se vuelvan a calcular, pero permite
Expresiones dinámicas.

El valor predeterminado es init.

dither
Configure el tramado para reducir los efectos de bandas circulares. El valor predeterminado es 1 (habilitado).

aspecto
Establecer el aspecto de la viñeta. Esta configuración permite ajustar la forma de la viñeta.
Establecer este valor en el SAR de la entrada hará un viñeteado rectangular
siguiendo las dimensiones del video.

El valor predeterminado es "1/1".

Expresiones

El alfa, x0 y y0 Las expresiones pueden contener los siguientes parámetros.

w
h ancho y alto de entrada

n el número de fotogramas de entrada, comenzando desde 0

pts el tiempo PTS (Presentation TimeStamp) del fotograma de vídeo filtrado, expresado en TB
unidades, NAN si no está definido

r velocidad de fotogramas del vídeo de entrada, NAN si se desconoce la velocidad de fotogramas de entrada

t el PTS (Presentation TimeStamp) del fotograma de vídeo filtrado, expresado en segundos,
NAN si no está definido

tb base de tiempo del video de entrada

Ejemplos

· Aplicar efecto de viñeteado fuerte simple:

viñeta = PI / 4

· Hacer un viñeteado parpadeante:

viñeta = 'PI / 4 +azar(1) * PI / 50 ': eval = marco

vstack
Apila los videos de entrada verticalmente.

Todas las transmisiones deben tener el mismo formato de píxeles y el mismo ancho.

Tenga en cuenta que este filtro es más rápido que usar superposición y almohadilla filtrar para crear la misma salida.

El filtro acepta la siguiente opción:

nb_entradas
Establecer el número de flujos de entrada. El valor predeterminado es 2.

w3fdif
Desentrelaza el vídeo de entrada ("w3fdif" significa "Filtro de desentrelazado de campo Weston 3").

Basado en el proceso descrito por Martin Weston para BBC R&D, e implementado en base a la
algoritmo de desentrelazado escrito por Jim Easterbrook para BBC R&D, el campo Weston 3
El filtro de desentrelazado utiliza coeficientes de filtro calculados por BBC R&D.

Hay dos conjuntos de coeficientes de filtro, denominados "simples" y "complejos". ¿Qué conjunto de
Los coeficientes de filtro que se utilizan se pueden configurar pasando un parámetro opcional:

filtrar
Establezca los coeficientes del filtro entrelazado. Acepta uno de los siguientes valores:

simples
Conjunto de coeficientes de filtro simple.

integraciones
Conjunto de coeficientes de filtro más complejo.

El valor predeterminado es integraciones.

dente
Especifique qué fotogramas desentrelazar. Acepte uno de los siguientes valores:

todos Desentrelazar todos los marcos,

entrelazado
Solo desentrelaza los fotogramas marcados como entrelazados.

El valor predeterminado es todos.

forma de onda
Monitor de forma de onda de video.

El monitor de forma de onda traza la intensidad del componente de color. Solo por luminancia predeterminada. Cada
La columna de la forma de onda corresponde a una columna de píxeles en el video de origen.

Acepta las siguientes opciones:

modo, m
Puede ser "fila" o "columna". El valor predeterminado es "columna". En el modo de fila, el gráfico de la
el lado izquierdo representa el valor 0 del componente de color y el lado derecho representa el valor =
255. En el modo de columna, el lado superior representa el valor del componente de color = 0 y el lado inferior
representa valor = 255.

intensidad, i
Establecer intensidad. Los valores más pequeños son útiles para averiguar cuántos valores del mismo
la luminancia se distribuye a través de filas / columnas de entrada. El valor predeterminado es 0.04. Permitido
el rango es [0, 1].

espejo, r
Establecer el modo de duplicación. 0 significa no reflejado, 1 significa reflejado. En modo reflejado, mayor
los valores se representarán en el lado izquierdo para el modo "fila" y en la parte superior para "columna"
modo. El valor predeterminado es 1 (reflejado).

monitor, d
Establecer el modo de visualización. Acepta los siguientes valores:

superposición
Presenta información idéntica a la del "desfile", excepto que los gráficos
Los componentes que representan el color se superponen directamente entre sí.

Este modo de visualización facilita la detección de diferencias relativas o similitudes en
áreas superpuestas de los componentes de color que se supone que son idénticas, como
como blancos neutros, grises o negros.

desfile
Muestre un gráfico separado para los componentes de color uno al lado del otro en el modo "fila" o uno
debajo del otro en modo "columna".

El uso de este modo de visualización facilita la localización de matices de color en las altas luces y
sombras de una imagen, comparando los contornos de los gráficos superior e inferior de
cada forma de onda. Dado que los blancos, grises y negros se caracterizan por exactamente iguales
cantidades de rojo, verde y azul, las áreas neutrales de la imagen deben mostrar tres
formas de onda de aproximadamente la misma anchura / altura. Si no es así, la corrección es fácil de realizar.
haciendo ajustes de nivel en las tres formas de onda.

El valor predeterminado es "desfile".

componentes, c
Establezca qué componentes de color mostrar. El valor predeterminado es 1, lo que significa solo luminancia o rojo
componente de color si la entrada está en el espacio de color RGB. Si se establece, por ejemplo, en 7,
mostrar los 3 (si) componentes de color disponibles.

sobre, e
ninguna
Sin sobre, esto es predeterminado.

instantáneo
La envolvente instantánea, los valores mínimos y máximos presentados en el gráfico serán fácilmente
visible incluso con un pequeño valor de "paso".

pico
Mantenga los valores mínimos y máximos presentados en el gráfico a lo largo del tiempo. De esta manera puedes
aún detectan valores fuera de rango sin mirar constantemente las formas de onda.

pico + instantáneo
Pico y envolvente instantánea combinados.

filtrar, f
paso bajo
Sin filtrado, esto es predeterminado.

plano
Luma y croma combinados.

un piso
Similar al anterior, pero muestra la diferencia entre el croma azul y rojo.

croma
Muestra solo croma.

acroma
Similar al anterior, pero muestra la diferencia entre el croma azul y rojo.

Color
Muestra el valor de color real en forma de onda.

xbr
Aplique el filtro de aumento de alta calidad xBR que está diseñado para pixel art. Eso
sigue un conjunto de reglas de detección de bordes, consulte
<http://www.libretro.com/forums/viewtopic.php? f = 6 & t = 134>.

Acepta la siguiente opción:

n Establezca la dimensión de escala: 2 para "2xBR", 3 para "3xBR" y 4 para "4xBR". El valor predeterminado es 3.

yadif
Desentrelaza el vídeo de entrada ("yadif" significa "otro filtro de desentrelazado").

Acepta los siguientes parámetros:

modo
El modo de entrelazado a adoptar. Acepta uno de los siguientes valores:

0, enviar_marco
Genere un fotograma para cada fotograma.

1, enviar_campo
Genere un fotograma para cada campo.

2, enviar_marco_noespacial
Como "send_frame", pero omite la comprobación de entrelazado espacial.

3, enviar_campo_noespacial
Como "send_field", pero omite la comprobación de entrelazado espacial.

El valor predeterminado es "send_frame".

paridad
La paridad de campo de imagen asumida para el video entrelazado de entrada. Acepta uno de los
siguientes valores:

0, tff
Suponga que el campo superior es el primero.

1, bff
Suponga que el campo inferior es el primero.

-1, auto
Habilite la detección automática de paridad de campo.

El valor predeterminado es "auto". Si el entrelazado es desconocido o el decodificador no
exportar esta información, se asumirá el campo superior primero.

dente
Especifique qué fotogramas desentrelazar. Acepte uno de los siguientes valores:

0, todos
Desentrelaza todos los marcos.

1, entrelazado
Solo desentrelaza los fotogramas marcados como entrelazados.

El valor predeterminado es "todos".

ampliar
Aplicar el efecto Zoom y Panorámica.

Este filtro acepta las siguientes opciones:

zoom, z
Establezca la expresión de zoom. El valor predeterminado es 1.

x
y Establece la expresión xey. El valor predeterminado es 0.

d Establezca la expresión de duración en número de fotogramas. Esto establece la cantidad de
El efecto de fotogramas durará para la imagen de entrada única.

s Establezca el tamaño de la imagen de salida, el valor predeterminado es 'hd720'.

Cada expresión puede contener las siguientes constantes:

en W, iw
Ancho de entrada.

en_h, ih
Altura de entrada.

fuera_w, ow
Ancho de salida.

fuera_h, oh
Altura de salida.

in Número de fotogramas de entrada.

on Recuento de fotogramas de salida.

x
y Última posición 'x' e 'y' calculada a partir de la expresión 'x' e 'y' para la entrada actual
marco.

px
py 'x' e 'y' del último fotograma de salida del fotograma de entrada anterior o 0 cuando aún no había
tal fotograma (primer fotograma de entrada).

Zoom
Último zoom calculado a partir de la expresión 'z' para el fotograma de entrada actual.

zoom
Último zoom calculado del último fotograma de salida del fotograma de entrada anterior.

duración
Número de fotogramas de salida para el fotograma de entrada actual. Calculado a partir de la expresión 'd' para
cada cuadro de entrada.

duración
número de fotogramas de salida creados para el fotograma de entrada anterior

a Número racional: ancho de entrada / altura de entrada

sar relación de aspecto de muestra

Dar relación de aspecto de la pantalla

Ejemplos

· Amplíe hasta 1.5 y realice una panorámica al mismo tiempo a algún punto cerca del centro de la imagen:

zoompan=z='min(zoom+0.0015,1.5)':d=700:x='if(gte(zoom,1.5),x,x+1/a)':y='if(gte(zoom,1.5),y,y+1)':s=640x360

· Amplíe hasta 1.5 y realice una panorámica siempre en el centro de la imagen:

zoompan=z='min(zoom+0.0015,1.5)':d=700:x='iw/2-(iw/zoom/2)':y='ih/2-(ih/zoom/2)'

VIDEO FUENTES


A continuación se muestra una descripción de las fuentes de video disponibles actualmente.

buffer
Almacene los fotogramas de vídeo en búfer y póngalos a disposición de la cadena de filtros.

Esta fuente está destinada principalmente a un uso programático, en particular a través de la interfaz
definido en libavfilter / vsrc_buffer.h.

Acepta los siguientes parámetros:

tamaño de vídeo
Especifique el tamaño (ancho y alto) de los fotogramas de video almacenados en búfer. Para la sintaxis de
esta opción, marque la "Video Talla" . in las utilidades ffmpeg manual.

anchura
El ancho del video de entrada.

altura
La altura del video de entrada.

pix_fmt
Cadena que representa el formato de píxeles de los fotogramas de vídeo almacenados en búfer. Puede ser un
número correspondiente a un formato de píxeles, o un nombre de formato de píxeles.

base_tiempo
Especifique la base de tiempo asumida por las marcas de tiempo de los fotogramas almacenados en búfer.

cuadros por segundo
Especifique la velocidad de fotogramas esperada para la transmisión de video.

pixel_aspecto, sar
La relación de aspecto de muestra (píxeles) del vídeo de entrada.

sws_param
Especifique los parámetros opcionales que se utilizarán para el filtro de escala que se
insertado cuando se detecta un cambio de entrada en el tamaño o formato de entrada.

Por ejemplo:

buffer=width=320:height=240:pix_fmt=yuv410p:time_base=1/24:sar=1

le indicará a la fuente que acepte fotogramas de video con un tamaño de 320x240 y con formato
"yuv410p", asumiendo 1/24 como base de tiempo de marcas de tiempo y píxeles cuadrados (aspecto de muestra 1: 1
proporción). Dado que el formato de píxeles con el nombre "yuv410p" corresponde al número 6 (marque la
enum Definición de AVPixelFormat en libavutil / pixfmt.h), este ejemplo corresponde a:

buffer=size=320x240:pixfmt=6:time_base=1/24:pixel_aspect=1/1

Alternativamente, las opciones se pueden especificar como una cadena plana, pero esta sintaxis es
obsoleto:

anchura:altura:pix_fmt:base_tiempo.num:base_tiempo.den:aspecto_píxel.num:pixel_aspect.den[:sws_param]

celularauto
Crea un patrón generado por un autómata celular elemental.

El estado inicial del autómata celular se puede definir a través de la nombre de archivoy
patrón opciones. Si no se especifican tales opciones, se crea un estado inicial aleatoriamente.

En cada nuevo fotograma, una nueva fila en el video se llena con el resultado del celular.
autómata de próxima generación. El comportamiento cuando se llena todo el marco está definido por el
mover .

Esta fuente acepta las siguientes opciones:

nombre del archivo, f
Leer el estado inicial del autómata celular, es decir, la fila inicial, de la especificada
Archivo. En el archivo, cada carácter que no sea un espacio en blanco se considera una celda viva, una
la nueva línea terminará la fila y se ignorarán más caracteres en el archivo.

modelo, p
Leer el estado inicial del autómata celular, es decir, la fila inicial, de la especificada
cadena.

Cada carácter que no sea un espacio en blanco en la cadena se considera una celda viva, una nueva línea
terminará la fila y se ignorarán más caracteres en la cadena.

Velocidad, r
Establezca la velocidad de video, es decir, el número de fotogramas generados por segundo. El valor predeterminado es 25.

relación_de_llenado_aleatorio, proporción
Establezca la proporción de llenado aleatoria para la fila de autómatas celulares inicial. Es un flotante
el valor del número de puntos varía de 0 a 1, el valor predeterminado es 1 / PHI.

Esta opción se ignora cuando se especifica un archivo o patrón.

Semilla aleatoria, dispersores
Establecer la semilla para llenar aleatoriamente la fila inicial, debe ser un número entero incluido entre
0 y UINT32_MAX. Si no se especifica, o si se establece explícitamente en -1, el filtro intentará
use una buena semilla aleatoria con el mejor esfuerzo posible.

gobernar
Establezca la regla del autómata celular, es un número comprendido entre 0 y 255. Valor predeterminado
es 110.

tamaño, s
Establece el tamaño del video de salida. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual.

If nombre de archivo or patrón se especifica, el tamaño se establece de forma predeterminada en el ancho de la
fila de estado inicial especificada, y la altura se establece en anchura * IPS.

If tamaño está configurado, debe contener el ancho de la cadena de patrón especificada, y el
el patrón especificado se centrará en la fila más grande.

Si no se especifica un nombre de archivo o una cadena de patrón, el valor de tamaño predeterminado es
"320x518" (utilizado para un estado inicial generado aleatoriamente).

mover
Si se establece en 1, desplace la salida hacia arriba cuando todas las filas de la salida hayan sido
ya lleno. Si se establece en 0, la nueva fila generada se escribirá sobre la fila superior
justo después de que se llene la fila inferior. Por defecto es 1.

inicio_completo, ser completados
Si se establece en 1, llene completamente la salida con filas generadas antes de generar la salida.
primer fotograma. Este es el comportamiento predeterminado, para deshabilitarlo, establezca el valor en 0.

puntada
Si se establece en 1, cose los bordes de la fila izquierda y derecha. Este es el predeterminado
comportamiento, para deshabilitar establezca el valor en 0.

Ejemplos

· Leer el estado inicial de patróny especifique una salida de tamaño 200x400.

cellauto = f = patrón: s = 200x400

· Genere una fila inicial aleatoria con un ancho de 200 celdas, con una proporción de relleno de 2/3:

cellauto = ratio = 2/3: s = 200x200

· Cree un patrón generado por la regla 18 comenzando por una sola celda viva centrada en un
fila inicial con ancho 100:

cellauto = p = @ s = 100x400: completo = 0: regla = 18

· Especifique un patrón inicial más elaborado:

cellauto = p = '@@ @ @@': s = 100x400: completo = 0: regla = 18

Mandelbrot
Genere un conjunto fractal de Mandelbrot y haga zoom progresivamente hacia el punto especificado con
inicio_x y inicio_y.

Esta fuente acepta las siguientes opciones:

puntos_finales
Establezca el valor de pts terminales. El valor predeterminado es 400.

escala_final
Establezca el valor de la escala terminal. Debe ser un valor de coma flotante. El valor predeterminado es 0.3.

interior
Establezca el modo de coloración interior, que es el algoritmo utilizado para dibujar el fractal de Mandelbrot
región interna.

Asumirá uno de los siguientes valores:

negro
Configure el modo negro.

convergencia
Muestre el tiempo hasta la convergencia.

mincol
Establezca el color según el punto más cercano al origen de las iteraciones.

período
Establecer el modo de período.

El valor predeterminado es mincol.

rescate
Establezca el valor del rescate. El valor predeterminado es 10.0.

maxiter
Establece el máximo de iteraciones realizadas por el algoritmo de renderizado. El valor predeterminado es
7189.

exterior
Establecer el modo de coloración exterior. Asumirá uno de los siguientes valores:

iteración_count
Establecer el modo de cálculo de iteración.

recuento_iteración_normalizado
establece el modo de recuento de iteraciones normalizado.

El valor predeterminado es recuento_iteración_normalizado.

Velocidad, r
Establezca la velocidad de fotogramas, expresada como número de fotogramas por segundo. El valor predeterminado es "25".

tamaño, s
Establece el tamaño del marco. Para conocer la sintaxis de esta opción, consulte la sección "Tamaño del video" en el
manual de ffmpeg-utils. El valor predeterminado es "640x480".

escala_inicial
Establezca el valor de escala inicial. El valor predeterminado es 3.0.

inicio_x
Establece la posición x inicial. Debe ser un valor de coma flotante entre -100 y 100.
El valor predeterminado es -0.743643887037158704752191506114774.

inicio_y
Establece la posición inicial y. Debe ser un valor de coma flotante entre -100 y 100.
El valor predeterminado es -0.131825904205311970493132056385139.

mptestsrc
Genere varios patrones de prueba, tal como los genera el filtro de prueba MPlayer.

El tamaño del video generado es fijo y es de 256x256. Esta fuente es útil en
particular para probar funciones de codificación.

Esta fuente acepta las siguientes opciones:

Velocidad, r
Especifique la velocidad de fotogramas del video de origen, como el número de fotogramas generados por
segundo. Tiene que ser una cadena con el formato frame_rate_num/frame_rate_den, un entero
número, un número de coma flotante o una abreviatura de velocidad de fotogramas de vídeo válida. El valor por defecto
el valor es "25".

duración, d
Establezca la duración del video de origen. Ver las Horario duración . in las
utilidades ffmpeg(1) manual para la sintaxis aceptada.

Si no se especifica, o la duración expresada es negativa, se supone que el video es
generado para siempre.

prueba t
Establezca el número o el nombre de la prueba a realizar. Las pruebas admitidas son:

dc_luma
dc_croma
freq_luma
frecuencia_croma
amplificador_luma
amp_croma
CBP
mv
ring1
ring2
todos

El valor predeterminado es "todas", que recorrerá la lista de todas las pruebas.

Algunos ejemplos:

mptestsrc = t = dc_luma

generará un patrón de prueba "dc_luma".

frei0r_src
Proporcione una fuente gratuita.

Para habilitar la compilación de este filtro, debe instalar el encabezado frei0r y configurar
FFmpeg con "--enable-frei0r".

Esta fuente acepta los siguientes parámetros:

tamaño
El tamaño del video que se generará. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual.

framerate
La velocidad de fotogramas del video generado. Puede ser una cadena de la forma número/día o un
abreviatura de velocidad de fotogramas.

nombre_filtro
El nombre de la fuente gratuita que se cargará. Para obtener más información sobre frei0r y cómo
para configurar los parámetros, lea el frei0r sección en la documentación de filtros de video.

parámetros_de_filtro
Una lista de parámetros separados por '|' para pasar a la fuente frei0r.

Por ejemplo, para generar una fuente de partik0l gratuita con un tamaño de 0x200 y una velocidad de fotogramas 200
que se superpone en la entrada principal del filtro de superposición:

frei0r_src = size = 200x200: framerate = 10: filter_name = partik0l: filter_params = 1234 [superposición]; [en] [superposición] superposición

la vida
Genera un patrón de vida.

Esta fuente se basa en una generalización del juego de la vida de John Conway.

La entrada de origen representa una cuadrícula de vida, cada píxel representa una celda que puede estar en una
de dos estados posibles, vivo o muerto. Cada célula interactúa con sus ocho vecinos,
que son las celdas adyacentes horizontal, vertical o diagonalmente.

En cada interacción, la cuadrícula evoluciona de acuerdo con la regla adoptada, que especifica el
número de células vecinas vivas que harán que una célula permanezca viva o nazca. El gobernar opción
permite especificar la regla a adoptar.

Esta fuente acepta las siguientes opciones:

nombre del archivo, f
Establezca el archivo desde el que leer el estado inicial de la cuadrícula. En el archivo, cada no
El carácter de espacio en blanco se considera una celda viva, y la nueva línea se usa para delimitar la
final de cada fila.

Si no se especifica esta opción, la cuadrícula inicial se genera aleatoriamente.

Velocidad, r
Establezca la velocidad de video, es decir, el número de fotogramas generados por segundo. El valor predeterminado es 25.

relación_de_llenado_aleatorio, proporción
Establezca la proporción de relleno aleatoria para la cuadrícula aleatoria inicial. Es un número de coma flotante
valor que varía de 0 a 1, el valor predeterminado es 1 / PHI. Se ignora cuando se especifica un archivo.

Semilla aleatoria, dispersores
Establecer la semilla para llenar la cuadrícula aleatoria inicial, debe ser un número entero incluido entre
0 y UINT32_MAX. Si no se especifica, o si se establece explícitamente en -1, el filtro intentará
use una buena semilla aleatoria con el mejor esfuerzo posible.

gobernar
Establece la regla de la vida.

Una regla se puede especificar con un código del tipo "SNS/BNB", dónde NS y NB en
secuencias de números en el rango 0-8, NS especifica el número de células vecinas vivas
que hacen que una célula viva se mantenga viva, y NB el número de células vecinas vivas que
hacer que una célula muerta cobre vida (es decir, "nazca"). "s" y "b" se pueden utilizar en su lugar
de "S" y "B", respectivamente.

Alternativamente, una regla se puede especificar mediante un número entero de 18 bits. Los 9 bits de orden superior son
utilizado para codificar el siguiente estado de celda si está vivo para cada número de vecino vivo
celdas, los bits de orden inferior especifican la regla para "nacer" nuevas celdas. Bits de orden superior
codificar para un mayor número de celdas vecinas. Por ejemplo, el número 6153 =
"(12 << 9) +9" especifica una regla de permanecer vivo de 12 y una regla nativa de 9, que corresponde
a "S23 / B03".

El valor predeterminado es "S23 / B3", que es la regla del juego de la vida original de Conway, y
Mantener viva una célula si tiene 2 o 3 células vecinas vivas, y nacerá una nueva célula si
hay tres células vivas alrededor de una célula muerta.

tamaño, s
Establece el tamaño del video de salida. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual.

If nombre de archivo se especifica, el tamaño se establece de forma predeterminada al mismo tamaño de la entrada
expediente. Si tamaño está configurado, debe contener el tamaño especificado en el archivo de entrada, y el
La cuadrícula inicial definida en ese archivo se centra en el área resultante más grande.

Si no se especifica un nombre de archivo, el valor de tamaño predeterminado es "320x240" (utilizado para
cuadrícula inicial generada aleatoriamente).

puntada
Si se establece en 1, cose los bordes de la cuadrícula izquierdo y derecho juntos, y la parte superior e inferior
bordes también. Por defecto es 1.

moho (hongo)
Configure la velocidad del molde de la celda. Si se establece, una celda muerta pasará de color_de_la_muerte a color_molde con un
paso de moho (hongo). moho (hongo) puede tener un valor de 0 a 255.

color_de_la_vida
Establece el color de las células vivas (o recién nacidas).

color_de_la_muerte
Establece el color de las células muertas. Si moho (hongo) está configurado, este es el primer color utilizado para representar
una celda muerta.

color_molde
Establezca el color del moho, para células definitivamente muertas y mohosas.

Para conocer la sintaxis de estas 3 opciones de color, consulte la sección "Color" en ffmpeg-utils
manual.

Ejemplos

· Leer una cuadrícula de patróny céntrelo en una cuadrícula de tamaño 300x300 píxeles:

vida = f = patrón: s = 300x300

· Genere una cuadrícula aleatoria de tamaño 200x200, con una proporción de relleno de 2/3:

vida = relación = 2/3: s = 200x200

· Especifica una regla personalizada para desarrollar una cuadrícula generada aleatoriamente:

vida = regla = S14 / B34

· Ejemplo completo con efecto de muerte lenta (moho) usando ffplay:

ffplay -f lavfi life=s=300x200:mold=10:r=60:ratio=0.1:death_color=#C83232:life_color=#00ff00,scale=1200:800:flags=16

todorgb, alyuv, color, haldclutsrc, nulo, rgbtestsrc, barras de muestra, barras smptehd, pruebasrc
La fuente "allrgb" devuelve cuadros de tamaño 4096x4096 de todos los colores rgb.

La fuente "allyuv" devuelve fotogramas de tamaño 4096x4096 de todos los colores yuv.

La fuente de "color" proporciona una entrada de color uniforme.

La fuente "haldclutsrc" proporciona una identidad Hald CLUT. Ver también mediocre filtrar.

La fuente "nullsrc" devuelve fotogramas de vídeo sin procesar. Es principalmente útil para ser empleado
en herramientas de análisis / depuración, o como fuente de filtros que ignoran los datos de entrada.

La fuente "rgbtestsrc" genera un patrón de prueba RGB útil para detectar RGB vs BGR
asuntos. Debería ver una franja roja, verde y azul de arriba a abajo.

La fuente "smptebars" genera un patrón de barras de color, basado en la Ingeniería SMPTE
Directriz EG 1-1990.

La fuente "smptehdbars" genera un patrón de barras de color, basado en SMPTE RP 219-2002.

La fuente "testsrc" genera un patrón de video de prueba, que muestra un patrón de color, un desplazamiento
gradiente y una marca de tiempo. Esto está destinado principalmente a fines de prueba.

Las fuentes aceptan los siguientes parámetros:

color, c
Especifique el color de la fuente, solo disponible en la fuente "color". Para la sintaxis
de esta opción, consulte la sección "Color" en el manual ffmpeg-utils.

nivel
Especifique el nivel de Hald CLUT, solo disponible en la fuente "haldclutsrc". A
el nivel de "N" genera una imagen de "N * N * N" por "N * N * N" píxeles que se utilizará como identidad
matriz para tablas de búsqueda 3D. Cada componente está codificado en una escala "1 / (N * N)".

tamaño, s
Especifique el tamaño del video de origen. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual. El valor predeterminado es "320x240".

Esta opción no está disponible con el filtro "haldclutsrc".

Velocidad, r
Especifique la velocidad de fotogramas del video de origen, como el número de fotogramas generados por
segundo. Tiene que ser una cadena con el formato frame_rate_num/frame_rate_den, un entero
número, un número de coma flotante o una abreviatura de velocidad de fotogramas de vídeo válida. El valor por defecto
el valor es "25".

sar Establezca la relación de aspecto de la muestra del video de origen.

duración, d
Establezca la duración del video de origen. Ver las Horario duración . in las
utilidades ffmpeg(1) manual para la sintaxis aceptada.

Si no se especifica, o la duración expresada es negativa, se supone que el video es
generado para siempre.

decimales, n
Establezca el número de decimales que se mostrarán en la marca de tiempo, solo disponible en "testsrc"
.

El valor de la marca de tiempo que se muestra corresponderá al valor de la marca de tiempo original
multiplicado por la potencia de 10 del valor especificado. El valor predeterminado es 0.

Por ejemplo lo siguiente:

testsrc = duración = 5.3: tamaño = qcif: tasa = 10

generará un video con una duración de 5.3 segundos, con un tamaño de 176x144 y una velocidad de fotogramas
de 10 fotogramas por segundo.

La siguiente descripción del gráfico generará una fuente roja con una opacidad de 0.2, con
tamaño "qcif" y una velocidad de fotogramas de 10 fotogramas por segundo.

color = c =[email protected]: s = qcif: r = 10

Si se va a ignorar el contenido de entrada, se puede utilizar "nullsrc". El siguiente comando
genera ruido en el plano de luminancia empleando el filtro "geq":

nullsrc = s = 256x256, geq =azar(1) * 255: 128: 128

Comandos

La fuente "color" admite los siguientes comandos:

c, Color
Establece el color de la imagen creada. Acepta la misma sintaxis del correspondiente Color
.

VIDEO FREGADEROS


A continuación se muestra una descripción de los receptores de video disponibles actualmente.

disipador
Almacene los fotogramas de vídeo en búfer y póngalos a disposición hasta el final del gráfico de filtro.

Este receptor está diseñado principalmente para uso programático, en particular a través de la interfaz
definido en libavfilter / buffersink.h o el sistema de opciones.

Acepta un puntero a una estructura AVBufferSinkContext, que define la entrada
formatos de búfer, que se pasarán como parámetro opaco a "avfilter_init_filter" para
inicialización.

nulo
Disipador de video nulo: no haga absolutamente nada con el video de entrada. Es principalmente útil como
plantilla y para su uso en herramientas de análisis / depuración.

MULTIMEDIA FILTROS


A continuación se muestra una descripción de los filtros multimedia disponibles actualmente.

afasemetro
Convierta el audio de entrada en una salida de video, mostrando la fase de audio.

El filtro acepta las siguientes opciones:

Velocidad, r
Establece la velocidad de fotogramas de salida. El valor predeterminado es 25.

tamaño, s
Configure el tamaño de video para la salida. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual. El valor predeterminado es "800x400".

rc
gc
bc Especifique el contraste de rojo, verde y azul. Los valores predeterminados son 2, 7 y 1. Rango permitido
es "[0, 255]".

mpc Establezca el color que se utilizará para dibujar la fase media. Si el color es "ninguno", que es
por defecto, no se dibujará ningún valor de fase media.

El filtro también exporta los metadatos del marco "lavfi.aphasemeter.phase" que representa la media
fase del cuadro de audio actual. El valor está en el rango "[-1, 1]". El "-1" significa izquierda y derecha
los canales están completamente desfasados ​​y 1 significa que los canales están en fase.

avectorscopio
Convierta el audio de entrada en una salida de video, que representa el alcance del vector de audio.

El filtro se utiliza para medir la diferencia entre canales de flujo de audio estéreo. A
señal monoaural, que consta de una señal idéntica izquierda y derecha, da como resultado
linea vertical. Cualquier separación estéreo es visible como una desviación de esta línea, creando una
Figura de Lissajous. Si la línea recta (o desviación de ella) pero horizontal aparece esta
indica que los canales izquierdo y derecho están desfasados.

El filtro acepta las siguientes opciones:

modo, m
Configure el modo de vectorscopio.

Los valores disponibles son:

Lissajous
Lissajous giró 45 grados.

lissajous_xy
Igual que el anterior pero no girado.

polar
Forma que se asemeja a la mitad del círculo.

El valor predeterminado es Lissajous.

tamaño, s
Configure el tamaño de video para la salida. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual. El valor predeterminado es "400x400".

Velocidad, r
Establece la velocidad de fotogramas de salida. El valor predeterminado es 25.

rc
gc
bc
ac Especifique el contraste rojo, verde, azul y alfa. Los valores predeterminados son 40, 160, 80 y
255. El rango permitido es "[0, 255]".

rf
gf
bf
af Especifique el desvanecimiento rojo, verde, azul y alfa. Los valores predeterminados son 15, 10, 5 y 5.
El rango permitido es "[0, 255]".

Zoom
Establezca el factor de zoom. El valor predeterminado es 1. El rango permitido es "[1, 10]".

Ejemplos

· Ejemplo completo usando ffplay:

ffplay -f lavfi 'amovie = input.mp3, asplit [a] [out1];
[a] avectorscope=zoom=1.3:rc=2:gc=200:bc=10:rf=1:gf=8:bf=7 [out0]'

concat
Concatenar transmisiones de audio y video, uniéndolas una tras otra.

El filtro funciona en segmentos de secuencias de audio y vídeo sincronizadas. Todos los segmentos deben
tienen la misma cantidad de transmisiones de cada tipo, y esa también será la cantidad de transmisiones
en la salida.

El filtro acepta las siguientes opciones:

n Establezca el número de segmentos. El valor predeterminado es 2.

v Establezca la cantidad de transmisiones de video de salida, que también es la cantidad de transmisiones de video en
cada segmento. El valor predeterminado es 1.

a Establezca el número de transmisiones de audio de salida, que también es la cantidad de transmisiones de audio en
cada segmento. El valor predeterminado es 0.

inseguro
Activar modo inseguro: no falle si los segmentos tienen un formato diferente.

El filtro tiene v+a salidas: primero v salidas de video, luego a salidas de audio.

Existen nx(v+a) entradas: primero las entradas para el primer segmento, en el mismo orden que el
salidas, luego las entradas para el segundo segmento, etc.

Las transmisiones relacionadas no siempre tienen exactamente la misma duración, por varias razones
incluido el tamaño del marco del códec o la creación descuidada. Por esa razón, relacionados sincronizados
Las transmisiones (por ejemplo, un video y su pista de audio) deben concatenarse a la vez. El concat
el filtro utilizará la duración de la transmisión más larga en cada segmento (excepto el último),
y si es necesario, rellene con silencio las secuencias de audio más cortas.

Para que este filtro funcione correctamente, todos los segmentos deben comenzar en la marca de tiempo 0.

Todos los flujos correspondientes deben tener los mismos parámetros en todos los segmentos; el filtrado
El sistema seleccionará automáticamente un formato de píxel común para transmisiones de video y un
formato de muestra, frecuencia de muestreo y diseño de canales para transmisiones de audio, pero otras configuraciones, como
como resolución, debe ser convertido explícitamente por el usuario.

Se aceptan diferentes velocidades de fotogramas, pero darán como resultado una velocidad de fotogramas variable en la salida; ser
asegúrese de configurar el archivo de salida para manejarlo.

Ejemplos

· Concatenar una apertura, un episodio y un final, todo en versión bilingüe (video en
stream 0, audio en streams 1 y 2):

ffmpeg -i opening.mkv -i episode.mkv -i terminando.mkv -filter_complex \
'[0:0] [0:1] [0:2] [1:0] [1:1] [1:2] [2:0] [2:1] [2:2]
concat = n = 3: v = 1: a = 2 [v] [a1] [a2] '\
-mapa '[v]' -mapa '[a1]' -mapa '[a2]' salida.mkv

· Concatenar dos partes, manejar audio y video por separado, usando la (a) película
fuentes y ajustando la resolución:

película = part1.mp4, escala = 512: 288 [v1]; amovie = part1.mp4 [a1];
película = part2.mp4, escala = 512: 288 [v2]; amovie = part2.mp4 [a2];
[v1] [v2] concat [outv]; [a1] [a2] concat = v = 0: a = 1 [outa]

Tenga en cuenta que se producirá una desincronización en la puntada si las transmisiones de audio y video no
tienen exactamente la misma duración en el primer archivo.

ebur128
Filtro de escáner EBU R128. Este filtro toma un flujo de audio como entrada y lo emite
sin alterar. Por defecto, registra un mensaje a una frecuencia de 10Hz con el Momentary
sonoridad (identificada por "M"), sonoridad a corto plazo ("S"), sonoridad integrada ("I") y
Rango de sonoridad ("LRA").

El filtro también tiene una salida de video (ver el video opción) con un gráfico en tiempo real para
observe la evolución de la sonoridad. El gráfico contiene el mensaje registrado mencionado anteriormente,
por lo que ya no se imprime cuando se establece esta opción, a menos que se establezca el registro detallado.
El área principal de gráficos contiene la sonoridad a corto plazo (3 segundos de análisis) y la
el medidor de la derecha es para el volumen momentáneo (400 milisegundos).

Más información sobre la recomendación de sonoridad EBU R128 en
<http://tech.ebu.ch/loudness>.

El filtro acepta las siguientes opciones:

video
Activa la salida de video. La transmisión de audio se transmite sin cambios si esta opción es
conjunto o no. La transmisión de video será la primera transmisión de salida si se activa. El valor predeterminado es
0.

tamaño
Establece el tamaño del video. Esta opción es solo para video. Para la sintaxis de esta opción,
comprobar el "Video Talla" . in las utilidades ffmpeg manual. Por defecto y mínimo
la resolución es "640x480".

metro
Configure el medidor de escala EBU. El valor predeterminado es 9. Los valores comunes son 9 y 18, respectivamente para
Medidor de escala EBU +9 y medidor de escala EBU +18. Cualquier otro valor entero entre este rango
esta permitido.

metadatos
Establecer la inyección de metadatos. Si se establece en 1, la entrada de audio se segmentará en 100 ms
fotogramas de salida, cada uno de los cuales contiene información de sonoridad en metadatos. Todo
las claves de metadatos tienen el prefijo "lavfi.r128.".

El valor predeterminado es 0.

registro de marcos
Fuerza el nivel de registro de tramas.

Los valores disponibles son:

info
nivel de registro de información

verboso
nivel de registro detallado

De forma predeterminada, el nivel de registro se establece en info. Si el video o de metadatos las opciones son
configurado, cambia a verboso.

pico
Establecer modo (s) pico.

Los modos disponibles se pueden acumular (la opción es del tipo "bandera"). Los posibles valores son:

ninguna
Desactive cualquier modo pico (predeterminado).

muestra
Habilite el modo de pico de muestra.

Modo pico simple que busca el valor de muestra más alto. Registra un mensaje para
pico de muestra (identificado por "SPK").

verdadero
Habilite el modo de pico real.

Si está habilitado, la búsqueda de picos se realiza en una versión sobremuestreada del flujo de entrada
para una mejor precisión máxima. Registra un mensaje para true-peak. (identificado por "TPK")
y pico verdadero por cuadro (identificado por "FTPK"). Este modo requiere una compilación con
"libswresample".

Ejemplos

· Gráfico en tiempo real usando ffplay, con medidor de escala EBU +18:

ffplay -f lavfi -i "amovie = input.mp3, ebur128 = video = 1: meter = 18 [out0] [out1]"

· Ejecute un análisis con ffmpeg:

ffmpeg -nostats -i input.mp3 -filter_complex ebur128 -f null -

intercalar intercalar
Intercalar fotogramas de varias entradas temporalmente.

"intercalar" funciona con entradas de vídeo, "aintercalar" con audio.

Estos filtros leen los fotogramas de varias entradas y envían el fotograma en cola más antiguo al
salida.

Los flujos de entrada deben tener valores de marca de tiempo de fotogramas bien definidos y que aumenten monótonamente.

Para enviar un fotograma a la salida, estos filtros deben poner en cola al menos un fotograma
para cada entrada, por lo que no pueden funcionar en caso de que una entrada aún no se haya terminado y no
recibir tramas entrantes.

Por ejemplo, considere el caso en el que una entrada es un filtro de "selección" que siempre elimina la entrada
marcos. El filtro "intercalar" seguirá leyendo de esa entrada, pero nunca
capaz de enviar nuevos fotogramas a la salida hasta que la entrada envíe una señal de fin de flujo.

Además, dependiendo de la sincronización de las entradas, los filtros eliminarán fotogramas en caso de que una entrada
recibe más fotogramas que los demás y la cola ya está llena.

Estos filtros aceptan las siguientes opciones:

nb_entradas, n
Establezca el número de entradas diferentes, es 2 por defecto.

Ejemplos

· Intercalar fotogramas que pertenecen a diferentes flujos usando ffmpeg:

ffmpeg -i bambi.avi -i pr0n.mkv -filter_complex "[0: v] [1: v] intercalar" out.avi

· Añade un efecto de desenfoque parpadeante:

seleccionar = 'si (gt (azar(0), 0.2), 1, 2) ': n = 2 [tmp], boxblur = 2: 2, [tmp] intercalar

permanentes, aperitivos
Establezca permisos de lectura / escritura para los marcos de salida.

Estos filtros están destinados principalmente a que los desarrolladores prueben la ruta directa en el siguiente filtro
en el gráfico de filtros.

Los filtros aceptan las siguientes opciones:

modo
Seleccione el modo de permisos.

Acepta los siguientes valores:

ninguna
Hacer nada. Este es el predeterminado.

ro Configure todos los fotogramas de salida como de solo lectura.

rw Configure todos los fotogramas de salida directamente escribibles.

palanca
Haga que el marco sea de solo lectura si se puede escribir y de escritura si es de solo lectura.

azar
Configure cada fotograma de salida como de solo lectura o de escritura aleatoria.

dispersores
Establecer la semilla para el azar modo, debe ser un número entero incluido entre 0 y
"UINT32_MAX". Si no se especifica, o si se establece explícitamente en "-1", el filtro intentará
use una buena semilla aleatoria con el mejor esfuerzo posible.

Nota: en caso de un filtro insertado automáticamente entre el filtro de permisos y el siguiente,
es posible que el permiso no se reciba como se esperaba en el siguiente filtro. Insertar un
formato or un formato filtro antes de que el filtro de perms / aperms puede evitar este problema.

Seleccione, seleccionar
Seleccione los fotogramas para pasar la salida.

Este filtro acepta las siguientes opciones:

expr, e
Establecer expresión, que se evalúa para cada fotograma de entrada.

Si la expresión se evalúa a cero, la trama se descarta.

Si el resultado de la evaluación es negativo o NaN, la trama se envía a la primera salida;
de lo contrario, se envía a la salida con el índice "ceil (val) -1", asumiendo que la entrada
el índice comienza desde 0.

Por ejemplo, un valor de 1.2 corresponde a la salida con índice "ceil (1.2) -1 = 2-1 =
1 ", que es la segunda salida.

salidas, n
Establezca el número de salidas. La salida a la que enviar el fotograma seleccionado se basa en
el resultado de la evaluación. El valor predeterminado es 1.

La expresión puede contener las siguientes constantes:

n El número (secuencial) de la trama filtrada, comenzando desde 0.

seleccionado_n
El número (secuencial) del fotograma seleccionado, comenzando desde 0.

prev_selected_n
El número secuencial del último fotograma seleccionado. Es NAN si no está definido.

TB La base de tiempo de las marcas de tiempo de entrada.

pts El PTS (Presentation TimeStamp) del fotograma de vídeo filtrado, expresado en TB unidades.
Es NAN si no está definido.

t El PTS del fotograma de video filtrado, expresado en segundos. Es NAN si no está definido.

pts_anteriores
El PTS del fotograma de video filtrado previamente. Es NAN si no está definido.

pts_prev_selected
El PTS del último fotograma de video filtrado previamente. Es NAN si no está definido.

prev_seleccionado_t
El PTS del último fotograma de video seleccionado previamente. Es NAN si no está definido.

puntos_inicio
El PTS del primer fotograma de video en el video. Es NAN si no está definido.

inicio_t
La hora del primer fotograma de video en el video. Es NAN si no está definido.

tipo_pict (vídeo solamente)
El tipo de fotograma filtrado. Puede asumir uno de los siguientes valores:

I
P
B
S
SI
SP
BI
tipo_entrelazado (vídeo solamente)
El tipo de marco entrelazado. Puede asumir uno de los siguientes valores:

PROGRESIVO
El marco es progresivo (no entrelazado).

PRIMERO
El marco es el campo superior primero.

DE ABAJO PRIMERO
El marco es el campo inferior primero.

muestra_consumida_n (audio solamente)
el número de muestras seleccionadas antes del fotograma actual

muestras_n (audio solamente)
el número de muestras en el marco actual

tasa_de_muestra (audio solamente)
la frecuencia de muestreo de entrada

clave Este es 1 si el fotograma filtrado es un fotograma clave, 0 en caso contrario.

pos la posición en el archivo del marco filtrado, -1 si la información no está disponible
(por ejemplo, para video sintético)

escena (vídeo solamente)
valor entre 0 y 1 para indicar una nueva escena; un valor bajo refleja una probabilidad baja
para que el fotograma actual introduzca una nueva escena, mientras que un valor más alto significa el actual
es más probable que el marco sea uno (consulte el ejemplo a continuación)

El valor predeterminado de la expresión de selección es "1".

Ejemplos

· Seleccionar todos los fotogramas en la entrada:

selecciona

El ejemplo anterior es el mismo que:

seleccionar = 1

· Omitir todos los fotogramas:

seleccionar = 0

· Seleccione solo I-frames:

select = 'eq (pict_type \, I)'

· Seleccione un fotograma cada 100:

seleccionar = 'no (mod (n \, 100))'

· Seleccione solo los fotogramas contenidos en el intervalo de tiempo 10-20:

seleccionar = entre (t \, 10 \, 20)

· Seleccione solo los fotogramas I contenidos en el intervalo de tiempo 10-20:

seleccionar = entre (t \, 10 \, 20) * eq (pict_type \, I)

· Selecciona fotogramas con una distancia mínima de 10 segundos:

select = 'isnan (prev_selected_t) + gte (t-prev_selected_t \, 10)'

· Utilice una selección para seleccionar solo fotogramas de audio con un número de muestras> 100:

aselect = 'gt (samples_n \, 100)'

· Crea un mosaico de las primeras escenas:

ffmpeg -i video.avi -vf select = 'gt (scene \, 0.4)', scale = 160: 120, tile -frames: v 1 preview.png

Comparando escena contra un valor entre 0.3 y 0.5 es generalmente una elección sensata.

· Envíe fotogramas pares e impares a salidas independientes y compóngalas:

select = n = 2: e = 'mod (n, 2) +1' [impar] [par]; [impar] pad = h = 2 * ih [tmp]; [tmp] [incluso] superposición = y = h

enviar cmd, enviarcmd
Envíe comandos a filtros en el gráfico de filtros.

Estos filtros leen los comandos que se enviarán a otros filtros en el gráfico de filtros.

"sendcmd" debe insertarse entre dos filtros de video, "asendcmd" debe insertarse entre
dos filtros de audio, pero aparte de eso, actúan de la misma manera.

La especificación de los comandos se puede proporcionar en los argumentos del filtro con el comandos
opción, o en un archivo especificado por la nombre de archivo .

Estos filtros aceptan las siguientes opciones:

comandos, c
Configure los comandos para que se lean y envíen a los otros filtros.

nombre del archivo, f
Establezca el nombre de archivo de los comandos que se leerán y enviarán a los otros filtros.

Comandos sintaxis

Una descripción de comandos consta de una secuencia de especificaciones de intervalo, que comprende un
lista de comandos que se ejecutarán cuando ocurra un evento particular relacionado con ese intervalo.
El evento que ocurre es típicamente el tiempo del marco actual que entra o sale de un tiempo determinado.
intervalo.

Un intervalo se especifica mediante la siguiente sintaxis:

[- ] ;

El intervalo de tiempo lo especifica el EMPIEZA y FIN veces. FIN es opcional y predeterminado
al máximo tiempo.

El tiempo del marco actual se considera dentro del intervalo especificado si se incluye en
el intervalo [EMPIEZA, FIN), que es cuando el tiempo es mayor o igual a EMPIEZA y es
menor que FIN.

COMANDOS consta de una secuencia de una o más especificaciones de comando, separadas por ",",
relativo a ese intervalo. La sintaxis de la especificación de un comando viene dada por:

[ ]

BANDERAS es opcional y especifica el tipo de eventos relacionados con el intervalo de tiempo que
habilitar el envío del comando especificado, y debe ser una secuencia no nula de indicadores de identificación
separados por "+" o "|" y encerrado entre "[" y "]".

Se reconocen las siguientes banderas:

entrar
El comando se envía cuando la marca de tiempo del marco actual entra en el intervalo especificado. En
En otras palabras, el comando se envía cuando la marca de tiempo del marco anterior no estaba en el
intervalo dado, y la corriente es.

dejar
El comando se envía cuando la marca de tiempo del marco actual sale del intervalo especificado. En
En otras palabras, el comando se envía cuando la marca de tiempo del marco anterior estaba en el
intervalo, y la corriente no lo es.

If BANDERAS no se especifica, se asume un valor predeterminado de "[ingresar]".

OBJETIVO especifica el destino del comando, generalmente el nombre de la clase de filtro o un
nombre de instancia de filtro específico.

COMANDO especifica el nombre del comando para el filtro de destino.

ARG es opcional y especifica la lista opcional de argumentos para el COMANDO.

Entre una especificación de intervalo y otra, espacios en blanco o secuencias de caracteres
comenzando con "#" hasta el final de la línea, se ignoran y se pueden usar para anotar comentarios.

A continuación, se muestra una descripción BNF simplificada de la sintaxis de especificación de comandos:

:: = "entrar" | "salir"
:: = [(+ | "|") ]
:: = ["[" "]"] [ ]
:: = [, ]
:: = [- ]
:: = [; ]

Ejemplos

· Especifique el cambio de tempo del audio en el segundo 4:

asendcmd = c = '4.0 atempo tempo 1.5', atempo

· Especifica una lista de comandos de tono y texto de dibujo en un archivo.

# mostrar texto en el intervalo 5-10
5.0-10.0 [ingresar] drawtext reinit 'fontfile = FreeSerif.ttf: text = hola mundo',
[dejar] drawtext reinit 'fontfile = FreeSerif.ttf: text =';

# desaturar la imagen en el intervalo 15-20
15.0-20.0 [ingresar] tono s 0,
[entrar] drawtext reinit 'fontfile = FreeSerif.ttf: text = nocolor',
[dejar] tono s 1,
[dejar] drawtext reinit 'fontfile = FreeSerif.ttf: text = color';

# aplicar un efecto de desvanecimiento de saturación exponencial, comenzando desde el tiempo 25
25 [ingresar] tono s exp (25-t)

Un gráfico de filtro que permite leer y procesar la lista de comandos anterior almacenada en un archivo
prueba.cmd, se puede especificar con:

sendcmd = f = test.cmd, drawtext = fontfile = FreeSerif.ttf: text = '', tono

conjuntos, aseptos
Cambie el PTS (marca de tiempo de presentación) de los fotogramas de entrada.

"setpts" funciona en fotogramas de vídeo, "asetpts" en fotogramas de audio.

Este filtro acepta las siguientes opciones:

expr
La expresión que se evalúa para cada fotograma para construir su marca de tiempo.

La expresión se evalúa a través de la API de evaluación y puede contener las siguientes constantes:

CUADROS POR SEGUNDO
velocidad de fotogramas, solo definida para vídeo con velocidad de fotogramas constante

PTS La marca de tiempo de la presentación en la entrada

N El recuento del fotograma de entrada para video o el número de muestras consumidas, no
incluido el fotograma actual para el audio, comenzando desde 0.

NB_CONSUMED_MUESTRAS
El número de muestras consumidas, sin incluir el fotograma actual (solo audio)

NB_MUESTRAS, S
El número de muestras en el cuadro actual (solo audio)

MUESTRA_TARIFA, SR
La frecuencia de muestreo de audio.

INICIO
El PTS del primer fotograma.

INICIO
el tiempo en segundos del primer fotograma

Entrelazados
Indique si el fotograma actual está entrelazado.

T el tiempo en segundos del fotograma actual

POS posición original en el archivo del fotograma, o indefinido si no está definido para el actual
marco

ANTERIOR_INPTS
El PTS de entrada anterior.

ANTERIOR_INT
tiempo de entrada anterior en segundos

ANTERIOR_OUTPTS
El PTS de salida anterior.

SALIDA_ANTERIOR
tiempo de salida anterior en segundos

TIEMPORTCT
El tiempo del reloj de pared (RTC) en microsegundos. Esto está desaprobado, use equipo(0) en cambio.

INICIO RTC
El tiempo del reloj de pared (RTC) al comienzo de la película en microsegundos.

TB La base de tiempo de las marcas de tiempo de entrada.

Ejemplos

· Empiece a contar PTS desde cero

setpts = PTS-STARTPTS

· Aplicar efecto de movimiento rápido:

setpts = 0.5 * PTS

· Aplicar efecto de cámara lenta:

setpts = 2.0 * PTS

· Establecer una velocidad fija de 25 fotogramas por segundo:

setpts = N / (25 * TB)

· Establece una velocidad fija de 25 fps con cierta inestabilidad:

ajustes = '1 / (25 * TB) * (N + 0.05 * sin (N * 2 * PI / 25))'

· Aplicar un desplazamiento de 10 segundos al PTS de entrada:

setpts = PTS + 10 / TB

· Genere marcas de tiempo a partir de una "fuente en vivo" y vuelva a establecer la base de tiempo en la base de tiempo actual:

setpts = '(RTCTIME - RTCSTART) / (TB * 1000000)'

· Genere marcas de tiempo contando muestras:

asetpts = N / SR / TB

configurar, asettb
Establezca la base de tiempo que se utilizará para las marcas de tiempo de los fotogramas de salida. Es principalmente útil para probar
configuración de la base de tiempo.

Acepta los siguientes parámetros:

expr, tb
La expresión que se evalúa en la base de tiempo de salida.

El valor para tb es una expresión aritmética que representa un racional. La expresión puede
contienen las constantes "AVTB" (la base de tiempo predeterminada), "intb" (la base de tiempo de entrada) y "sr"
(la frecuencia de muestreo, solo audio). El valor predeterminado es "intb".

Ejemplos

· Establezca la base de tiempo en 1/25:

settb = expr = 1/25

· Establezca la base de tiempo en 1/10:

settb = expr = 0.1

· Establezca la base de tiempo en 1001/1000:

settb = 1 + 0.001

· Establezca la base de tiempo en 2 * intb:

settb = 2 * intb

· Establecer el valor de base de tiempo predeterminado:

settb = AVTB

showcqt
Convierta el audio de entrada en una salida de video que represente el espectro de frecuencia de forma logarítmica
(usando transformada Q constante con algoritmo Brown-Puckette), con escala tonal musical, desde
Mi0 a Re # 10 (10 octavas).

El filtro acepta las siguientes opciones:

volumen
Especifique la expresión de volumen de transformación (multiplicador). La expresión puede contener
variables:

frecuencia, frecuencia f
la frecuencia donde se evalúa la transformación

abrazadera de tiempo, tc
valor de la opción timeclamp

y funciones:

ponderación_a (f)
Ponderación A de igual volumen

b_ponderación (f)
Ponderación B de igual volumen

ponderación_c (f)
Ponderación C de igual volumen

El valor predeterminado es 16.

longitud
Especifique la expresión de longitud de transformación. La expresión puede contener variables:

frecuencia, frecuencia f
la frecuencia donde se evalúa la transformación

abrazadera de tiempo, tc
valor de la opción timeclamp

El valor predeterminado es "384 / f * tc / (384 / f + tc)".

cronómetro
Especifique el timeclamp de transformación. A baja frecuencia, existe un compromiso entre la precisión
en el dominio del tiempo y en el dominio de la frecuencia. Si la fijación de tiempo es menor, el evento en el dominio del tiempo es
representado con mayor precisión (como bombo rápido), de lo contrario evento en frecuencia
El dominio se representa con mayor precisión (como el bajo). El valor aceptable es [0.1,
1.0]. El valor predeterminado es 0.17.

coefclamp
Especifique el coefclamp de transformación. Si coeffclamp es menor, transform es más precisa,
de lo contrario, la transformación es más rápida. El valor aceptable es [0.1, 10.0]. El valor predeterminado es 1.0.

gama
Especifique gamma. Una gamma más baja hace que el espectro tenga más contraste, una gamma más alta hace que
espectro que tiene más rango. El valor aceptable es [1.0, 7.0]. El valor predeterminado es 3.0.

gamma2
Especifique la gamma del gráfico de barras. El valor aceptable es [1.0, 7.0]. El valor predeterminado es 1.0.

archivo de fuentes
Especifique el archivo de fuente para usar con freetype. Si no se especifica, utilice una fuente incrustada.

color de fuente
Especifique la expresión del color de la fuente. Esta es una expresión aritmética que debería devolver
valor entero 0xRRGGBB. La expresión puede contener variables:

frecuencia, frecuencia f
la frecuencia donde se evalúa la transformación

abrazadera de tiempo, tc
valor de la opción timeclamp

y funciones:

midi (f)
número midi de frecuencia f, algunos números midi: E0(16) C1(24) C2(36) A4(69)

r (x), g (x), b (x)
valor rojo, verde y azul de intensidad x

El valor predeterminado es "st (0, (midi (f) -59.5) / 12); st (1, if (between (ld(0), 0,1),
0.5-0.5 * cos (2 * PI *ld(0)), 0)); r (1-ld(1)) + b (ld(1)) "

Full HD
Si se establece en 1 (el valor predeterminado), el tamaño del video es 1920 x 1080 (Full HD), si se establece en 0, el
El tamaño del video es 960x540. Utilice esta opción para reducir el uso de la CPU.

fps Especifique fps de video. El valor predeterminado es 25.

contar
Especifique el número de transformaciones por fotograma, por lo que hay fps * transformaciones de recuento por segundo.
Tenga en cuenta que la velocidad de datos de audio debe ser divisible por fps * count. El valor predeterminado es 6.

Ejemplos

· Reproducción de audio mientras se muestra el espectro:

ffplay -f lavfi 'amovie = a.mp3, asplit [a] [out1]; [a] showcqt [out0] '

· Igual que el anterior, pero con una velocidad de fotogramas de 30 fps:

ffplay -f lavfi 'amovie = a.mp3, asplit [a] [out1]; [a] showcqt = fps = 30: count = 5 [out0] '

· Jugando a 960x540 y menor uso de CPU:

ffplay -f lavfi 'amovie = a.mp3, asplit [a] [out1]; [a] showcqt = fullhd = 0: count = 3 [out0] '

· A1 y sus armónicos: A1, A2, (cerca) E3, A3:

ffplay -f lavfi 'aevalsrc=0.1*sin(2*PI*55*t)+0.1*sin(4*PI*55*t)+0.1*sin(6*PI*55*t)+0.1*sin(8*PI*55*t),
asplit [a] [out1]; [a] showcqt [out0] '

· Igual que el anterior, pero con más precisión en el dominio de la frecuencia (y más lento):

ffplay -f lavfi 'aevalsrc=0.1*sin(2*PI*55*t)+0.1*sin(4*PI*55*t)+0.1*sin(6*PI*55*t)+0.1*sin(8*PI*55*t),
asplit [a] [out1]; [a] showcqt = timeclamp = 0.5 [out0] '

· Ponderación B de igual volumen

volumen = 16 * b_weighting (f)

· Factor Q más bajo

tlongitud = 100 / f * tc / (100 / f + tc)

· Color de fuente personalizado, la nota C es de color verde, otras son de color azul

fontcolor = 'if (mod (piso (midi (f) +0.5), 12), 0x0000FF, g(1)) '

· Gamma personalizado, ahora el espectro es lineal a la amplitud.

gamma = 2: gamma2 = 2

Mostrar frecuencias
Convierta el audio de entrada en una salida de video que represente el espectro de potencia del audio. Audio
la amplitud está en el eje Y mientras que la frecuencia está en el eje X.

El filtro acepta las siguientes opciones:

tamaño, s
Especifique el tamaño del video. Para conocer la sintaxis de esta opción, marque la casilla "Video Talla" .
in las utilidades ffmpeg manual. El valor predeterminado es "1024x512".

modo
Establecer el modo de visualización. Esto establece cómo se representará cada intervalo de frecuencia.

Acepta los siguientes valores:

línea
de caramelos
punto

El valor predeterminado es "barra".

Una escala
Establecer escala de amplitud.

Acepta los siguientes valores:

lin Escala lineal.

sqrt
Escala de raíz cuadrada.

cbrt
Escala de raíz cúbica.

log Escala logarítmica.

El valor predeterminado es "registro".

fescala
Establecer escala de frecuencia.

Acepta los siguientes valores:

lin Escala lineal.

log Escala logarítmica.

registro
Escala logarítmica inversa.

El valor predeterminado es "lin".

ganar_tamaño
Establecer el tamaño de la ventana.

Acepta los siguientes valores:

w16
w32
w64
w128
w256
w512
w1024
w2048
w4096
w8192
w16384
w32768
w65536

El valor predeterminado es "w2048".

win_func
Establecer la función de ventana.

Acepta los siguientes valores:

rect
Bartlett
hanning
martilleo
hombre negro
cariño
superficie plana
barris
bnuttal
bhan
seno
loco

El valor predeterminado es "hanning".

superposición
Establecer superposición de ventanas. En el rango "[0, 1]". El valor predeterminado es 1, lo que significa una superposición óptima para
se seleccionará la función de ventana seleccionada.

promedio
Establezca el promedio de tiempo. Si se establece en 0, se mostrarán los picos máximos actuales. El valor predeterminado es
1, lo que significa que el promedio de tiempo está desactivado.

Color
Especifique la lista de colores separados por espacio o por '|' que se utilizará para dibujar el canal
frecuencias. Los colores no reconocidos o faltantes serán reemplazados por el color blanco.

showpectrum
Convierta el audio de entrada en una salida de video, que representa el espectro de frecuencias de audio.

El filtro acepta las siguientes opciones:

tamaño, s
Especifique el tamaño de video para la salida. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual. El valor predeterminado es "640x512".

diapositiva
Especifique cómo debe deslizarse el espectro a lo largo de la ventana.

Acepta los siguientes valores:

reemplazar
las muestras comienzan de nuevo a la izquierda cuando llegan a la derecha

mover
las muestras se desplazan de derecha a izquierda

fotograma completo
Los marcos solo se producen cuando las muestras alcanzan la derecha

El valor predeterminado es "reemplazar".

modo
Especifique el modo de visualización.

Acepta los siguientes valores:

combinado
todos los canales se muestran en la misma fila

separado
todos los canales se muestran en filas separadas

El valor predeterminado es combinado.

Color
Especifique el modo de color de la pantalla.

Acepta los siguientes valores:

canal
cada canal se muestra en un color separado

intensidad
cada canal se muestra usando el mismo esquema de color

El valor predeterminado es canal.

escala
Especifique la escala utilizada para calcular los valores de color de intensidad.

Acepta los siguientes valores:

lin lineal

sqrt
raíz cuadrada, predeterminado

cbrt
raíz cúbica

log logarítmica

El valor predeterminado es sqrt.

saturación
Establece el modificador de saturación para los colores mostrados. Los valores negativos proporcionan una alternativa
esquema de colores. 0 es sin saturación en absoluto. La saturación debe estar en el rango [-10.0, 10.0].
El valor predeterminado es 1.

win_func
Establecer la función de ventana.

Acepta los siguientes valores:

ninguna
Sin procesamiento previo de muestras (no espere que esto sea más rápido)

hann
Ventana de Hann

martilleo
Ventana de Hamming

hombre negro
Ventana de Blackman

El valor predeterminado es "hann".

El uso es muy similar al filtro showwaves; vea los ejemplos en esa sección.

Ejemplos

· Gran ventana con escala de color logarítmica:

showspectrum = s = 1280x480: scale = log

· Ejemplo completo para un espectro deslizante y coloreado por canal usando ffplay:

ffplay -f lavfi 'amovie = input.mp3, asplit [a] [out1];
[a] muestra espectro = modo = separado: color = intensidad: diapositiva = 1: escala = cbrt [out0] '

mostrar volumen
Convierta el volumen de audio de entrada en una salida de video.

El filtro acepta las siguientes opciones:

Velocidad, r
Establecer velocidad de video.

b Establecer el ancho del borde, el rango permitido es [0, 5]. El valor predeterminado es 1.

w Configure el ancho del canal, el rango permitido es [40, 1080]. El valor predeterminado es 400.

h Establecer la altura del canal, el rango permitido es [1, 100]. El valor predeterminado es 20.

f Ajuste el desvanecimiento, el rango permitido es [1, 255]. El valor predeterminado es 20.

c Establece la expresión del color del volumen.

La expresión puede utilizar las siguientes variables:

VOLUMEN
Volumen máximo actual del canal en dB.

CANAL
Número de canal actual, comenzando desde 0.

t Si está configurado, muestra los nombres de los canales. El valor predeterminado está habilitado.

ondas de espectáculo
Convierta el audio de entrada en una salida de video, que representa las ondas de muestras.

El filtro acepta las siguientes opciones:

tamaño, s
Especifique el tamaño de video para la salida. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual. El valor predeterminado es "600x240".

modo
Establecer el modo de visualización.

Los valores disponibles son:

punto
Dibuja un punto para cada muestra.

línea
Dibuja una línea vertical para cada muestra.

p2p Dibuja un punto para cada muestra y una línea entre ellos.

clina
Dibuja una línea vertical centrada para cada muestra.

El valor predeterminado es "punto".

n Establezca el número de muestras que se imprimen en la misma columna. Un valor mayor
Disminuya la velocidad de fotogramas. Debe ser un número entero positivo. Esta opción solo se puede configurar si
el valor de y no se especifica explícitamente.

Velocidad, r
Establezca la velocidad de fotogramas de salida (aproximada). Esto se hace configurando la opción n. Defecto
el valor es "25".

canales_divididos
Establezca si los canales deben dibujarse por separado o superponerse. El valor predeterminado es 0.

Ejemplos

· Salida del audio del archivo de entrada y la representación de video correspondiente al mismo
hora:

amovie = a.mp3, asplit [out0], showwaves [out1]

· Crea una señal sintética y muéstrala con showwaves, forzando una velocidad de fotogramas de 30
cuadros por segundo:

aevalsrc=sin(1*2*PI*t)*sin(880*2*PI*t):cos(2*PI*200*t),asplit[out0],showwaves=r=30[out1]

showwavespic
Convierta el audio de entrada en un solo cuadro de video, que representa las ondas de muestras.

El filtro acepta las siguientes opciones:

tamaño, s
Especifique el tamaño de video para la salida. Para conocer la sintaxis de esta opción, marque la casilla "Video
Talla" . in las utilidades ffmpeg manual. El valor predeterminado es "600x240".

canales_divididos
Establezca si los canales deben dibujarse por separado o superponerse. El valor predeterminado es 0.

Ejemplos

· Extrae una representación de canal dividido de la forma de onda de una pista de audio completa en un
Imagen de 1024x800 usando ffmpeg:

ffmpeg -i audio.flac -lavfi showwavespic = split_channels = 1: s = 1024x800 waveform.png

separar, Una parte
Divida la entrada en varias salidas idénticas.

"asplit" funciona con entrada de audio, "split" con video.

El filtro acepta un solo parámetro que especifica el número de salidas. Si
sin especificar, el valor predeterminado es 2.

Ejemplos

· Cree dos salidas independientes a partir de la misma entrada:

[in] dividir [out0] [out1]

· Para crear 3 o más salidas, necesita especificar el número de salidas, como en:

[in] asplit = 3 [out0] [out1] [out2]

· Cree dos salidas independientes a partir de la misma entrada, una recortada y otra rellena:

[en] dividir [splitout1] [splitout2];
[splitout1] crop=100:100:0:0 [cropout];
[splitout2] pad=200:200:100:100 [padout];

· Crea 5 copias del audio de entrada con ffmpeg:

ffmpeg -i ENTRADA -filter_complex asplit = 5 SALIDA

zmq, azmq
Reciba los comandos enviados a través de un cliente libzmq y reenvíelos a los filtros en el
gráfico de filtro

"zmq" y "azmq" funcionan como filtros de paso. "zmq" debe insertarse entre dos videos
filtros, "azmq" entre dos filtros de audio.

Para habilitar estos filtros, debe instalar la biblioteca libzmq y los encabezados y configurar
FFmpeg con "--enable-libzmq".

Para obtener más información sobre libzmq, consulte:http://www.zeromq.org/>

Los filtros "zmq" y "azmq" funcionan como un servidor libzmq, que recibe los mensajes enviados a través de
una interfaz de red definida por el dirección_vinculada .

El mensaje recibido debe tener el siguiente formato:

[ ]

OBJETIVO especifica el destino del comando, generalmente el nombre de la clase de filtro o un
nombre de instancia de filtro específico.

COMANDO especifica el nombre del comando para el filtro de destino.

ARG es opcional y especifica la lista de argumentos opcionales para el COMANDO.

Tras la recepción, el mensaje se procesa y el comando correspondiente se inyecta en
el gráfico de filtro. Dependiendo del resultado, el filtro enviará una respuesta al cliente,
adoptando el formato:




MENSAJE es opcional.

Ejemplos

Revisa herramientas / zmqsend para un ejemplo de un cliente zmq que se puede utilizar para enviar comandos
procesado por estos filtros.

Considere el siguiente gráfico de filtro generado por ffplay

ffplay -dumpgraph 1 -f lavfi "
color = s = 100x100: c = rojo [l];
color = s = 100x100: c = azul [r];
nullsrc = s = 200x100, zmq [bg];
[bg] [l] superposición [bg + l];
[bg + l] [r] superposición = x = 100 "

Para cambiar el color del lado izquierdo del video, se puede usar el siguiente comando:

echo Parsed_color_0 c amarillo | herramientas / zmqsend

Para cambiar el lado derecho:

echo Parsed_color_1 c rosa | herramientas / zmqsend

MULTIMEDIA FUENTES


A continuación se muestra una descripción de las fuentes multimedia disponibles actualmente.

una película
Esto es lo mismo que película fuente, excepto que selecciona una secuencia de audio de forma predeterminada.

película
Leer secuencias de audio y / o video de un contenedor de películas.

Acepta los siguientes parámetros:

nombre de archivo
El nombre del recurso a leer (no necesariamente un archivo; también puede ser un dispositivo o un
secuencia a la que se accede a través de algún protocolo).

nombre_formato, f
Especifica el formato asumido para la lectura de la película y puede ser el nombre de un
contenedor o un dispositivo de entrada. Si no se especifica, el formato se adivina a partir de nombre de pelicula
o sondeando.

buscar_punto, sp
Especifica el punto de búsqueda en segundos. Los fotogramas se emitirán a partir de esta búsqueda.
punto. El parámetro se evalúa con "av_strtod", por lo que el valor numérico puede ser
sufijado por un sufijo IS. El valor predeterminado es "0".

arroyos, s
Especifica las transmisiones que se leerán. Se pueden especificar varios flujos, separados por "+". El
la fuente tendrá entonces tantas salidas, en el mismo orden. La sintaxis se explica en
la sección `` Especificadores de flujo '' en el manual de ffmpeg. Dos nombres especiales, "dv" y
"da" especifica respectivamente el flujo de audio y video predeterminado (el más adecuado). El valor predeterminado es
"dv" o "da" si el filtro se llama "película".

flujo_índice, si
Especifica el índice de la transmisión de video para leer. Si el valor es -1, el más adecuado
La secuencia de video se seleccionará automáticamente. El valor predeterminado es "-1". Obsoleto. Si
el filtro se llama "película", seleccionará audio en lugar de video.

loops
Especifica cuántas veces se debe leer la secuencia en secuencia. Si el valor es menor que 1,
la secuencia se leerá una y otra vez. El valor predeterminado es "1".

Tenga en cuenta que cuando la película se reproduce en bucle, las marcas de tiempo de origen no se cambian, por lo que
generar marcas de tiempo no monótonamente crecientes.

Permite superponer un segundo video sobre la entrada principal de un gráfico de filtro, como se muestra en
este gráfico:

entrada -----------> deltapts0 -> superposición -> salida
^
|
película -> escala -> deltapts1 ------- +

Ejemplos

· Omita 3.2 segundos desde el inicio del archivo AVI en.avi y superpóngalo en la parte superior del
entrada etiquetada "en":

movie = in.avi: seek_point = 3.2, scale = 180: -1, setpts = PTS-STARTPTS [over];
[en] setpts = PTS-STARTPTS [principal];
[principal] [superposición] superposición = 16: 16 [fuera]

· Leer desde un dispositivo video4linux2 y superponerlo sobre la entrada etiquetada "in":

movie = / dev / video0: f = video4linux2, scale = 180: -1, setpts = PTS-STARTPTS [terminado];
[en] setpts = PTS-STARTPTS [principal];
[principal] [superposición] superposición = 16: 16 [fuera]

· Lea el primer flujo de video y el flujo de audio con id 0x81 de dvd.vob; el video
está conectado al pad llamado "video" y el audio está conectado al pad llamado
"audio":

película = dvd.vob: s = v: 0 + # 0x81 [video] [audio]

Use filtros ffmpeg en línea usando los servicios de onworks.net


Servidores y estaciones de trabajo gratuitos

Descargar aplicaciones de Windows y Linux

  • 1
    Phaser
    Phaser
    Phaser es una apertura rápida, gratuita y divertida
    marco de juego HTML5 de origen que ofrece
    Representación de WebGL y Canvas en
    navegadores web de escritorio y móviles. Juegos
    puede ser co ...
    Descargar Phaser
  • 2
    Motor VASSAL
    Motor VASSAL
    VASSAL es un motor de juego para crear
    Versiones electrónicas de tablero tradicional.
    y juegos de cartas. Proporciona soporte para
    representación e interacción de las piezas del juego,
    y ...
    Descargar motor VASSAL
  • 3
    OpenPDF - Bifurcación de iText
    OpenPDF - Bifurcación de iText
    OpenPDF es una biblioteca de Java para crear
    y edición de archivos PDF con LGPL y
    Licencia MPL de código abierto. OpenPDF es el
    LGPL/MPL sucesor de código abierto de iText,
    un ...
    Descargar OpenPDF - Bifurcación de iText
  • 4
    SIG SAGA
    SIG SAGA
    SAGA - Sistema para automatizado
    Análisis geocientíficos - es un análisis geográfico
    Software del sistema de información (GIS) con
    inmensas capacidades para geodatos
    procesamiento y ana ...
    Descargar SIG SAGA
  • 5
    Caja de herramientas para Java / JTOpen
    Caja de herramientas para Java / JTOpen
    IBM Toolbox para Java / JTOpen es un
    biblioteca de clases de Java que soporta el
    programacion cliente/servidor e internet
    modelos a un sistema que ejecuta OS/400,
    i5/OS, o...
    Descargar Toolbox para Java/JTOpen
  • 6
    D3.js
    D3.js
    D3.js (o D3 para documentos basados ​​en datos)
    es una biblioteca de JavaScript que le permite
    para producir datos dinámicos e interactivos
    visualizaciones en navegadores web. con D3
    tú...
    Descargar D3.js
  • Más "

Comandos de Linux

  • 1
    arbitro
    arbitro
    abidiff - comparar ABI de archivos ELF
    abidiff compara el binario de la aplicación
    Interfaces (ABI) de dos bibliotecas compartidas
    en formato ELF. emite un significado
    informar ...
    Ejecutar abidiff
  • 2
    cumplir
    cumplir
    abidw - serializa el ABI de un ELF
    archivo abidw lee una biblioteca compartida en ELF
    formato y emite una representación XML
    de su ABI a la salida estándar. El
    emitido...
    Ejecutar abidw
  • 3
    copac2xml
    copac2xml
    bibutils - conversión de bibliografía
    utilidades...
    Ejecutar copac2xml
  • 4
    copto
    copto
    copt - optimizador de mirilla SYSNOPIS:
    archivo copt.. DESCRIPCIÓN: copt es un archivo
    optimizador de mirilla de uso general. Él
    lee el código de su entrada estándar y
    escribe un...
    Ejecutar copia
  • 5
    reunir_stx_títulos
    reunir_stx_títulos
    reunir_stx_titles - recopilar título
    declaraciones de documentos Stx ...
    Ejecute reunir_stx_títulos
  • 6
    banco-gatling
    banco-gatling
    banco - punto de referencia http ...
    Ejecutar gatling-banco
  • Más "

Ad