jogar - online na nuvem

Este é o jogo de comando que pode ser executado no provedor de hospedagem gratuita OnWorks usando uma de nossas várias estações de trabalho online gratuitas, como Ubuntu Online, Fedora Online, emulador online do Windows ou emulador online do MAC OS

PROGRAMA:

NOME


SoX - Sound eXchange, o canivete suíço da manipulação de áudio

SINOPSE


Sox [opções globais] [opções de formato] arquivo1
[[opções de formato] arquivo2] ... [opções de formato] arquivo de saída
[efeito [opções de efeito]] ...

play [opções globais] [opções de formato] arquivo1
[[opções de formato] arquivo2] ... [opções de formato]
[efeito [opções de efeito]] ...

rec [opções globais] [opções de formato] arquivo de saída
[efeito [opções de efeito]] ...

DESCRIÇÃO


Conheça
O SoX lê e grava arquivos de áudio nos formatos mais populares e pode, opcionalmente, aplicar efeitos
para eles. Ele pode combinar várias fontes de entrada, sintetizar áudio e, em muitos sistemas,
atuar como um reprodutor de áudio de uso geral ou um gravador de áudio multitrilha. Também limitou
capacidade de dividir a entrada em vários arquivos de saída.

Todas as funcionalidades do SoX estão disponíveis usando apenas o Sox comando. Para simplificar o jogo e
gravação de áudio, se SoX for invocado como play, o arquivo de saída é automaticamente definido para ser o
dispositivo de som padrão, e se invocado como rec, o dispositivo de som padrão é usado como uma entrada
fonte. Além disso, o Soxi(1) o comando fornece uma maneira conveniente de apenas consultar o áudio
informações do cabeçalho do arquivo.

O coração do SoX é uma biblioteca chamada libSoX. Os interessados ​​em estender o SoX ou usar
em outros programas deve consultar a página de manual libSoX: libsox(3).

SoX é uma ferramenta de processamento de áudio de linha de comando, particularmente adequada para tornar rápido e simples
edições e processamento em lote. Se você precisa de um editor de áudio gráfico interativo, use
audácia(1).

* * *

A cadeia geral de processamento do SoX pode ser resumida da seguinte forma:

Entrada (s) → Combinador → Efeitos → Saída (s)

Observe, entretanto, que na linha de comando do SoX, as posições da (s) saída (ões) e dos efeitos
são trocados em relação ao fluxo lógico que acabou de ser mostrado. Observe também que, embora as opções pertencentes a
para os arquivos são colocados antes de seus respectivos nomes de arquivo, o oposto é verdadeiro para os efeitos.
Para mostrar como isso funciona na prática, aqui está uma seleção de exemplos de como o SoX pode ser
usado. O simples
sox considerando.au considerando.wav
traduz um arquivo de áudio no formato Sun AU para um arquivo WAV da Microsoft, enquanto
sox recital.au -b 16 recital.wav canais 1 taxa 16k fade 3 norma
executa a mesma tradução de formato, mas também aplica quatro efeitos (mixagem para um
canal, mudança de taxa de amostragem, fade-in, nomalize) e armazena o resultado em uma profundidade de bits de
16.
sox -r 16k -e assinado -b 8 -c 1 voice-memo.raw voice-memo.wav
converte áudio `bruto '(também conhecido como` cabeçalho') em um formato de arquivo autoexplicativo,
sox slow.aiff velocidade fixa.aiff 1.027
ajusta a velocidade do áudio,
sox short.wav long.wav long.wav
concatena dois arquivos de áudio e
sox -m music.mp3 voice.wav mixado.flac
mistura dois arquivos de áudio.
toque baixo "The Moonbeams / Greatest / *. ogg" +3
reproduz uma coleção de arquivos de áudio enquanto aplica um efeito de reforço de graves,
play -n -c1 synth sin% -12 sin% -9 sin% -5 sin% -2 fade h 0.1 1 0.1
toca um acorde sintetizado "Uma sétima menor" com som de órgão de tubos,
rec -c 2 radio.aiff trim 0 30:00
grava meia hora de áudio estéreo e
play -q take1.aiff & rec -M take1.aiff take1-dub.aiff
(com shell POSIX e onde for suportado por hardware) grava uma nova trilha em um multi-track
gravação. Finalmente,
rec -r 44100 -b 16 -s -p silêncio 1 0.50 0.1% 1 10:00 0.1% |
sox -p música.ogg silêncio 1 0.50 0.1% 1 2.0 0.1%:
newfile: reiniciar
grava um fluxo de áudio, como LP / cassete e divide em vários arquivos de áudio em
pontos com 2 segundos de silêncio. Além disso, ele não começa a gravar até detectar
o áudio está tocando e para depois de 10 minutos de silêncio.

NB O texto acima é apenas uma visão geral dos recursos do SoX; explicações detalhadas de como
usar todos os Parâmetros SoX, formatos de arquivo e efeitos podem ser encontrados abaixo neste manual, em
formato sox(7), e em Soxi(1).

Envie o Formato Tipos
O SoX pode trabalhar com arquivos de áudio `autodescritivos 'e` brutos'. formatos `autodescritivos '
(por exemplo, WAV, FLAC, MP3) têm um cabeçalho que descreve completamente o sinal e a codificação
atributos dos dados de áudio que se seguem. formatos `raw 'ou` headerless' não contêm
esta informação, então as características de áudio destas devem ser descritas no SoX
linha de comando ou inferidos daqueles do arquivo de entrada.

As quatro características a seguir são usadas para descrever o formato dos dados de áudio de forma que
pode ser processado com SoX:

taxa de amostragem
A taxa de amostragem em amostras por segundo (`Hertz 'ou` Hz'). Telefonia digital
tradicionalmente usa uma taxa de amostragem de 8000 Hz (8 kHz), embora atualmente, 16 e até
32 kHz estão se tornando mais comuns. Os discos compactos de áudio usam 44100 Hz (44.1 kHz).
A fita de áudio digital e muitos sistemas de computador usam 48 kHz. Sistemas de áudio profissionais
costumam usar 96 kHz.

tamanho da amostra
O número de bits usados ​​para armazenar cada amostra. Hoje, 16 bits é comumente usado.
O 8 bits era popular nos primeiros dias do áudio de computador. 24 bits é usado no
arena de áudio profissional. Outros tamanhos também são usados.

codificação de dados
A forma como cada amostra de áudio é representada (ou 'codificada'). Algumas codificações
têm variantes com diferentes ordenações de bytes ou bits. Alguns comprimem o
dados de áudio para que os dados de áudio armazenados ocupem menos espaço (ou seja, espaço em disco ou
largura de banda de transmissão) do que os outros parâmetros de formato e o número de amostras
implicaria. Os tipos de codificação comumente usados ​​incluem ponto flutuante, lei μ, ADPCM,
PCM inteiro assinado, MP3 e FLAC.

canais
O número de canais de áudio contidos no arquivo. Um (`mono ') e dois
('estéreo') são amplamente utilizados. O áudio de `som surround 'normalmente contém seis ou mais
Canais.

O termo 'taxa de bits' é uma medida da quantidade de armazenamento ocupado por um áudio codificado
sinal ao longo de uma unidade de tempo. Pode depender de todos os itens acima e é normalmente denotado como
um número de quilobits por segundo (kbps). Um sinal de telefonia A-law tem uma taxa de bits de 64
kbps. Música estéreo codificada em MP3 normalmente tem uma taxa de bits de 128-196 kbps. FLAC-codificado
música estéreo normalmente tem uma taxa de bits de 550-760 kbps.

A maioria dos formatos autoexplicativos também permitem que "comentários" textuais sejam incorporados ao arquivo que
pode ser usado para descrever o áudio de alguma forma, por exemplo, para música, o título, o autor, etc.

Um uso importante dos comentários do arquivo de áudio é transmitir informações de `Replay Gain '. SoX
oferece suporte à aplicação de informações de Replay Gain, mas não à sua geração. Observe que, por padrão,
O SoX copia os comentários do arquivo de entrada para arquivos de saída que suportam comentários, portanto, os arquivos de saída podem
conter informações de Replay Gain se alguma estiver presente no arquivo de entrada. Neste caso, se
qualquer coisa diferente de uma conversão de formato simples foi realizada, em seguida, o arquivo de saída Replay
As informações de ganho provavelmente estão incorretas e, portanto, devem ser recalculadas usando uma ferramenta que
suporta isso (não SoX).

O Soxi(1) comando pode ser usado para exibir informações de cabeçalhos de arquivo de áudio.

determinando & Configuração O Envie o Formato
Existem vários mecanismos disponíveis para o SoX usar para determinar ou definir o formato
características de um arquivo de áudio. Dependendo das circunstâncias,
características podem ser determinadas ou definidas usando diferentes mecanismos.

Para determinar o formato de um arquivo de entrada, o SoX usará, em ordem de precedência e como
dado ou disponível:

1. Opções de formato de linha de comando.

2. O conteúdo do cabeçalho do arquivo.

3. A extensão do nome do arquivo.

Para definir o formato do arquivo de saída, o SoX usará, em ordem de precedência e conforme fornecido ou
disponível:

1. Opções de formato de linha de comando.

2. A extensão do nome do arquivo.

3. As características do formato do arquivo de entrada, ou o mais próximo que é suportado pela saída
tipo de arquivo.

Para todos os arquivos, o SoX sairá com um erro se o tipo de arquivo não puder ser determinado. Comando-
pode ser necessário adicionar ou alterar opções de formato de linha para resolver o problema.

Jogando & Gravação em áudio
O play e rec comandos são fornecidos para que a reprodução e gravação básicas sejam tão simples quanto
reproduzir arquivo existente.wav
e
rec novo arquivo.wav
Esses dois comandos são funcionalmente equivalentes a
sox arquivo-existente.wav -d
e
sox -d novo-arquivo.wav
Claro, outras opções e efeitos (conforme descrito abaixo) podem ser adicionados aos comandos
em qualquer forma.

* * *

Alguns sistemas fornecem mais de um tipo de driver de áudio (compatível com SoX), por exemplo, ALSA & OSS,
ou SUNAU & AO. Os sistemas também podem ter mais de um dispositivo de áudio (também conhecido como `placa de som ').
Se mais de um driver de áudio foi integrado ao SoX, e o padrão selecionado pelo SoX
quando gravar ou reproduzir não é o desejado, então o DRIVER DE ÁUDIO meio Ambiente
variável pode ser usada para substituir o padrão. Por exemplo (em muitos sistemas):
definir AUDIODRIVER = oss
Toque ...
O AUDIODEV a variável de ambiente pode ser usada para substituir o dispositivo de áudio padrão, por exemplo
definir AUDIODEV = / dev / dsp2
Toque ...
sox... -t oss
or
definir AUDIODEV = hw: soundwave, 1,2
Toque ...
sox ... -t também
Observe que a maneira de definir as variáveis ​​de ambiente varia de sistema para sistema - para alguns
exemplos específicos, veja `SOX_OPTS 'abaixo.

Ao reproduzir um arquivo com uma taxa de amostragem que não é compatível com o dispositivo de saída de áudio,
SoX irá invocar automaticamente o taxas efeito para realizar a taxa de amostragem necessária
conversão. Para compatibilidade com hardware antigo, o padrão taxas nível de qualidade está definido para
`baixo '. Isso pode ser alterado especificando explicitamente o taxas efeito com um diferente
nível de qualidade, por exemplo
jogar ... avalie-m
ou usando o - play-rate-arg opção (veja abaixo).

* * *

Em alguns sistemas, o SoX permite que o volume de reprodução de áudio seja ajustado durante o uso play. Onde
suportado, isso é conseguido tocando nas teclas `v 'e` V' durante a reprodução.

Para ajudar a definir um nível de gravação adequado, o SoX inclui um medidor de nível de pico que pode
ser invocado (antes de fazer a gravação real) da seguinte maneira:
rec-n
O nível de gravação deve ser ajustado (usando o programa de mixer fornecido pelo sistema, não SoX)
de modo que o medidor seja at a maioria ocasionalmente escala completa, e nunca "no vermelho" (um
ponto de exclamação é mostrado). Veja também -S abaixo.

Precisão
Muitos formatos de arquivo que compactam áudio descartam algumas das informações do sinal de áudio enquanto
fazendo isso. Converter para esse formato e, em seguida, converter de volta não produzirá um
cópia exata do áudio original. Este é o caso de muitos formatos usados ​​em telefonia
(por exemplo, A-law, GSM), onde a largura de banda de baixo sinal é mais importante do que a alta fidelidade de áudio,
e para muitos formatos usados ​​em reprodutores de música portáteis (por exemplo, MP3, Vorbis), quando adequado
a fidelidade pode ser mantida, mesmo com as grandes taxas de compressão que são necessárias para fazer
jogadores portáteis práticos.

Os formatos que descartam as informações do sinal de áudio são chamados de `com perdas '. Formatos que não são
chamado de `sem perdas '. O termo 'qualidade' é usado como uma medida de quão próximo o original
o sinal de áudio pode ser reproduzido ao usar um formato com perdas.

A conversão de arquivos de áudio com SoX é sem perdas quando pode, ou seja, quando não é usada com perdas
compressão, quando não reduzir a taxa de amostragem ou número de canais, e quando o
o número de bits usados ​​no formato de destino não é menor do que no formato de origem. Por exemplo
a conversão de um formato PCM de 8 bits para um formato PCM de 16 bits não apresenta perdas, mas a conversão de
um formato PCM de 8 bits para (8 bits) A-law não é.

NB O SoX converte todos os arquivos de áudio para um formato interno descompactado antes de executar
qualquer processamento de áudio. Isso significa que manipular um arquivo armazenado em um formato com perdas
pode causar mais perdas na fidelidade do áudio. Por exemplo, com
sox longo.mp3 curto.mp3 corte 10
O SoX primeiro descompacta o arquivo MP3 de entrada e, em seguida, aplica o aparar efeito, e finalmente
cria o arquivo MP3 de saída comprimindo o áudio - com uma possível redução em
fidelidade acima daquela que ocorreu quando o arquivo de entrada foi criado. Portanto, se o que é
em última análise, o desejado é o áudio compactado com perdas, é altamente recomendável realizar todos os
processamento de áudio usando formatos de arquivo sem perdas e, em seguida, converter para o formato com perdas apenas em
a fase final.

NB Aplicar vários efeitos com uma única invocação SoX irá, em geral, produzir
resultados mais precisos do que aqueles produzidos usando múltiplas invocações SoX.

Pontilhado
Dithering é uma técnica usada para maximizar a faixa dinâmica de áudio armazenado em um
profundidade de bits particular. Qualquer distorção introduzida pela quantização é decorrelated adicionando
uma pequena quantidade de ruído branco para o sinal. Na maioria dos casos, o SoX pode determinar se o
o processamento selecionado requer pontilhamento e irá adicioná-lo durante a formatação de saída se
apropriado.

Especificamente, por padrão, o SoX adiciona automaticamente pontilhamento TPDF quando a profundidade de bits de saída é
menos de 24 e qualquer um dos seguintes são verdadeiros:

· A redução da profundidade de bits foi especificada explicitamente usando uma opção de linha de comando

· O formato do arquivo de saída suporta apenas profundidades de bits menores do que o arquivo de entrada
formato

· Um efeito aumentou a profundidade de bits efetiva dentro da cadeia de processamento interna

Por exemplo, ajustar o volume com vol 0.25 requer dois bits adicionais nos quais
armazene sem perdas seus resultados (uma vez que 0.25 decimal é igual a 0.01 binário). Então, se a entrada
a profundidade de bits do arquivo é 16, então a representação interna do SoX utilizará 18 bits após
processar esta mudança de volume. A fim de armazenar a saída na mesma profundidade que o
entrada, o pontilhamento é usado para remover os bits adicionais.

Use o -V opção para ver qual processamento o SoX adicionou automaticamente. o -D opção pode ser
dado para substituir o pontilhamento automático. Para invocar o pontilhamento manualmente (por exemplo, para selecionar um
curva de modelagem de ruído), consulte o estremecimento efeito.

Clipping
O corte é a distorção que ocorre quando um nível de sinal de áudio (ou `volume ') excede o
intervalo da representação escolhida. Na maioria dos casos, o corte é indesejável e, portanto, deveria
ser corrigido ajustando o nível anterior ao ponto (na cadeia de processamento) em que
ocorre.

No SoX, o corte pode ocorrer, como você pode esperar, ao usar o vol or de ganho efeitos para
aumentar o volume do áudio. O corte também pode ocorrer com muitos outros efeitos, quando
convertendo um formato para outro, e mesmo quando simplesmente reproduzindo o áudio.

A reprodução de um arquivo de áudio frequentemente envolve reamostragem, e o processamento por componentes analógicos pode
introduzir um pequeno deslocamento DC e / ou amplificação, todos os quais podem produzir distorção se
o nível do sinal de áudio estava inicialmente muito próximo do ponto de corte.

Por essas razões, é normal certificar-se de que o nível de sinal de um arquivo de áudio tem algum
'headroom', ou seja, não excede um determinado nível abaixo do nível máximo possível
para a representação dada. Alguns organismos de padrões recomendam até 9dB de headroom,
mas na maioria dos casos, 3dB (≈ 70% linear) é o suficiente. Observe que essa sabedoria parece ter sido
perdido na produção musical moderna; na verdade, muitos CDs, MP3s, etc. agora são masterizados em níveis
acima 0dBFS, ou seja, o áudio é cortado conforme entregue.

SoX's estado e stats os efeitos podem ajudar a determinar o nível do sinal em um arquivo de áudio.
O de ganho or vol efeito pode ser usado para evitar corte, por exemplo
sox dull.wav bright.wav gain -6 agudos +6
garante que o aumento de agudos não será cortado.

Se o corte ocorrer em qualquer ponto durante o processamento, o SoX exibirá uma mensagem de aviso para
esse efeito.

Veja também -G e de ganho e norma efeitos.

Entrada Envie o Combinando
O combinador de entrada do SoX pode ser configurado (veja as OPÇÕES abaixo) para combinar vários arquivos usando
qualquer um dos seguintes métodos: `concatenar ',` sequência', `misturar ',` misturar poder', `mesclar 'ou
`multiplique '. O método padrão é 'seqüência' para play, e `concatenar 'para rec e Sox.

Para todos os métodos diferentes de `sequência ', vários arquivos de entrada devem ter a mesma amostra
avaliar. Se necessário, invocações SoX separadas podem ser usadas para fazer ajustes de taxa de amostragem
antes de combinar.

Se o método de combinação `concatenar 'for selecionado (normalmente, será o padrão), então
os arquivos de entrada também devem ter o mesmo número de canais. O áudio de cada entrada
será concatenado na ordem fornecida para formar o arquivo de saída.

O método de combinação de 'sequência' é selecionado automaticamente para play. É similar à
`concatenar 'no sentido de que o áudio de cada arquivo de entrada é enviado serialmente para o arquivo de saída.
No entanto, aqui o arquivo de saída pode ser fechado e reaberto na transição correspondente
entre os arquivos de entrada. Isso pode ser exatamente o que é necessário ao enviar diferentes tipos de áudio
para um dispositivo de saída, mas geralmente não é útil quando a saída é um arquivo normal.

Se o método de combinação `mix 'ou` mix-power' for selecionado, então duas ou mais entradas
os arquivos devem ser fornecidos e serão misturados para formar o arquivo de saída. O número de
canais em cada arquivo de entrada não precisam ser os mesmos, mas o SoX emitirá um aviso se eles forem
not e alguns canais no arquivo de saída não conterão áudio de todos os arquivos de entrada. UMA
o arquivo de áudio misturado não pode ser descompactado sem referência aos arquivos de entrada originais.

Se o método de combinação 'mesclar' for selecionado, dois ou mais arquivos de entrada devem ser fornecidos e
serão mesclados para formar o arquivo de saída. O número de canais em cada entrada
arquivo não precisa ser o mesmo. Um arquivo de áudio mesclado compreende todos os canais de todos os
os arquivos de entrada. Desfazer a mesclagem é possível usando várias invocações de SoX com o Remix
efeito. Por exemplo, dois arquivos mono podem ser mesclados para formar um arquivo estéreo. O primeiro
e os segundos arquivos mono se tornariam os canais esquerdo e direito do arquivo estéreo.

O método de combinação `multiplicar 'multiplica os valores de amostra dos canais correspondentes
(tratados como números no intervalo -1 a +1). Se o número de canais na entrada
arquivos não é o mesmo, os canais ausentes são considerados como contendo todos zero.

Ao combinar os arquivos de entrada, o SoX aplica quaisquer efeitos especificados (incluindo, por exemplo, o
vol efeito de ajuste de volume) após o áudio ter sido combinado. No entanto, é frequentemente
útil ser capaz de definir o volume (ou seja, 'equilibrar') as entradas individualmente, antes
a combinação ocorre.

Para todos os métodos de combinação, os ajustes de volume do arquivo de entrada podem ser feitos manualmente usando o -v
opção (abaixo) que pode ser fornecida para um ou mais arquivos de entrada. Se for dado apenas para
alguns dos arquivos de entrada e os outros não recebem ajuste de volume. Em alguns
circunstâncias, ajustes automáticos de volume podem ser aplicados (veja abaixo).

O -V opção (abaixo) pode ser usada para mostrar os ajustes de volume do arquivo de entrada que foram
selecionado (manual ou automaticamente).

Existem algumas considerações especiais que precisam ser feitas ao misturar arquivos de entrada:

Ao contrário de outros métodos, a combinação `mix 'tem o potencial de causar recorte no
combinador se nenhum balanceamento for executado. Neste caso, se os ajustes manuais de volume não forem
dado, o SoX tentará garantir que o corte não ocorra ajustando automaticamente o
volume (amplitude) de cada sinal de entrada por um fator de ¹ / n, onde n é o número de entrada
arquivos. Se isso resultar em um áudio muito baixo ou desequilibrado de outra forma, a entrada
os volumes dos arquivos podem ser configurados manualmente conforme descrito acima. Usando o norma efeito na mistura é
outra alternativa.

Se o áudio mixado parecer alto o suficiente em alguns pontos, mas muito baixo em outros, então a faixa dinâmica
compressão deve ser aplicada para corrigir isso - veja o comando efeito.

Com o método de combinação 'mix-power', o volume misturado é aproximadamente igual ao de
um dos sinais de entrada. Isso é obtido pelo equilíbrio usando um fator de ¹ / √n em vez de
¹ / n. Observe que este fator de equilíbrio não garante que o corte não ocorrerá, mas
o número de clipes geralmente será baixo e a distorção resultante é geralmente
imperceptível.

saída Arquivos
O comportamento padrão do SoX é pegar um ou mais arquivos de entrada e gravá-los em um único
arquivo de saída.

Este comportamento pode ser alterado especificando o pseudo-efeito `newfile 'dentro dos efeitos
Lista. O SoX entrará então no modo de saída múltipla.

No modo de saída múltipla, um novo arquivo é criado quando os efeitos anteriores ao `newfile '
indicar que eles estão prontos. A cadeia de efeitos listada após `newfile 'é então iniciada e
sua saída é salva no novo arquivo.

No modo de saída múltipla, um número único será automaticamente anexado ao final de todos
nomes de arquivos. Se o nome do arquivo tiver uma extensão, o número será inserido antes do
extensão. Este comportamento pode ser personalizado colocando um% n em qualquer lugar do nome do arquivo
onde o número deve ser substituído. Um número opcional pode ser colocado após o% para
indicar uma largura mínima fixa para o número.

O modo de saída múltipla não é muito útil a menos que um efeito que pare a cadeia de efeitos
early é especificado antes do `newfile '. Se o fim do arquivo for alcançado antes dos efeitos
a cadeia pára sozinha e nenhum novo arquivo será criado, pois estaria vazio.

A seguir está um exemplo de divisão dos primeiros 60 segundos de um arquivo de entrada em dois 30
segundos arquivos e ignorando o resto.
sox song.wav ringtone% 1n.wav trim 0 30: newfile: trim 0 30

Paragem Sox
Normalmente, o SoX conclui seu processamento e sai automaticamente depois de ler todos
dados de áudio disponíveis dos arquivos de entrada.

Se desejado, ele pode ser encerrado antes, enviando um sinal de interrupção para o processo
(geralmente pressionando a tecla de interrupção do teclado, que normalmente é Ctrl-C). Isto é um
requisito natural em algumas circunstâncias, por exemplo, ao usar o SoX para fazer uma gravação. Observação
que ao usar o SoX para reproduzir vários arquivos, Ctrl-C se comporta de maneira um pouco diferente: pressionando
uma vez, faz com que o SoX pule para o próximo arquivo; pressioná-lo duas vezes em rápida sucessão causa
SoX para sair.

Outra opção para interromper o processamento antecipadamente é usar um efeito que tenha um período de tempo ou
contagem de amostra para determinar o ponto de parada. O efeito de corte é um exemplo disso. Uma vez
todas as cadeias de efeitos foram interrompidas, então o SoX também irá parar.

NOMES DE ARQUIVOS


Os nomes de arquivo podem ser nomes de arquivo simples, nomes de caminho absolutos ou relativos ou URLs (arquivos de entrada
só). Observe que o suporte de URL requer que wget(1) está disponível.

Nota: Dar ao SoX um nome de arquivo de entrada ou saída que é o mesmo que um nome de efeito SoX irá
não funciona, pois o SoX o tratará como uma especificação de efeito. A única solução para isso
é evitar esses nomes de arquivo. Isso geralmente não é difícil, pois a maioria dos nomes de arquivos de áudio
tem uma `extensão 'de nome de arquivo, enquanto os nomes dos efeitos não.

Destaque Nomes de arquivos
Os seguintes nomes de arquivos especiais podem ser usados ​​em certas circunstâncias no lugar de um normal
nome do arquivo na linha de comando:

- SoX pode ser usado em operações de pipeline simples usando o nome de arquivo especial `- '
que, se usado como um nome de arquivo de entrada, fará com que o SoX leia os dados de áudio de
`entrada padrão '(stdin), e que, se usado como o nome do arquivo de saída, fará com que o SoX
irá enviar dados de áudio para a `saída padrão '(stdout). Observe que ao usar este
opção para o arquivo de saída e, às vezes, ao usá-lo para um arquivo de entrada, o
tipo de arquivo (ver -t abaixo) também deve ser fornecido.

"|programa [opções] ..."
Isto pode ser usado no lugar de um nome de arquivo de entrada para especificar o dado programa
a saída padrão (stdout) pode ser usada como um arquivo de entrada. diferente - (acima), isso pode ser
usado para várias entradas para um comando SoX. Por exemplo, se `genw 'gerar mono
Sinais WAV formatados para sua saída padrão, o seguinte comando faz um
arquivo estéreo de dois sinais gerados:
sox -M "| genw --imd -" "| genw --thd -" out.wav
Para áudio sem cabeçalho (bruto), -t (e talvez outras opções de formato) precisará ser
fornecido, precedendo o comando de entrada.

"nome de arquivo curinga"
Especifica que o nome de arquivo `globbing '(correspondência de curinga) deve ser executado pelo SoX
em vez de pela concha. Isso permite que um único conjunto de opções de arquivo seja aplicado a
um grupo de arquivos. Por exemplo, se o diretório atual contém três `vox '
arquivos, arquivo1.vox, arquivo2.vox e arquivo3.vox, então
jogar --rate 6k * .vox
será expandido pelo `shell '(na maioria dos ambientes) para
play --rate 6k arquivo1.vox arquivo2.vox arquivo3.vox
que tratará apenas o primeiro arquivo vox como tendo uma taxa de amostragem de 6k. Com
play --rate 6k "* .vox"
a opção de taxa de amostragem fornecida será aplicada a todos os três arquivos vox.

-p, --sox-pipe
Isso pode ser usado no lugar de um nome de arquivo de saída para especificar que o comando SoX
deve ser usado como canal de entrada para outro comando SoX. Por exemplo, o comando:
tocar "| sox -n -p synth 2" "| sox -n -p synth 2 tremolo 10" stat
reproduz dois `arquivos 'em sucessão, cada um com efeitos diferentes.

-p é na verdade um apelido para `-t Sox -'.

-d, --aparelho padrao
Isso pode ser usado no lugar de um nome de arquivo de entrada ou saída para especificar que o
deve ser usado o dispositivo de áudio padrão (se houver um integrado ao SoX). Isso é semelhante
invocar rec or play (como descrito acima).

-n, --nulo
Isso pode ser usado no lugar de um nome de arquivo de entrada ou saída para especificar que um `nulo
arquivo 'deve ser usado. Observe que aqui, `arquivo nulo 'se refere a um específico SoX
mecanismo e não está relacionado a nenhum mecanismo de sistema operacional com um nome semelhante.

Usar um arquivo nulo para entrada de áudio é equivalente a usar um arquivo de áudio normal que
contém uma quantidade infinita de silêncio e, como tal, geralmente não é útil, a menos que
usado com um efeito que especifica um período de tempo finito (como aparar or synth).

Usar um arquivo nulo para saída de áudio equivale a descartar o áudio e é útil
principalmente com efeitos que produzem informações sobre o áudio em vez de afetar
isso (como anti-ruído or estado).

A taxa de amostragem associada a um arquivo nulo é por padrão 48 kHz, mas, como com um
arquivo normal, isso pode ser sobrescrito se desejado usando opções de formato de linha de comando
(ver abaixo).

Suportado Envie o & em áudio dispositivo Tipos
See formato sox(7) para uma lista e descrição dos formatos de arquivo suportados e dispositivos de áudio
motoristas.

OPÇÕES


Cobertura Opções
Estas opções podem ser especificadas na linha de comando em qualquer ponto antes do primeiro efeito
nome.

O SOX_OPTS variável de ambiente pode ser usada para fornecer valores padrão alternativos para
Opções globais do SoX. Por exemplo:
SOX_OPTS = "- buffer 20000 --play-rate-arg -hs --temp / mnt / temp"
Observe que a configuração de SOX_OPTS pode criar alterações indesejadas no comportamento de
scripts ou outros programas que invocam o SoX. SOX_OPTS pode ser melhor usado para coisas (como
como no exemplo fornecido) que refletem o ambiente no qual o SoX está sendo executado. Possibilitando
opções como --no-clobber como padrão, pode ser melhor tratado usando um alias de shell, uma vez que
um alias de shell não afetará a operação em scripts, etc.

Uma maneira de garantir que um script não seja afetado por SOX_OPTS é limpar SOX_OPTS no
início do script, mas é claro que isso perde o benefício de SOX_OPTS carregar alguns
opções padrão para todo o sistema. Uma abordagem alternativa é invocar explicitamente o SoX com
valores de opção padrão, por exemplo
SOX_OPTS = "- V --no-clobber"
...
sox -V2 --clobber $ input $ output ...
Observe que a maneira de definir as variáveis ​​de ambiente varia de sistema para sistema. Aqui estão alguns
exemplos:

Bash do Unix:
exportar SOX_OPTS = "- V --no-clobber"
Csh do Unix:
setenv SOX_OPTS "-V --no-clobber"
MS-DOS / MS-Windows:
definir SOX_OPTS = -V --no-clobber
GUI do MS-Windows: via Painel de controle: Sistema: Avançado: Variáveis ​​de ambiente

GUI do Mac OS X: consulte o documento Técnico de perguntas e respostas da Apple QA1067.

--amortecedor BYTES, --buffer de entrada BYTES
Defina o tamanho em bytes dos buffers usados ​​para processar áudio (padrão 8192).
--amortecedor aplica-se ao processamento de entrada, efeitos e saída; --buffer de entrada aplica
apenas para processamento de entrada (para o qual substitui --amortecedor se ambos forem fornecidos).

Esteja ciente de que grandes valores para --amortecedor fará com que o SoX se torne lento para responder
para solicitações para encerrar ou pular o arquivo de entrada atual.

--clobber
Não pergunte antes de sobrescrever um arquivo existente com o mesmo nome que o dado
para o arquivo de saída. Este é o comportamento padrão.

--combinar concatenar|fundir|misturar|poder de mistura|multiplicar|seqüência
Selecione o método de combinação do arquivo de entrada; para alguns deles, as opções curtas são
disponível: -m seleciona `mix ', -M seleciona `mesclar ', e -T seleciona `multiplicar '.

See Entrada Envie o Combinando acima para uma descrição das diferentes combinações
métodos.

-D, - não hesitar
Desative o pontilhamento automático - consulte `Pontilhamento 'acima. Um exemplo de por que isso pode
ocasionalmente pode ser útil se um arquivo foi convertido de 16 para 24 bits com o
intenção de fazer algum processamento nele, mas na verdade nenhum processamento é necessário após
tudo e o arquivo original de 16 bits foi perdido, então, estritamente falando, nenhum dither
é necessário se converter o arquivo de volta para 16 bits. Veja também o stats efeito para como
para determinar a profundidade de bits real do áudio em um arquivo.

--ficheiro de efeitos NOME DO ARQUIVO
Use FILENAME para obter todos os efeitos e seus argumentos. O arquivo é analisado como se
os valores foram especificados na linha de comando. Uma nova linha pode ser usada no lugar de
o especial : marcador para separar as cadeias de efeitos. Por conveniência, esses marcadores em
o final do arquivo é normalmente ignorado; se você quiser especificar um último vazio
cadeia de efeitos, use uma : por si mesmo na última linha do arquivo. Esse
opção faz com que todos os efeitos especificados na linha de comando sejam descartados.

-G, --guarda
Chame automaticamente o de ganho efeito de proteção contra cortes. Por exemplo
sox -G infile -b 16 taxa de saída do arquivo 44100 dither -s
é uma abreviatura para
sox infile -b 16 outfile gain -h rate 44100 ganho -rh dither -s
Veja também -V, --norma, e de ganho efeito.

-h, --Socorro
Mostra o número da versão e as informações de uso.

--help-efeito NOME
Mostra informações de uso no efeito especificado. O nome todos os pode ser usado para mostrar
uso em todos os efeitos.

--help-formato NOME
Mostra informações sobre o formato de arquivo especificado. O nome todos os pode ser usado para mostrar
informações sobre todos os formatos.

--eu, --informações
Somente se fornecido como o primeiro parâmetro para Sox, comporte-se como Soxi(1).

-m|-M Equivalente a --combinar misturar e --combinar fundir, Respectivamente.

--Magia
Se o SoX foi construído com a biblioteca opcional `libmagic ', então esta opção pode ser
fornecido para permitir seu uso para ajudar a detectar tipos de arquivos de áudio.

--multi-thread | - single-threaded
Por padrão, o SoX é `single threaded '. Se o --multi-thread opção é dada
no entanto, o SoX processará canais de áudio para a maioria dos efeitos multicanais em
paralelo em arquiteturas hyper-threading / multi-core. Isso pode reduzir o processamento
tempo, embora às vezes possa ser necessário usar esta opção em conjunto com um
tamanho de buffer maior do que o padrão para obter qualquer benefício do multi-threaded
processamento (por exemplo, 131072; ver --amortecedor acima).

--no-clobber
Avisar antes de sobrescrever um arquivo existente com o mesmo nome fornecido para o
arquivo de saída.

NB Substituir um arquivo acidentalmente é mais fácil do que você imagina, pois
exemplo, se você acidentalmente inserir
sox arquivo1 arquivo2 efeito1 efeito2 ...
quando o que você realmente quis dizer foi
reproduzir arquivo1 arquivo2 efeito1 efeito2 ...
então, sem esta opção, o arquivo2 será sobrescrito. Portanto, usar esta opção é
recomendado. SOX_OPTS (acima), um alias de `shell ', script ou arquivo em lote pode ser um
forma adequada de habilitá-lo permanentemente.

--norma[=nível dB]
Chame automaticamente o de ganho efeito para proteger contra corte e normalizar o
áudio. Por exemplo
sox --norm infile -b 16 taxa de saída de 44100 dither -s
é uma abreviatura para
sox infile -b 16 outfile gain -h rate 44100 ganho -nh dither -s
Opcionalmente, o áudio pode ser normalizado para um determinado nível (geralmente) abaixo de 0 dBFS:
sox --norm = -3 arquivo de saída infile

Veja também -V, -G, e de ganho efeito.

- play-rate-arg ARG
Seleciona uma opção de qualidade a ser usada quando o efeito de 'taxa' é automaticamente invocado
enquanto reproduz o áudio. Esta opção é normalmente definida por meio do SOX_OPTS meio Ambiente
variável (veja acima).

--enredo gnuplot|oitava|WOW!
Se não for definido para WOW! (o padrão se --enredo não é fornecido), execute em um modo que pode ser
usado, em conjunto com o programa gnuplot ou o programa GNU Octave, para ajudar
com a seleção e configuração de muitas das funções de transferência
efeitos. Para o primeiro efeito dado que suporta o programa de plotagem selecionado,
O SoX emitirá comandos para traçar a função de transferência do efeito e, em seguida, sairá
sem realmente processar qualquer áudio. Por exemplo
arquivo de entrada sox --plot oitava -n highpass 1320> highpass.plt
oitava highpass.plt

-q, --no-show-progresso
Execute em modo silencioso quando o SoX não o faria de outra forma. Este é o oposto do
-S opção.

-R Execute no modo `repetível '. Quando esta opção é fornecida, quando aplicável, o SoX irá
incorporar um carimbo de data / hora fixo no arquivo de saída (por exemplo AIFF) e irá `semear 'o pseudo
geradores de números aleatórios (por exemplo estremecimento) com um número fixo, garantindo assim que
sucessivas invocações SoX com as mesmas entradas e os mesmos parâmetros produzem o
mesma saída.

--replay-ganho pista|álbum|WOW!
Selecione se deseja ou não aplicar o ajuste de ganho de reprodução aos arquivos de entrada. O padrão
is WOW! for Sox e rec, álbum for play onde (pelo menos) os primeiros dois arquivos de entrada
são marcados com os mesmos nomes de Artista e Álbum, e pista for play de outra forma.

-S, --show-progresso
Exibir formato de arquivo de entrada / informações de cabeçalho e o andamento do processamento como entrada
porcentagem de arquivo (s) concluído (s), tempo decorrido e tempo restante (se conhecido; mostrado em
colchetes) e o número de amostras gravadas no arquivo de saída. Também é mostrado um
medidor de nível de pico e uma indicação se ocorreu corte. O medidor de nível de pico
mostra até dois canais e é calibrado para áudio digital da seguinte forma (direita
canal mostrado):

dB FSD Ecrã dB FSD Ecrã
-25 - -11 ====
-23 = -9 ==== -
-21 = - -7 =====
-19 == -5 ===== -
-17 == - -3 ======

-15 === -1 =====!
-13 === -

Um valor de pico de três segundos de headroom em dBs será mostrado à direita do
medidor se estiver abaixo de 6dB.

Esta opção é habilitada por padrão ao usar o SoX para reproduzir ou gravar áudio.

-T Equivalente a --combinar multiplicar.

--temperatura DIRETÓRIO
Especifique que todos os arquivos temporários devem ser criados no DIRETÓRIO. Este
pode ser útil se houver problemas de permissão ou espaço livre com o padrão
localização. Neste caso, usando `--temperatura .'(para usar o diretório atual) é muitas vezes um
boa solução.

--versão
Mostra o número da versão do SoX e sai.

-V[nível]
Defina a verbosidade. Isso é particularmente útil para ver como quaisquer efeitos automáticos
foram invocados pelo SoX.

SoX exibe mensagens no console (stderr) de acordo com o seguinte detalhamento
níveis:

0 Nenhuma mensagem é mostrada; use o status de saída para determinar se um erro
ocorreu.

1 Apenas mensagens de erro são mostradas. Eles são gerados se o SoX não puder ser concluído
os comandos solicitados.

2 Mensagens de aviso também são mostradas. Eles são gerados se o SoX puder completar
os comandos solicitados, mas não exatamente de acordo com o comando solicitado
parâmetros, ou se ocorrer corte.

3 Descrições das fases de processamento do SoX também são mostradas. Útil para ver
exatamente como o SoX está processando seu áudio.

4 e acima
Mensagens para ajudar na depuração do SoX também são mostradas.

Por padrão, o nível de detalhamento é definido como 2 (mostra erros e avisos). Cada
ocorrência do -V opção aumenta o nível de verbosidade em 1. Alternativamente, o
nível de verbosidade pode ser definido como um número absoluto, especificando-o imediatamente após
da -V, por exemplo -V0 define como 0.

Entrada Envie o Opções
Essas opções se aplicam apenas a arquivos de entrada e podem preceder apenas os nomes de arquivos de entrada no
linha de comando.

--ignore-comprimento
Substitua uma duração de áudio (incorreta) fornecida no cabeçalho de um arquivo de áudio. Se este
opção for fornecida, então o SoX continuará lendo o áudio até chegar ao final do
Arquivo de entrada.

-v, --volume FATOR
Destinado ao uso ao combinar vários arquivos de entrada, esta opção ajusta o
volume do arquivo que o segue na linha de comando por um fator de FATOR. Este
permite que seja 'balanceado' em relação aos outros arquivos de entrada. Este é um linear
(amplitude) ajuste, então um número menor que 1 diminui o volume e um número
maior que 1 aumenta. Se um número negativo for dado, então, além do
ajuste de volume, o sinal de áudio será invertido.

Veja também o norma, vol e de ganho efeitos, e ver Entrada Envie o Balanceamento acima.

Entrada & saída Envie o Formato Opções
Essas opções se aplicam ao arquivo de entrada ou saída cujo nome elas precedem imediatamente no
linha de comando e são usados ​​principalmente ao trabalhar com formatos de arquivo sem cabeçalho ou quando
especificando um formato para o arquivo de saída diferente daquele do arquivo de entrada.

-b BITS, --bits BITS
O número de bits (também conhecido como profundidade de bits ou às vezes comprimento de palavra) em cada codificação
amostra. Não aplicável a codificações complexas como MP3 ou GSM. Não é necessário
com codificações que possuem um número fixo de bits, por exemplo, A / μ-law, ADPCM.

Para um arquivo de entrada, o uso mais comum para esta opção é informar o SoX do
número de bits por amostra em um arquivo de áudio `bruto '(` sem cabeçalho'). Por exemplo
sox -r 16k -e assinado -b 8 input.raw output.wav
converte um arquivo `bruto 'particular em um arquivo` WAV' autoexplicativo.

Para um arquivo de saída, esta opção pode ser usada (talvez junto com -e) para definir o
tamanho da codificação de saída. Por padrão (ou seja, se esta opção não for fornecida), a saída
o tamanho da codificação (desde que seja compatível com o tipo de arquivo de saída) será definido como
o tamanho da codificação de entrada. Por exemplo
sox entrada.cdda -b 24 saída.wav
converte áudio digital de CD bruto (inteiro com sinal de 16 bits) em 24 bits (inteiro com sinal)
Arquivo `WAV '.

-1/-2/-3/-4/-8
O número de bytes em cada amostra codificada. Aliases obsoletos para -b 8, -b 16, -b
24, -b 32, -b 64 respectivamente.

-c CANAIS, --canais CANAIS
O número de canais de áudio no arquivo de áudio. Isso pode ser qualquer número maior que
zero.

Para um arquivo de entrada, o uso mais comum para esta opção é informar o SoX do
número de canais em um arquivo de áudio `bruto '(` sem cabeçalho'). Ocasionalmente, pode ser
útil usar esta opção com um arquivo `headered ', a fim de sobrescrever o
valor (presumivelmente incorreto) no cabeçalho - observe que isso só é compatível com
certos tipos de arquivo. Exemplos:
sox -r 48k -e float -b 32 -c 2 entrada.raw saída.wav
converte um arquivo `bruto 'particular em um arquivo` WAV' autoexplicativo.
reproduzir -c 1 música.wav
interpreta os dados do arquivo como pertencentes a um único canal, independentemente do que seja
indicado no cabeçalho do arquivo. Observe que se o arquivo de fato tiver dois
canais, isso resultará na reprodução do arquivo na metade da velocidade.

Para um arquivo de saída, esta opção fornece um atalho para especificar que o
canais efeito deve ser invocado a fim de alterar (se necessário) o número de
canais no sinal de áudio para o número fornecido. Por exemplo, os dois seguintes
os comandos são equivalentes:
sox entrada.wav -c 1 saída.wav baixo -b 24
sox input.wav output.wav bass -b 24 canais 1
embora a segunda forma seja mais flexível, pois permite que os efeitos sejam ordenados
arbitrariamente.

-e CODIFICAÇÃO, --codificação CODIFICAÇÃO
O tipo de codificação de áudio. Às vezes necessário com tipos de arquivo que suportam mais do que
um tipo de codificação. Por exemplo, com raw, WAV ou AU (mas não, por exemplo, com
MP3 ou FLAC). Os tipos de codificação disponíveis são os seguintes:

inteiro assinado
Dados PCM armazenados como inteiros com sinal (`complemento de dois '). Normalmente usado com
um tamanho de codificação de 16 ou 24 bits. Um valor de 0 representa o sinal mínimo
poder.

inteiro sem sinal
Dados PCM armazenados como inteiros sem sinal. Normalmente usado com uma codificação de 8 bits
Tamanho. Um valor de 0 representa a potência máxima do sinal.

ponto flutuante
Dados PCM armazenados como precisão única IEEE 753 (32 bits) ou precisão dupla
(64 bits) números de ponto flutuante ('reais'). Um valor de 0 representa o mínimo
potência do sinal.

uma lei Padrão de telefonia internacional para codificação logarítmica de 8 bits por
amostra. Tem uma precisão equivalente a cerca de PCM de 13 bits e é
às vezes codificado com ordenação de bits invertida (consulte o -X opção).

u-lei, lei mu
Padrão de telefonia norte-americano para codificação logarítmica de 8 bits por
amostra. Aka μ-law. Tem uma precisão equivalente a cerca de PCM de 14 bits
e às vezes é codificado com ordenação reversa de bits (veja o -X opção).

ok-adpcm
OKI (também conhecido como VOX, Dialogic ou Intel) ADPCM de 4 bits; tem uma precisão
equivalente a aproximadamente PCM de 12 bits. ADPCM é uma forma de compressão de áudio que
tem um bom compromisso entre qualidade de áudio e velocidade de codificação / decodificação.

ima-adpcm
IMA (também conhecido como DVI) ADPCM de 4 bits; tem uma precisão equivalente a aproximadamente
PCM de 13 bits.

ms-adpcm
ADPCM de 4 bits da Microsoft; ele tem uma precisão equivalente a cerca de PCM de 14 bits.

taxa total de gsm
O GSM é usado atualmente para a grande maioria das redes sem fio digitais do mundo
chamadas de telefone. Ele utiliza vários formatos de áudio com diferentes taxas de bits
e qualidade de fala associada. SoX tem suporte para GSM original de 13 kbps
Formato de áudio `Full Rate '. Normalmente exige muito da CPU trabalhar com GSM
áudio.

Os nomes de codificação podem ser abreviados onde não for ambíguo; por exemplo
`inteiro sem sinal 'pode ser dado como` un', mas não `u '(ambíguo com` u-law').

Para um arquivo de entrada, o uso mais comum para esta opção é informar o SoX do
codificação de um arquivo de áudio `bruto '(` cabeçalho') (veja os exemplos em -b e -c
acima).

Para um arquivo de saída, esta opção pode ser usada (talvez junto com -b) para definir o
tipo de codificação de saída, por exemplo
sox entrada.cdda -e float saída1.wav

sox entrada.cdda -b 64 -e float saída2.wav
converter áudio digital de CD bruto (16 bits, inteiro assinado) em arquivos `WAV 'de ponto flutuante
(precisão simples e dupla, respectivamente).

Por padrão (ou seja, se esta opção não for fornecida), o tipo de codificação de saída irá
(desde que seja compatível com o tipo de arquivo de saída) seja definido para a codificação de entrada
tipo.

-s/-u/-f/-A/-U/-o/-i/-a/-g
Aliases obsoletos para especificar os tipos de codificação inteiro assinado, não assinado-
número inteiro, ponto flutuante, uma lei, lei mu, ok-adpcm, ima-adpcm, ms-adpcm, gsm-completo-
taxas respectivamente (ver -e acima).

--sem globo
Especifica que o nome do arquivo `globbing '(correspondência de curinga) não deve ser executado por
SoX no seguinte nome de arquivo. Por exemplo, se o diretório atual contém o
dois arquivos `five-seconds.wav 'e` five * .wav', então
reproduzir --no-glob "five * .wav"
pode ser usado para reproduzir apenas o único arquivo `five * .wav '.

-r, --avaliar TAXA[k]
Fornece a taxa de amostragem em Hz (ou kHz se anexado com `k ') do arquivo.

Para um arquivo de entrada, o uso mais comum para esta opção é informar o SoX do
taxa de amostragem de um arquivo de áudio `bruto '(` cabeçalho') (veja os exemplos em -b e -c
acima de). Ocasionalmente, pode ser útil usar esta opção com um arquivo `headered ',
a fim de substituir o valor (presumivelmente incorreto) no cabeçalho - observe que
isso só é compatível com certos tipos de arquivo. Por exemplo, se o áudio foi gravado
com uma taxa de amostragem de digamos 48k de uma fonte que reproduziu um pouco, digamos 1.5%,
muito devagar então
sox -r 48720 entrada.wav saída.wav
corrige efetivamente a velocidade alterando apenas o cabeçalho do arquivo (mas veja também o
velocidade efeito para a solução mais usual para este problema).

Para um arquivo de saída, esta opção fornece um atalho para especificar que o taxas
efeito deve ser invocado a fim de alterar (se necessário) a taxa de amostragem do
sinal de áudio para o valor fornecido. Por exemplo, os dois comandos a seguir são
equivalente:
sox entrada.wav -r 48k saída.wav baixo -b 24
sox input.wav output.wav bass -b 24 taxa 48k
embora a segunda forma seja mais flexível, pois permite taxas opções a serem dadas, e
permite que os efeitos sejam ordenados arbitrariamente.

-t, --modelo TIPO DE ARQUIVO
Fornece o tipo do arquivo de áudio. Para arquivos de entrada e saída, esta opção é
comumente usado para informar ao SoX do tipo um arquivo de áudio `headerless '(por exemplo, raw, mp3)
onde o tipo real / desejado não pode ser determinado a partir de uma determinada extensão de nome de arquivo.
Por exemplo:
outro comando | sox -t mp3 - output.wav

sox input.wav -t saída bruta.bin
Ele também pode ser usado para substituir o tipo implícito por uma extensão de nome de arquivo de entrada,
mas se substituir por um tipo que tem um cabeçalho, o SoX sairá com um apropriado
mensagem de erro se esse cabeçalho não estiver realmente presente.

See formato sox(7) para obter uma lista de tipos de arquivos suportados.

-L, --endian pequeno
-B, --endian big
-x, --endian trocar
Essas opções especificam se a ordem de bytes dos dados de áudio é, respectivamente,
`little endian ',` big endian' ou o oposto daquele do sistema no qual SoX
está sendo usado. Endianness se aplica apenas a dados codificados como ponto flutuante, ou como
inteiros com ou sem sinal de 16 ou mais bits. Muitas vezes é necessário especificar
uma dessas opções para arquivos sem cabeçalho, e às vezes necessária para (caso contrário)
arquivos autoexplicativos. Uma determinada opção de configuração de endian pode ser ignorada para uma entrada
arquivo cujo cabeçalho contém um identificador de endianness específico, ou para um arquivo de saída
isso é na verdade um dispositivo de áudio.

NB Ao contrário de outras características de formato, o endianness (byte, nibble e bit
ordenação) do arquivo de entrada não é usado automaticamente para o arquivo de saída; então, para
exemplo, quando o seguinte é executado em um sistema little endian:
sox -B áudio.s16 aparado.s16 aparar 2
trimmed.s16 será criado como little-endian;
sox -B áudio.s16 -B aparado.s16 aparar 2
deve ser usado para preservar o big-endianness no arquivo de saída.

O -V opção pode ser usada para verificar os pedidos selecionados.

-N, --mordidelas reversas
Especifica que a ordem de nibble (ou seja, as 2 metades de um byte) das amostras
deve ser revertido; às vezes útil com formatos baseados em ADPCM.

NB Veja também NB na seção sobre -x acima.

-X, --bits reversos
Especifica que a ordem dos bits das amostras deve ser invertida; às vezes útil
com alguns formatos (principalmente sem cabeçalho).

NB Veja também NB na seção sobre -x acima.

saída Envie o Formato Opções
Estas opções se aplicam apenas ao arquivo de saída e podem preceder apenas o nome do arquivo de saída em
a linha de comando.

--adicionar comentário TEXTO
Anexe um comentário no cabeçalho do arquivo de saída (onde aplicável).

--Comente TEXTO
Especifique o texto do comentário a ser armazenado no cabeçalho do arquivo de saída (onde aplicável).

O SoX fornecerá um comentário padrão se esta opção (ou --comentário-arquivo) não é fornecido.
Para especificar que nenhum comentário deve ser armazenado no arquivo de saída, use --Comente "" .

--comentário-arquivo NOME DO ARQUIVO
Especifique um arquivo contendo o texto do comentário para armazenar no cabeçalho do arquivo de saída
(onde aplicável).

-C, --compressão FATOR
O fator de compactação para compactação variável de formatos de arquivo de saída. Se este
Se a opção não for fornecida, um fator de compactação padrão será aplicado. A compressão
fator é interpretado de forma diferente para diferentes formatos de arquivo de compactação. Veja o
descrição dos formatos de arquivo que usam esta opção em formato sox(7) para mais
informações.

EFEITOS


Além de converter, reproduzir e gravar arquivos de áudio, o SoX pode ser usado para invocar um
número de `efeitos 'de áudio. Vários efeitos podem ser aplicados, especificando-os um após
outro no final da linha de comando do SoX, formando uma `cadeia de efeitos '. Observe que
aplicar vários efeitos em tempo real (ou seja, ao reproduzir áudio) provavelmente exigirá um
computador de alto desempenho. Parar outros aplicativos pode aliviar os problemas de desempenho
devem ocorrer.

Alguns dos efeitos SoX se destinam principalmente a ser aplicados a um único instrumento ou
`voz '. Para facilitar isso, o Remix efeito e a opção SoX global -M pode ser usado para
isole e recombine as trilhas de uma gravação de várias trilhas.

Múltiplo Efeito Correntes
Uma única cadeia de efeitos é composta por um ou mais efeitos. Áudio das execuções de entrada
através da cadeia até que o final do arquivo de entrada seja alcançado ou um efeito no
pedidos de cadeia para encerrar a cadeia.

O SoX suporta a execução de múltiplas cadeias de efeitos no áudio de entrada. Neste caso, quando um
cadeia indica que terminou o processamento de áudio, os dados de áudio são então enviados para o próximo
cadeia de efeitos. Isso continua até que não existam mais cadeias de efeitos ou a entrada tenha
chegou ao fim do arquivo.

Uma cadeia de efeitos é encerrada colocando um : (dois pontos) após um efeito. Qualquer seguinte
os efeitos são parte de uma nova cadeia de efeitos.

É importante colocar o efeito que irá parar a cadeia como o primeiro efeito no
cadeia. Isso ocorre porque todas as amostras que são protegidas por efeitos à esquerda do
efeito de encerramento será descartado. A quantidade de amostras descartadas está relacionada ao
--amortecedor opção e deve ser mantida pequena, em relação à taxa de amostragem, se o
o efeito de encerramento não pode ser o primeiro. Mais informações sobre os efeitos de interrupção podem ser encontradas
no Paragem Sox seção.

Existem alguns pseudoefeitos que auxiliam no uso de múltiplas cadeias de efeitos. Esses incluem
novo arquivo que começará a gravar em um novo arquivo de saída antes de passar para os próximos efeitos
corrente e restart que vai voltar para a primeira cadeia de efeitos. Pseudo-efeitos devem ser
especificado como o primeiro efeito em uma cadeia e como o único efeito em uma cadeia (eles devem ter
a : antes e depois de serem especificados).

A seguir está um exemplo de cadeias de efeitos múltiplos. Ele irá dividir o arquivo de entrada em
vários arquivos de 30 segundos de duração. Cada nome de arquivo de saída terá um número único em
seu nome conforme documentado no saída Arquivos seção.
sox infile.wav output.wav trim 0 30: newfile: reiniciar

comum Avaliação E Parâmetros Técnicos
Nas descrições a seguir, colchetes [] são usados ​​para denotar parâmetros que são
opcional, colchetes {} para denotar aqueles que são opcionais e repetíveis, e ângulo
colchetes <> para denotar aqueles que são repetíveis, mas não opcionais. Onde aplicável,
os valores padrão para parâmetros opcionais são mostrados entre parênteses ().

Os parâmetros a seguir são usados ​​com, e têm o mesmo significado para, vários efeitos:

centro[k]
See freqüência.

freqüência[k]
Uma frequência em Hz ou, se anexado a `k ', kHz.

de ganho Um ganho de potência em dB. Zero não dá nenhum ganho; menos que zero dá uma atenuação.

largura[h|k|o|q]
Usado para especificar a largura de banda de um filtro. Uma série de métodos diferentes para
especificar a largura estão disponíveis (embora nem todos para todos os efeitos). Um dos
os caracteres mostrados podem ser anexados para selecionar o método desejado da seguinte forma:

Forma Notas
h Hz
k kHz
o Oitavas
q Fator Q Veja [2]

Para cada efeito que usa este parâmetro, o método padrão (ou seja, se nenhum caractere
é anexado) é aquele que listou primeiro na primeira linha do
descrição.

Para ver se o SoX tem suporte para um efeito opcional, digite Sox -h e procure seu nome em
a lista: `EFEITOS '.

Suportado Efeito
Nota: uma lista categorizada dos efeitos pode ser encontrada no arquivo `README 'que o acompanha.

tudo passa freqüência[k] largura[h|k|o|q]
Aplique um filtro passa-tudo de dois pólos com frequência central (em Hz) freqüência e
largura do filtro largura. Um filtro passa-tudo muda a frequência do áudio para fase
relação sem alterar sua freqüência para relação de amplitude. O filtro
é descrito em detalhes em [1].

Este efeito apóia o --enredo opção global.

banda [-n] centro[k] [largura[h|k|o|q]]
Aplique um filtro passa-banda. A resposta de frequência cai logaritmicamente em torno do
centro frequência. o largura parâmetro fornece a inclinação da queda. o
frequências em centro + largura e centro - largura será metade do original
amplitudes. banda o padrão é um modo orientado para áudio agudo, ou seja, voz,
canto, ou música instrumental. o -n (para ruído) opção usa o modo alternativo
para áudio não agudo (por exemplo, percussão). Atenção: -n apresenta um ganho de potência de
cerca de 11dB no filtro, portanto, tome cuidado com o corte de saída. banda introduz ruído em
a forma do filtro, ou seja, com pico no centro frequência e se acomodando em torno
.

Este efeito apóia o --enredo opção global.

Veja também sincero para um filtro passa-banda com ombros mais íngremes.

passa banda|faixa rejeitada [-c] freqüência[k] largura[h|k|o|q]
Aplique um filtro passa-banda Butterworth de dois pólos ou filtro de rejeição de banda com frequência central
freqüência, e largura de banda (ponto 3 dB) largura. O -c opção se aplica apenas a
passa banda e seleciona um ganho de saia constante (ganho de pico = Q) em vez do padrão:
ganho de pico constante de 0dB. Os filtros rolam a 6dB por oitava (20dB por década)
e são descritos em detalhes em [1].

Esses efeitos apóiam o --enredo opção global.

Veja também sincero para um filtro passa-banda com ombros mais íngremes.

faixa rejeitada freqüência[k] largura[h|k|o|q]
Aplique um filtro de rejeição de banda. Veja a descrição do passa banda efeito para
Detalhes.

baixo|triplo de ganho [freqüência[k] [largura[s|h|k|o|q]]]
Aumente ou corte as frequências graves (inferiores) ou agudas (superiores) do áudio usando um
filtro shelving de dois pólos com uma resposta semelhante à de um aparelho de som de alta fidelidade padrão
controles de tom. Isso também é conhecido como equalização shelving (EQ).

de ganho dá o ganho a 0 Hz (para baixo), ou o que for menor de ∼22 kHz e
a frequência de Nyquist (para triplo) Seu intervalo útil é de cerca de -20 (para um grande
corte) para +20 (para um grande aumento). Cuidado com Clipping ao usar um positivo de ganho.

Se desejado, o filtro pode ser ajustado com os seguintes parâmetros opcionais:

freqüência define a frequência central do filtro e, portanto, pode ser usado para estender ou
reduza a faixa de frequência a ser aumentada ou cortada. O valor padrão é 100 Hz (para
baixo) ou 3 kHz (para triplo).

largura determina quão íngreme é a transição de prateleira do filtro. Em adição ao
métodos de especificação de largura comum descritos acima, `inclinação '(o padrão, ou se
anexado com `s') pode ser usado. O intervalo útil de 'inclinação' é de cerca de 0.3, para um
declive suave, até 1 (o máximo), para um declive íngreme; o valor padrão é 0.5.

Os filtros são descritos em detalhes em [1].

Esses efeitos apóiam o --enredo opção global.

Veja também equalizador para um efeito de equalização de pico.

dobrar [-f quadro de taxa(25)] [-o excesso de amostra(16)] { atraso,cents,duração }
Altera o tom em quantidades especificadas em momentos específicos. Cada triplo dado:
atraso,cents,duração especifica uma dobra. atraso é a quantidade de tempo após o
início do stream de áudio, ou o final da curva anterior, na qual começar
dobrar o campo; cents é o número de centavos (100 centavos = 1 semitom) pelo qual
para dobrar o arremesso, e duração o período de tempo durante o qual o arremesso será
são.

O algoritmo pitch-bending utiliza a transformada discreta de Fourier (DFT) em um
taxa de quadros específica e taxa de sobre-amostragem. o -f e -o parâmetros podem ser usados
para ajustar esses parâmetros e, assim, controlar a suavidade das mudanças na afinação.

Por exemplo, um tom inicial é gerado, então dobrado três vezes, produzindo quatro
notas diferentes no total:
jogar -n sintetizador 2.5 sin 667 ganho 1
bend .35,180,.25 .15,740,.53 0,-520,.3
Observe que o recorte produzido neste exemplo é proposital; remover
isso, use de ganho -5 em lugar de de ganho 1.

Veja também passo.

biquadrado b0 b1 b2 a0 a1 a2
Aplique um filtro IIR biquad com os coeficientes dados. Onde b * e a * são os
coeficientes do numerador e do denominador, respectivamente.

See http://en.wikipedia.org/wiki/Digital_biquad_filter (onde a0 = 1).

Este efeito apóia o --enredo opção global.

canais CANAIS
Invoque um algoritmo simples para alterar o número de canais no sinal de áudio para
o número dado CANAIS: mixando se diminuir o número de canais ou
duplicando se aumentando o número de canais.

O canais efeito é invocado automaticamente se o SoX -c opção especifica um número
de canais que são diferentes dos arquivos de entrada. Alternativamente, se este
efeito é dado explicitamente, então o SoX's -c opção não precisa ser dada. Por exemplo,
os dois comandos a seguir são equivalentes:
sox entrada.wav -c 1 saída.wav baixo -b 24
sox input.wav output.wav bass -b 24 canais 1
embora a segunda forma seja mais flexível, pois permite que os efeitos sejam ordenados
arbitrariamente.

Veja também Remix para um efeito que permite que os canais sejam mixados / selecionados arbitrariamente.

coro ganho ganho <atraso decadência velocidade profundidade -s|-t>
Adicione um efeito de coro ao áudio. Isso pode fazer um único vocal soar como um
chorus, mas também pode ser aplicado à instrumentação.

O coro se assemelha a um efeito de eco com um pequeno retardo, mas com o eco o retardo
é constante, com coro, é variado por modulação sinusoidal ou triangular.
A profundidade de modulação define o intervalo em que o atraso modulado é reproduzido antes ou
após o atraso. Portanto, o som atrasado soará mais lento ou mais rápido, ou seja,
som atrasado afinado em torno do original, como em um refrão onde alguns vocais estão
ligeiramente desafinado. Veja [3] para mais discussão sobre o efeito chorus.

Cada parâmetro de atraso / decadência / velocidade / profundidade de quatro tuplas dá o atraso em milissegundos
e o decaimento (em relação ao ganho) com uma velocidade de modulação em Hz usando profundidade em
milissegundos. A modulação é sinusoidal (-s) ou triangular (-t) Ganho-
out é o volume da saída.

Um atraso típico é de cerca de 40ms a 60ms; a velocidade de modulação é melhor perto de 0.25 Hz
e a profundidade de modulação em torno de 2ms. Por exemplo, um único atraso:
tocar guitar1.wav refrão 0.7 0.9 55 0.4 0.25 2 -t
Dois atrasos das amostras originais:
tocar guitar1.wav refrão 0.6 0.9 50 0.4 0.25 2 -t
60 0.32 0.4 1.3 -s
Um refrão de som mais completo (com três atrasos adicionais):
tocar guitar1.wav refrão 0.5 0.9 50 0.4 0.25 2 -t
60 0.32 0.4 2.3 -t 40 0.3 0.3 1.3 -s

comando ataque1,decadência 1{,ataque2,decadência 2}
[soft-joelho-dB:]in-dB1[,saída-dB1]{,in-dB2,saída-dB2}
[de ganho [volume inicial dB [atraso]]]

Companda (comprima ou expanda) a faixa dinâmica do áudio.

O ataque e decadência parâmetros (em segundos) determinam o tempo durante o qual o
o nível instantâneo do sinal de entrada é calculado para determinar seu volume;
ataques referem-se a aumentos de volume e decaimentos referem-se a diminuições. Para a maioria
situações, o tempo de ataque (resposta à música ficando mais alta) deve ser
menor do que o tempo de decadência porque o ouvido humano é mais sensível a sons repentinos
música do que música suave repentina. Onde mais de um par de parâmetros de ataque / decaimento
são especificados, cada canal de entrada é compactado separadamente e o número de pares
deve concordar com o número de canais de entrada. Valores típicos são 0.3,0.8 segundos.

O segundo parâmetro é uma lista de pontos na função de transferência do compander
especificado em dB em relação à amplitude máxima possível do sinal. A entrada
os valores devem estar em uma ordem estritamente crescente, mas a função de transferência não
tem que estar aumentando monotonicamente. Se omitido, o valor de saída-dB1 o padrão é o
mesmo valor que in-dB1; níveis abaixo in-dB1 não são compactados (mas podem ter ganho
aplicado a eles). O ponto 0,0 é assumido, mas pode ser substituído (por 0,saída-dBn).
Se a lista for precedida por um soft-joelho-dB valor, então os pontos adjacentes
os segmentos de linha na função de transferência serão arredondados pelo valor fornecido.
Os valores típicos para a função de transferência são 6: -70, -60, -20.

O terceiro parâmetro (opcional) é um ganho adicional em dB a ser aplicado em todos
pontos na função de transferência e permite fácil ajuste do ganho geral.

O quarto parâmetro (opcional) é um nível inicial a ser assumido para cada canal
quando o companding começa. Isso permite que o usuário forneça um nível nominal inicialmente,
de modo que, por exemplo, um ganho muito grande não é aplicado aos níveis de sinal iniciais
antes que a ação de compressão / expansão comece a operar: é bastante provável que em
tal evento, a saída seria severamente cortada enquanto o ganho do compander
ajusta-se adequadamente. Um valor típico (para áudio que é inicialmente silencioso) é
-90 dB.

O quinto parâmetro (opcional) é um atraso em segundos. O sinal de entrada é analisado
imediatamente para controlar o compander, mas é atrasado antes de ser alimentado para o
regulador de volume. Especificando um atraso aproximadamente igual aos tempos de ataque / decadência
permite que o compander opere efetivamente de forma "preditiva", em vez de
modo reativo. Um valor típico é 0.2 segundos.

* * *

O exemplo a seguir pode ser usado para fazer uma peça musical com silêncio e
passagens altas adequadas para ouvir em um ambiente barulhento, como um em movimento
veículo:
sox asz.wav asz-car.wav compand 0.3,1 6: -70, -60, -20 -5 -90 0.2
A função de transferência (`6: -70, ... ') diz que sons muito suaves (abaixo de -70dB) irão
permanece inalterado. Isso impedirá o compander de aumentar o volume no
passagens "silenciosas", como entre movimentos. No entanto, sons na faixa de -60dB a
0dB (volume máximo) será aumentado para que a faixa dinâmica de 60dB do original
a música será comprimida de 3 para 1 em uma faixa de 20dB, que é ampla o suficiente para ser apreciada
a música, mas estreita o suficiente para contornar o barulho da estrada. O `6: 'seleciona 6dB
compressão de joelho macio. O ganho de saída de -5 (dB) é necessário para evitar o corte (o
número é inexato e foi obtido por experimentação). O -90 (dB) para o
o volume inicial funcionará bem para um clipe que começa quase no silêncio, e o
atraso de 0.2 (segundos) tem o efeito de fazer com que o compander reaja um pouco mais
rapidamente para mudanças repentinas de volume.

No próximo exemplo, o compand está sendo usado como uma porta de ruído para quando o ruído está em
um nível inferior ao do sinal:
reproduzir compand infile .1, .2 -inf, -50.1, -inf, -50, -50 0 -90 .1
Aqui está outra porta de ruído, desta vez para quando o ruído estiver em um nível mais alto do que
o sinal (tornando-o, em alguns aspectos, semelhante ao silenciador):
reproduzir compand infile .1, .1 -45.1, -45, -inf, 0, -inf 45 -90 .1
Este efeito apóia o --enredo opção global (para a função de transferência).

Veja também mcompand para um efeito de compressão / expansão de banda múltipla.

contraste [valor de melhoria(75)]
Comparável à compressão, este efeito modifica um sinal de áudio para torná-lo som
mais alto. valor de melhoria controla a quantidade de melhoria e é um número
no intervalo de 0-100. Observe que valor de melhoria = 0 ainda dá um significativo
Aprimoramento de contraste.

Veja também o comando e mcompand efeitos.

dc shift mudança [Limergain]
Aplique uma mudança DC ao áudio. Isso pode ser útil para remover um deslocamento DC (causado
talvez por um problema de hardware na cadeia de gravação) do áudio. O efeito
de um DC offset é reduzido headroom e, portanto, volume. o estado or stats efeito pode
ser usado para determinar se um sinal tem um deslocamento DC.

O dado dc shift valor é um número de ponto flutuante no intervalo de ± 2 que
indica a quantidade de deslocamento do áudio (que está na faixa de ± 1).

Um opcional Limergain também pode ser especificado. Deve ter um valor muito menor
de 1 (por exemplo, 0.05 ou 0.02) e é usado apenas em picos para evitar corte.

* * *

Uma abordagem alternativa para remover um deslocamento DC (embora com um pequeno atraso) é
use o passagem alta efeito de filtro em uma frequência de digamos 10 Hz, conforme ilustrado no
seguinte exemplo:
Sox -n dc.wav synth 5 sin% 0 50
sox dc.wav fixo.wav highpass 10

julgar Aplique Compact Disc (IEC 60908) de-ênfase (um filtro shelving de atenuação de agudos).

A pré-ênfase foi aplicada na masterização de alguns CDs lançados no início dos anos 1980.
Estes incluíam muitos álbuns de música clássica, bem como agora as edições procuradas de
álbuns dos Beatles, Pink Floyd e outros. A pré-ênfase deve ser removida em
tempo de reprodução por um filtro sem ênfase no dispositivo de reprodução. No entanto, nem todos
Os reprodutores de CD modernos possuem esse filtro, e muito poucos drives de CD para PC o possuem; jogando pré-
áudio enfatizado sem o filtro correto de redução de ênfase resulta em áudio que
soa severo e está longe do que seus criadores pretendiam.

Com o julgar efeito, é possível aplicar a redução de ênfase necessária ao áudio
que foi extraído de um CD pré-enfatizado e, em seguida, grave o de-
enfatizou o áudio para um novo CD (que será reproduzido corretamente em qualquer CD player), ou
simplesmente reproduza os arquivos de áudio com a ênfase correta no PC. Por exemplo:
sox faixa1.wav faixa1-deemph.wavdeemph
e depois gravar track1-deemph.wav no CD ou
reproduzir track1-deemph.wav
ou simplesmente
tocar track1.wav deemph
O filtro sem ênfase é implementado como um biquad; seu desvio máximo do
a resposta ideal é de apenas 0.06dB (até 20kHz).

Este efeito apóia o --enredo opção global.

Veja também o baixo e triplo efeitos de equalização de prateleiras.

atraso {comprimento}
Atrase um ou mais canais de áudio. comprimento pode especificar uma hora ou, se anexado com
um `s ', uma série de amostras. Não especifique atrasos de tempo e amostras no
mesmo comando. Por exemplo, atraso 1.5 0 0.5 atrasa o primeiro canal em 1.5
segundos, o terceiro canal por 0.5 segundos e sai do segundo canal (e qualquer
outros canais que podem estar presentes) sem retardo. O seguinte (um longo) comando
toca um sino:
tocar -n sintetizador -j 3 sin %3 sin %-2 sin %-5 sin %-9
sin %-14 sin %-21 fade h 01 2 1.5 atraso
1.3 1 ,76 ,54 ,27 remix - fade h 0 2.7 2.5 norma -1
e isso toca um acorde de guitarra:
tocar -n sintetizador pl G2 pl B2 pl D3 pl G3 pl D4 pl G4
atraso 0 .05 .1 .15 .2 .25 remix - desvanecimento 0 4 .1 norma -1

estremecimento [-S|-s|-f filtro] [-a] [-p precisão]
Aplique pontilhamento ao áudio. O pontilhamento adiciona deliberadamente uma pequena quantidade de ruído
ao sinal, a fim de mascarar os efeitos de quantização audíveis que podem ocorrer se o
o tamanho da amostra de saída é inferior a 24 bits. Sem opções, este efeito irá adicionar
ruído branco triangular (TPDF). A modelagem de ruído (apenas para certas taxas de amostragem) pode
ser selecionado com -s. Com o -f opção, é possível selecionar uma determinada
filtro de modelagem de ruído da seguinte lista: lipshitz, f-ponderado, modificado-e-
ponderado, melhorado-e-pesado, gesemann, shibata, shibata baixo, shibata alto. Observação
que a maioria dos tipos de filtro estão disponíveis apenas com taxa de amostragem de 44100Hz. O filtro
tipos são distinguidos pelas seguintes propriedades: audibilidade de ruído, nível de
(inaudível, mas, em algumas circunstâncias, problemático) em forma de alta frequência
ruído e velocidade de processamento.
See http://sox.sourceforge.net/SoX/NoiseShaping para gráficos dos diferentes ruídos-
curvas de modelagem.

O -S opção seleciona um TPDF ligeiramente inclinado, inclinado para frequências mais altas.
Ele pode ser usado em qualquer taxa de amostragem, mas abaixo de ≈22k, TPDF simples é provavelmente melhor,
e acima de ≈ 37k, a forma de ruído é provavelmente melhor.

O -a opção ativa um modo onde o pontilhamento (e modelagem de ruído, se aplicável) são
habilitado automaticamente apenas quando necessário. O uso mais provável para isso é quando
aplicar fade in ou out a um arquivo já pontilhado, de modo que o redithering
aplica-se apenas às partes desbotadas. No entanto, o pontilhamento automático não é à prova de erros, então
os fades devem ser verificados cuidadosamente para qualquer modulação de ruído; se isso ocorrer,
em seguida, redimensione todo o arquivo ou use aparar, desvanecere concatenar.

O -p opção permite substituir a precisão do alvo.

Se a opção global SoX -R opção não é fornecida, então o número pseudo-aleatório
gerador usado para gerar o ruído branco será "propagado novamente", ou seja, o
o ruído será diferente entre as invocações.

Este efeito não deve ser seguido por nenhum outro efeito que afete o áudio.

Veja também a seção `Dithering 'acima.

reduzir a amostra [fator(2)]
Reduza a resolução do sinal por um fator inteiro: apenas o primeiro de cada fator
as amostras são retidas, as demais são descartadas.

Nenhum filtro de dizimação é aplicado. Se a entrada não tiver um limite de banda adequado
sinal de banda base, ocorrerá aliasing. Isso pode ser desejável, por exemplo, para frequência
tradução.

Para um efeito geral de reamostragem com anti-aliasing, consulte taxas. Veja também aumentar a amostragem.

cera Torna o áudio mais fácil de ouvir em fones de ouvido. Adiciona 'cues' ao estéreo de 44.1 kHz (ou seja
formato de CD de áudio) áudio para que, quando ouvida em fones de ouvido, a imagem estéreo seja
movido de dentro de sua cabeça (padrão para fones de ouvido) para fora e na frente de
o ouvinte (padrão para alto-falantes).

eco ganho ganho <atraso decadência>
Adicione eco ao áudio. Os ecos são sons refletidos e podem ocorrer naturalmente
entre montanhas (e às vezes grandes edifícios) ao falar ou gritar; digital
efeitos de eco emulam este comportamento e são frequentemente usados ​​para ajudar a preencher o som
de um único instrumento ou vocal. A diferença de tempo entre o sinal original
e a reflexão é o 'atraso' (tempo), e a intensidade do sinal refletido
é a 'decadência'. Vários ecos podem ter diferentes atrasos e diminuições.

Cada dado atraso decadência par dá o atraso em milissegundos e a decadência (relativa
para ganhar) desse eco. O ganho é o volume da saída. Por exemplo: Este
fará com que soe como se houvesse o dobro de instrumentos do que realmente
jogando:
tocar lead.aiff eco 0.8 0.88 60 0.4
Se o atraso for muito curto, soará como um robô (metálico) tocando música:
tocar lead.aiff eco 0.8 0.88 6 0.4
Um atraso maior soará como um concerto ao ar livre nas montanhas:
tocar lead.aiff eco 0.8 0.9 1000 0.3
Mais uma montanha e:
tocar lead.aiff echo 0.8 0.9 1000 0.3 1800 0.25

ecos ganho ganho <atraso decadência>
Adicione uma sequência de ecos ao áudio. Cada atraso decadência par dá o atraso em
milissegundos e a queda (em relação ao ganho) desse eco. O ganho é o
volume da produção.

Como o efeito de eco, echos significa `ECHO in Sequel ', que é o primeiro eco
leva a entrada, o segundo a entrada e o primeiro ecos, o terceiro a entrada e
o primeiro e o segundo ecos, ... e assim por diante. Deve-se ter cuidado ao usar muitos
ecos; um único eco tem o mesmo efeito que um único eco.

A amostra será devolvida duas vezes em ecos simétricos:
reproduzir lead.aiff echos 0.8 0.7 700 0.25 700 0.3
A amostra será devolvida duas vezes em ecos assimétricos:
reproduzir lead.aiff echos 0.8 0.7 700 0.25 900 0.3
A amostra soará como se tocada em uma garagem:
reproduzir lead.aiff echos 0.8 0.7 40 0.25 63 0.3

equalizador freqüência[k] largura[q|o|h|k] de ganho
Aplique um filtro de equalização de pico (EQ) de dois pólos. Com este filtro, o sinal
nível em e em torno de uma frequência selecionada pode ser aumentado ou diminuído, enquanto
(ao contrário dos filtros passa-banda e rejeita-banda) que em todas as outras frequências é
inalterado.

freqüência dá a frequência central do filtro em Hz, largura, a largura de banda e
de ganho o ganho ou atenuação necessários em dB. Cuidado com Clipping ao usar um
positivo de ganho.

A fim de produzir curvas de equalização complexas, este efeito pode ser dado várias
vezes, cada um com uma frequência central diferente.

O filtro é descrito em detalhes em [1].

Este efeito apóia o --enredo opção global.

Veja também baixo e triplo para efeitos de equalização de prateleira.

desvanecer [tipo] comprimento desbotado [pare o tempo [comprimento de desvanecimento]]
Aplique um efeito de fade no início, no final ou em ambos o áudio.

Um opcional tipo pode ser especificado para selecionar a forma da curva de fade: q for
quarto de onda senoidal, h por meia onda senoidal, t para inclinação linear ('triangular'),
l para logarítmico, e p para parábola invertida. O padrão é logarítmico.

Um fade-in começa a partir da primeira amostra e aumenta o nível do sinal de 0 para total
o volume acabou comprimento desbotado segundos. Especifique 0 segundos se nenhum fade-in for desejado.

Para fade-outs, o áudio será truncado em pare o tempo e o nível do sinal irá
ser reduzido do volume total para 0, começando em comprimento de desvanecimento segundos antes do
pare o tempo. Se comprimento de desvanecimento não é especificado, o padrão é o mesmo valor que
comprimento desbotado. Nenhum fade-out é executado se pare o tempo não é especificado. Se o
o comprimento do arquivo pode ser determinado a partir do cabeçalho do arquivo de entrada e alteração de comprimento
efeitos não estão em vigor, então 0 pode ser especificado para pare o tempo para indicar o
caso usual de um fade-out que termina no final do fluxo de entrada de áudio.

Todos os tempos podem ser especificados em períodos de tempo ou contagens de amostra. Especificar
os períodos de tempo usam o formato hh: mm: ss.frac. Para especificar usando contagens de amostra,
especifique o número de amostras e acrescente a letra 's' à contagem de amostras (para
exemplo `8000s ').

Veja também o Emparelhar efeito.

abeto [arquivo coefs|COEFS]
Use o mecanismo de convolução FFT do SoX com coeficientes de filtro FIR fornecidos. Se um único
argumento é fornecido então este é tratado como o nome de um arquivo contendo o filtro
coeficientes (separados por espaços em branco; podem conter comentários `# '). Se o dado
o nome do arquivo é `- ', ou se nenhum argumento for fornecido, os coeficientes são lidos
a 'entrada padrão' (stdin); caso contrário, os coeficientes podem ser dados no comando
linha. Exemplos:
sox infile outfile fir 0.0195 -0.082 0.234 0.891 -0.145 0.043
arquivo de saída sox fir coefs.txt
com coefs.txt contendo
# Filtro HP
# freq = 10000
1.2311233052619888e-01
-4.4777096106211783e-01
5.1031563346705155e-01
-6.6502926320995331e-02
...

Este efeito apóia o --enredo opção global.

Flangers [atraso profundidade chuva largura velocidade forma fase interpor]
Aplique um efeito de flange ao áudio. Veja [3] para uma descrição detalhada de
flangear.

Todos os parâmetros são opcionais (da direita para a esquerda).

Variação Padrão Descrição
atraso 0 - 30 0 Atraso base em milissegundos.
profundidade 0 - 10 2 Atraso de varredura adicionado em milissegundos.
chuva -95 - 95 0 Porcentagem de regeneração (atrasada
feedback do sinal).
largura 0 - 100 71 Porcentagem de sinal atrasado mixado
com o original.
velocidade 0.1 - 10 0.5 varreduras por segundo (Hz).
forma sin Forma de onda varrida: seu|triângulo.
fase 0 - 100 25 Mudança de fase percentual da onda varrida
para multicanal (por exemplo, estéreo)
mesa; 0 = 100 = mesma fase ligada
cada canal.
interpor Lin Interpolação de linha de atraso digital:
linear|quadrático.

de ganho [-e|-B|-b|-r] [-n] [-l|-h] [ganho-dB]
Aplique amplificação ou atenuação ao sinal de áudio ou, em alguns casos, a alguns
de seus canais. Observe que o uso de qualquer um dos -e, -B, -b, -r, ou -n requer temporário
espaço de arquivo para armazenar o áudio a ser processado, por isso pode ser inadequado para uso com
áudio "transmitido".

Sem outras opções, ganho-dB é usado para ajustar o nível de potência do sinal pelo
dado número de dB: positivo amplifica (cuidado com o Clipping), negativo atenua.
Com outras opções, o ganho-dB amplificação ou atenuação é (logicamente) aplicada
após o processamento devido a essas opções.

Considerando a -e opção, os níveis dos canais de áudio de um arquivo multicanal são
'equalizado', ou seja, o ganho é aplicado a todos os canais, exceto aquele com o mais alto
nível de pico, de modo que todos os canais atinjam o mesmo nível de pico (mas, sem também
dando -n, o áudio não é `normalizado ').

O -B (saldo) opção é semelhante a -e, mas com -B, o nível RMS é usado
em vez do nível de pico. -B pode ser usado para corrigir o desequilíbrio estéreo causado por
um cartucho de toca-discos imperfeito. Observe que ao contrário -e, -B pode causar alguns
recorte.

-b é similar a -B mas tem proteção contra recorte, ou seja, se necessário, para prevenir
clipagem durante o balanceamento, a atenuação é aplicada a todos os canais. Observe, no entanto,
isso em conjunto com -n, -B e -b são sinônimos.

O -r opção é usada em conjunto com uma chamada anterior de de ganho com o -h
opção - veja abaixo para detalhes.

O -n opção normaliza o áudio para 0dB FSD; é frequentemente usado em conjunto com
um negativo ganho-dB para o efeito de que o áudio é normalizado para um determinado nível
abaixo de 0dB. Por exemplo,
ganho de arquivo de entrada sox -n
normaliza para 0dB, e
ganho de arquivo de entrada sox -n -3
normaliza para -3dB.

O -l opção invoca um limitador simples, por exemplo
ganho de arquivo sox infile -l 6
aplicará 6dB de ganho, mas nunca cortará. Observe que limitar mais do que alguns dBs a mais
do que ocasionalmente (em um pedaço de áudio) não é recomendado, pois pode causar audível
distorção. Veja o comando efeito para um limitador mais capaz.

O -h a opção é usada para aplicar o ganho para fornecer espaço para processamento subsequente.
Por exemplo, com
ganho de arquivo de entrada sox -h baixo +6
6dB de atenuação serão aplicados antes do efeito de reforço de graves, garantindo assim
que não vai cortar. Claro, com o baixo, é óbvio quanto espaço vai
ser necessário, mas com outros efeitos (por exemplo, taxa, dither), nem sempre é tão claro.
Outra vantagem de usar de ganho -h ao invés de uma atenuação explícita, é que se
o headroom não é usado por efeitos subsequentes, ele pode ser recuperado com de ganho -r,
por exemplo:
sox infile outfile ganho -h baixo +6 taxa 44100 ganho -r
A cadeia de efeitos acima garante nunca cortar nem amplificar; atenua se
necessário para evitar cortes, mas apenas o necessário para fazê-lo.

A formatação de saída (pontilhamento e redução de profundidade de bits) também requer espaço (que
não pode ser `recuperado '), por exemplo
sox infile outfile gain -h bass +6 rate 44100 ganho -rh dither
Aqui o segundo de ganho invocação, recupera o máximo de espaço que pode de
os efeitos anteriores, mas retém tanto espaço quanto necessário para as subsequentes
em processamento. A opção global SoX -G pode ser fornecido para invocar automaticamente de ganho -h
e de ganho -r.

Veja também o norma e vol efeitos.

passagem alta|passagem baixa [-1|-2] freqüência[k] [largura[q|o|h|k]]
Aplicar um filtro passa-alta ou passa-baixa com ponto 3dB freqüência. O filtro pode ser
qualquer pólo único (com -1), ou pólo duplo (o padrão, ou com -2). largura
aplica-se apenas a filtros bipolares; o padrão é Q = 0.707 e dá um
Resposta de Butterworth. Os filtros rolam a 6dB por pólo por oitava (20dB por
pólo por década). Os filtros bipolares são descritos em detalhes em [1].

Esses efeitos apóiam o --enredo opção global.

Veja também sincero para filtros com um roll-off mais íngreme.

Hilberto [-n torneiras]
Aplique um filtro de transformação de Hilbert de derivação ímpar, deslocando a fase do sinal em 90 graus.

Isso é usado em muitos esquemas de codificação de matriz e para geração de sinal analítico. o
processo é frequentemente escrito como uma multiplicação por i (ou j), a unidade imaginária.

Um filtro de transformação de Hilbert ímpar tem uma característica de passagem de banda, atenuando o
frequências mais baixas e mais altas. Sua largura de banda pode ser controlada pelo número de
torneiras de filtro, que podem ser especificadas com -n. Por padrão, o número de toques é
escolhido para uma frequência de corte de cerca de 75 Hz.

Este efeito apóia o --enredo opção global.

Ladspa módulo [plug-in] [argumento...]
Aplique um plugin LADSPA [5] (Linux Audio Developer's Simple Plugin API). Apesar do
nome, LADSPA não é específico do Linux, e uma ampla gama de efeitos está disponível como
Plug-ins LADSPA, como cmt [6] (o Computer Music Toolkit) e Steve Harris's
coleção de plugins [7]. O primeiro argumento é o módulo do plugin, o segundo o nome
do plugin (um módulo pode conter mais de um plugin) e quaisquer outros argumentos
são para as portas de controle do plugin. Argumentos ausentes são fornecidos por padrão
valores, se possível. Apenas plug-ins com no máximo uma entrada de áudio e uma saída de áudio
porta pode ser usada. Se encontrada, a variável de ambiente LADSPA_PATH será usada como
caminho de pesquisa para plug-ins.

sonoridade [de ganho [referência]]
Controle de intensidade - semelhante ao de ganho efeito, mas fornece equalização para o
sistema auditivo humano. Ver http://en.wikipedia.org/wiki/Loudness para um detalhado
descrição do volume. O ganho é ajustado pelo dado de ganho parâmetro (normalmente
negativo) e o sinal equalizado de acordo com ISO 226 para um nível de referência de
65dB, embora seja uma alternativa referência nível pode ser dado se o áudio original tiver
foram equalizados para algum outro nível ótimo. Um ganho padrão de -10dB é usado se um
de ganho valor não é fornecido.

Veja também o de ganho efeito.

passagem baixa [-1|-2] freqüência[k] [largura[q|o|h|k]]
Aplique um filtro passa-baixa. Veja a descrição do passagem alta efeito para detalhes.

mcompand "ataque1,decadência 1{,ataque2,decadência 2}
[soft-joelho-dB:]in-dB1[,saída-dB1]{,in-dB2,saída-dB2}
[de ganho [volume inicial dB [atraso]]] "{frequência de cruzamento[k] "ataque1, ..."}

O compander multibanda é semelhante ao compander de banda única, mas o áudio é
primeiro dividido em bandas usando filtros cross-over Linkwitz-Riley e um filtro separado
um compander especificável executado em cada banda. Veja o comando efeito para a definição
de seus parâmetros. Os parâmetros do Compand são especificados entre aspas duplas e o
frequência de crossover para essa banda é dada por frequência de cruzamento; estes podem ser repetidos
para criar várias bandas.

Por exemplo, o seguinte comando (um longo) mostra como o companding multibanda é
normalmente usado em rádio FM:
reproduzir track1.wav ganho -3 sinc 8000- 29 100 mcompand
"0.005,0.1 -47,-40,-34,-34,-17,-33" 100
"0.003,0.05 -47,-40,-34,-34,-17,-33" 400
"0.000625,0.0125 -47,-40,-34,-34,-15,-33" 1600
"0.0001,0.025 -47,-40,-34,-34,-31,-31,-0,-30" 6400
"0,0.025 -38,-31,-28,-28,-0,-25"
ganho 15 passa-alta 22 passa-alta 22 sinc -n 255 -b 16 -17500
ganho 9 passa-baixo -1 17801
O arquivo de áudio é reproduzido com um som de rádio FM simulado (ou sinal de transmissão
condição se o filtro passa-baixo no final for ignorado). Observe que o pipeline é
configurado com pré-ênfase de 75us no estilo dos EUA.

Veja também comando para um efeito de compressão / expansão de banda única.

anti-ruído [arquivo de perfil]
Calcule um perfil de áudio para uso na redução de ruído. Veja a descrição
que acontecerá no marco da barulhento efeito para detalhes.

barulhento [arquivo de perfil [quantidade]]
Reduza o ruído no sinal de áudio criando perfis e filtrando. Este efeito é
moderadamente eficaz na remoção de ruído de fundo consistente, como chiado ou zumbido.
Para usá-lo, primeiro execute o SoX com o anti-ruído efeito em uma seção de áudio que
idealmente conteria silêncio, mas na verdade contém ruído - tais seções são
normalmente encontrado no início ou no final de uma gravação. anti-ruído escreverá
um perfil de ruído para arquivo de perfil, ou para stdout se não arquivo de perfil ou se `- 'é
dado. Por exemplo
sox discurso.wav -n trim 0 1.5 noiseprof discurso.noise-profile
Para realmente remover o ruído, execute o SoX novamente, desta vez com o barulhento efeito;
barulhento irá reduzir o ruído de acordo com um perfil de ruído (que foi gerado por
anti-ruído), de arquivo de perfilou de stdin se não arquivo de perfil ou se `- 'for fornecido.
Por exemplo
sox speech.wav cleaner.wav noisered speech.noise-profile 0.3
Quanto ruído deve ser removido é especificado por quantidade-a número entre 0 e 1
com um padrão de 0.5. Números mais altos removerão mais ruído, mas apresentam uma maior
probabilidade de remoção de componentes desejados do sinal de áudio. Antes de substituir um
gravação original com uma versão com redução de ruído, experimente com diferentes quantidade
valores para encontrar o ideal para o seu áudio; use fones de ouvido para verificar se você está
feliz com os resultados, prestando atenção especial às seções mais silenciosas do
áudio.

Na maioria dos sistemas, os dois estágios - criação de perfil e redução - podem ser combinados usando um
tubo, por exemplo
sox noisy.wav -n trim 0 1 noiseprof | tocar barulhento.wav barulhento

norma [nível dB]
Normalize o áudio. norma é apenas um apelido para de ganho -n; Veja o de ganho efeito para
Detalhes.

oops Efeito estéreo fora de fase. Mistura estéreo para mono duplo, onde cada canal mono
contém a diferença entre os canais estéreo esquerdo e direito. Isto é
às vezes conhecido como o efeito `karaokê ', pois geralmente tem o efeito de remover a maioria
ou todos os vocais de uma gravação. É equivalente a Remix 1,2 1,2.

extenuar [de ganho(20) [cor(20)]]
Distorção não linear. o cor parâmetro controla a quantidade de harmônico par
conteúdo na saída sobre-orientada.

caminho { comprimento[@posição]}
Encha o áudio com silêncio, no início, no final ou em qualquer ponto especificado
através do áudio. Ambos comprimento e posição pode especificar uma hora ou, se anexado
com um `s ', um número de amostras. comprimento é a quantidade de silêncio para inserir e
posição a posição no fluxo de áudio de entrada na qual inseri-lo. Qualquer número
de comprimentos e posições podem ser especificados, desde que uma posição especificada seja
não menos que o anterior. posição é opcional para o primeiro e último
comprimentos especificados e se omitidos correspondem ao início e ao final do
áudio respectivamente. Por exemplo, caminho 1.5 1.5 adiciona 1.5 segundo de preenchimento de silêncio
em cada extremidade do áudio, enquanto caminho 4000s às 3: 00 insere 4000 amostras de silêncio 3
minutos para o áudio. Se o silêncio for desejado apenas no final do áudio, especifique
a posição final ou especifique um bloco de comprimento zero no início.

Veja também atraso para um efeito que pode adicionar silêncio no início do áudio em
uma base canal a canal.

phaser ganho ganho atraso decadência velocidade [-s|-t]
Adicione um efeito de fase ao áudio. Veja [3] para uma descrição detalhada de faseamento.

atraso / decaimento / velocidade dá o atraso em milissegundos e o decaimento (em relação ao ganho-
in) com uma velocidade de modulação em Hz. A modulação é sinusoidal (-s) -
preferível para vários instrumentos, ou triangular (-t) - dá instrumentos únicos
um efeito de faseamento mais nítido. A queda deve ser inferior a 0.5 para evitar feedback, e
geralmente não inferior a 0.1. O ganho é o volume da saída.

Por exemplo:
play snare.flac phaser 0.8 0.74 3 0.4 0.5 -t
Gentil:
jogar snare.flac phaser 0.9 0.85 4 0.23 1.3 -s
Um som popular:
play snare.flac phaser 0.89 0.85 1 0.24 2 -t
Mais severo:
play snare.flac phaser 0.6 0.66 3 0.6 2 -t

passo [-q] mudança [segmento [pesquisar [sobreposição]]]
Altere o tom do áudio (mas não o tempo).

mudança dá a mudança de tom como 'centavos' positivos ou negativos (ou seja, centésimos de um
semitom). Veja o tempo efeito para uma descrição dos outros parâmetros.

Veja também o dobrar, velocidade e tempo efeitos.

taxas [-q|-l|-m|-h|-v] [opções de substituição] TAXA[k]
Alterar a taxa de amostragem de áudio (ou seja, reamostrar o áudio) para qualquer dado TAXA (até
não inteiro se for compatível com o formato do arquivo de saída) usando um nível de qualidade
definido da seguinte forma:

Qualidade Banda- Rej dB Típica Uso
largura
-q rápido n / a ≈30 @ reprodução ligada
Hardware antigo Fs / 4
-l baixo 80% 100 reprodução no antigo
Hardwares
-m média 95% 100 reprodução de áudio
-h alta 95% 125 masterização de 16 bits
(use com dither)
-v muito alta 95% 175 masterização de 24 bits

onde Largura de banda é a porcentagem da banda de frequência de áudio que é preservada
e Rej dB é o nível de rejeição de ruído. Níveis crescentes de reamostragem
a qualidade vem às custas de cada vez mais tempo para processar o áudio. Se
nenhuma opção de qualidade é fornecida, o nível de qualidade usado é `alto '(mas consulte` Jogando e
Gravação de áudio 'acima em relação à reprodução).

O algoritmo `rápido 'usa interpolação cúbica; todos os outros usam banda limitada
interpolação. Por padrão, todos os algoritmos têm uma resposta de fase "linear"; para
`médio ',` alto' e `muito alto ', a resposta de fase é configurável (veja abaixo).

O taxas efeito é invocado automaticamente se o SoX -r opção especifica uma taxa que
é diferente do (s) arquivo (s) de entrada. Alternativamente, se este efeito for dado
explicitamente, então o SoX's -r opção não precisa ser dada. Por exemplo, os dois seguintes
os comandos são equivalentes:
sox entrada.wav -r 48k saída.wav baixo -b 24
sox input.wav output.wav bass -b 24 taxa 48k
embora o segundo comando seja mais flexível, pois permite taxas opções a serem dadas,
e permite que os efeitos sejam ordenados arbitrariamente.

* * *

Aviso: segue uma discussão tecnicamente detalhada.

A seleção de qualidade simples descrita acima fornece configurações que satisfazem a
necessidades da grande maioria das tarefas de reamostragem. Ocasionalmente, no entanto, pode ser
desejável para ajustar a resposta do filtro de reamostragem; isso pode ser alcançado usando
override opções, conforme detalhado na seguinte tabela:

-MIL Resposta de fase = mínimo / intermediário / linear
-s Filtro íngreme (largura de banda = 99%)
-a Permitir aliasing / imagem acima da banda passante
-b 74-99.7 Qualquer largura de banda%
-p 0-100 Qualquer resposta de fase (0 = mínimo, 25 = intermediário,
50 = linear, 100 = máximo)

Nota: as opções de substituição não podem ser usadas com algoritmos de qualidade "rápida" ou "baixa".

Todos os reamostradores usam filtros que às vezes podem criar `eco '(também conhecido como` toque')
artefatos com sinais transitórios, como aqueles que ocorrem com 'estalos de dedo' ou
outros sons altamente percussivos. Esses artefatos são muito mais perceptíveis para o
ouvido humano se ocorrerem antes do transiente (`pré-eco ') do que se ocorrerem após
(`pós-eco '). Observe que a frequência de tais artefatos está relacionada ao
menor das taxas de amostragem original e nova, mas se esta for pelo menos
44.1 kHz, então os artefatos ficarão fora do alcance da audição humana.

Uma configuração de resposta de fase pode ser usada para controlar a distribuição de qualquer transiente
eco entre `pré 'e` pós': com fase mínima, não há pré-eco, mas o
pós-eco mais longo; com fase linear, pré e pós eco estão em quantidades iguais (em
termos de sinal, mas não termos de audibilidade); a configuração da fase intermediária tenta
encontre o melhor compromisso selecionando um pequeno comprimento (e nível) de pré-eco e um
pós-eco de comprimento médio.

Resposta de fase mínima, intermediária ou linear é selecionada usando o -M, -I, ou -L
opção; uma resposta de fase personalizada pode ser criada com o -p opção. Observe essa fase
respostas entre "linear" e "máximo" (maior que 50) raramente são úteis.

A configuração de largura de banda de um reamostrador determina quanto do conteúdo de frequência de
o sinal original (escrever a taxa de amostragem original quando up-sampling, ou o novo
taxa de amostragem quando down-sampling) é preservada durante a conversão. O termo `passar-
band 'é usado para se referir a todas as frequências até o ponto de largura de banda (por exemplo, para
Taxa de amostragem de 44.1 kHz e largura de banda de reamostragem de 95%, a banda passante representa
frequências de 0 Hz (DC) a cerca de 21 kHz). Aumentando a largura de banda do resampler
resulta em uma conversão mais lenta e pode aumentar artefatos de eco transitórios (e vice-versa
vice-versa).

O -s opção de `filtro íngreme 'altera a largura de banda de reamostragem do padrão de 95%
(com base no ponto 3 dB), a 99%. o -b opção permite que a largura de banda seja definida para
qualquer valor no intervalo de 74-99.7%, mas observe que os valores de largura de banda maiores que 99%
não são recomendados para uso normal, pois podem causar eco transiente excessivo.

Se o -a a opção for fornecida, então o aliasing / imagem acima da banda passante é permitido.
Por exemplo, com taxa de amostragem de 44.1 kHz e largura de banda de reamostragem de 95%, este
significa que o conteúdo de frequência acima de 21 kHz pode ser distorcido; no entanto, uma vez que este é
acima da banda passante (ou seja, acima da maior frequência de interesse / audibilidade),
isso pode não ser um problema. Os benefícios de permitir aliasing / imagem são reduzidos
tempo de processamento e artefatos de eco transientes reduzidos (quase pela metade). Observe que
se esta opção for fornecida, a largura de banda mínima permitida com -b aumenta para
85%.

Exemplos:
sox input.wav -b 16 output.wav taxa -s -a 44100 dither -s
reamostragem de qualidade padrão (alta); substituições: filtro íngreme, permite aliasing; para
Taxa de amostragem de 44.1 kHz; pontilhamento em forma de ruído para arquivo WAV de 16 bits.
sox input.wav -b 24 output.aiff taxa -v -I -b 90 48k
reamostragem de qualidade muito alta; sobreposições: fase intermediária, largura de banda 90%; a 48k
taxa de amostragem; armazene a saída em um arquivo AIFF de 24 bits.

* * *

O passo e velocidade efeitos usam o taxas efeito em seu núcleo.

Remix [-a|-m|-p]fora das especificações>
fora das especificações = dentro das especificações{,dentro das especificações} | 0
dentro das especificações = [in-chan][-[in-chan2]] [vol-especificação]
vol-especificação = p|i|v[volume]

Selecione e misture canais de áudio de entrada em canais de áudio de saída. Cada saída
canal é especificado, por sua vez, por um determinado fora das especificações: uma lista de contribuições de contribuição
canais e especificações de volume.

Observe que este efeito opera no áudio canais dentro dos efeitos SoX
cadeia de processamento; não deve ser confundido com o -m opção global (onde
múltiplo arquivos são mixados antes de entrar na cadeia de efeitos).

An fora das especificações contém números de canal de entrada separados por vírgula e delimitados por hífen
intervalos de número de canal; alternativamente, 0 pode ser fornecido para criar uma saída silenciosa
canal. Por exemplo,
sox entrada.wav saída.wav remix 6 7 8 0
cria um arquivo de saída com quatro canais, onde os canais 1, 2 e 3 são cópias de
canais 6, 7 e 8 no arquivo de entrada e o canal 4 é silencioso. Enquanto que
sox entrada.wav saída.wav remix 1-3,7 3
cria um arquivo de saída estéreo (um tanto bizarro) onde o canal esquerdo é uma mistura
abaixo dos canais de entrada 1, 2, 3 e 7, e o canal direito é uma cópia da entrada
canal 3.

Onde um intervalo de canais é especificado, os números dos canais à esquerda e à direita
do hífen são opcionais e o padrão é 1 e o número de canais de entrada
respectivamente. Assim
remix sox input.wav output.wav -
realiza uma mixagem de todos os canais de entrada para mono.

Por padrão, onde um canal de saída é mixado de vários (n) canais de entrada, cada
canal de entrada será escalado por um fator de ¹ / n. Os volumes de mistura personalizados podem ser definidos
seguindo um determinado canal de entrada ou gama de canais de entrada com um vol-especificação
(especificação de volume). Esta é uma das letras p, i, ou v, Seguido por um
número do volume, cujo significado depende da letra dada e é definido como
segue:

Carta Volume número Notas
ajuste de potência p em dB 0 = sem alteração
eu ajusto o poder em dB como `p ', mas inverta o
auditivo
v multiplicador de tensão 1 = sem alteração, 0.5 ≈ 6dB
atenuação, 2 ≈ 6dB
ganho, -1 = inverter

Se um fora das especificações inclui pelo menos um vol-especificação então, por padrão, a escala ¹ / n não é
aplicada a qualquer outro canal na mesma especificação (embora possa estar em outra especificação
especificações). A opção -a (automático), no entanto, pode ser fornecida para manter o automático
dimensionamento neste caso. Por exemplo,
sox input.wav output.wav remix 1,2 3,4v0.8
resulta em multiplicadores de nível de canal de 0.5,0.5 1,0.8, enquanto
sox entrada.wav saída.wav remix -a 1,2 3,4v0.8
resulta em multiplicadores de nível de canal de 0.5,0.5 0.5,0.8.

A opção -m (manual) desativa todos os ajustes automáticos de volume, então
sox entrada.wav saída.wav remix -m 1,2 3,4v0.8
resulta em multiplicadores de nível de canal de 1,1 1,0.8.

O número do volume é opcional e sua omissão não corresponde a nenhuma alteração de volume;
no entanto, o único caso em que isso é útil é em conjunto com i. Para
exemplo, se entrada.wav é estéreo, então
sox entrada.wav saída.wav remix 1,2i
é um equivalente mono do oops efeito.

Se o -p opção for fornecida, então qualquer escala automática ¹ / n é substituída por ¹ / √n
('potência') dimensionamento; isso dá uma mixagem mais alta, mas que pode ocasionalmente cortar.

* * *

Um uso do Remix efeito é dividir um arquivo de áudio em um conjunto de arquivos, cada
contendo um dos canais constituintes (a fim de realizar
processamento em canais de áudio individuais). Onde mais do que alguns canais estão
envolvido, um script como o seguinte (script Bourne shell) é útil:
#!/ Bin / sh
chans = `soxi -c" $ 1 "`
enquanto [$ chans -ge 1]; Faz
chans0 = `printf% 02i $ chans` # 2 dígitos, portanto, até 99 canais
out = `echo" $ 1 "| sed" s / \ (. * \) \. \ (. * \) / \ 1- $ chans0. \ 2 / "`
sox "$ 1" "$ out" remix de $ chans
chans = `expr $ chans - 1`
feito
Se um arquivo entrada.wav contendo seis canais de áudio, o script
produz seis arquivos de saída: entrada-01.wav, entrada-02.wav, ..., entrada-06.wav.

Veja também o trocar efeito.

repetir [contar (1)]
Repita todo o áudio contar vezes, ou uma vez se contar não é dado. Requer
espaço de arquivo temporário para armazenar o áudio a ser repetido. Observe que repetir uma vez
rende duas cópias: o áudio original e o áudio repetido.

ressonância [-w|--somente molhado] [reverberação (50%) [amortecimento HF (% 50)
[escala de sala (100%) [profundidade estéreo (% 100)
[pré-atraso (0ms) [ganho molhado (0dB)]]]]]]

Adicione reverberação ao áudio usando o algoritmo `freeverb '. Uma reverberação
efeito às vezes é desejável para salas de concerto que são muito pequenas ou contêm
muitas pessoas que a reverberação natural do salão é diminuída. Aplicando um pequeno
quantidade de reverberação estéreo para um sinal mono (seco) geralmente fará com que soe mais
natural. Veja [3] para uma descrição detalhada da reverberação.

Observe que este efeito aumenta o volume e a duração do áudio, de modo que
evitar o corte nesses domínios, uma invocação típica pode ser:
toque dry.wav gain -3 pad 0 3 reverb
O -w pode ser dada a opção de selecionar apenas o sinal 'molhado', permitindo assim que seja
processado posteriormente, independentemente do sinal "seco". Por exemplo
play -m voice.wav "| sox voice.wav -p reverberação reversa -w reverse"
para um efeito de reverberação reversa.

reverso
Inverta o áudio completamente. Requer espaço de arquivo temporário para armazenar o áudio para
ser revertido.

ria Aplique a equalização de reprodução de vinil RIAA. A taxa de amostragem deve ser uma de: 44.1,
48, 88.2, 96 kHz.

Este efeito apóia o --enredo opção global.

silêncio [-l] acima dos períodos [duração limiar[d|%]
[períodos inferiores duração limiar[d|%]]

Remove o silêncio do início, meio ou final do áudio. `Silêncio 'é
determinado por um limite especificado.

O acima dos períodos valor é usado para indicar se o áudio deve ser cortado no
início do áudio. Um valor de zero indica que nenhum silêncio deve ser cortado de
o início. Ao especificar um diferente de zero acima dos períodos, ele corta o áudio até
encontra o não silêncio. Normalmente, ao cortar o silêncio do início do áudio, o
acima dos períodos será 1, mas pode ser aumentado para valores mais altos para cortar todo o áudio
até uma contagem específica de períodos sem silêncio. Por exemplo, se você tivesse um áudio
arquivo com duas músicas, cada uma contendo 2 segundos de silêncio antes da música, você
poderia especificar um acima do período de 2 para retirar ambos os períodos de silêncio e o primeiro
canção.

Quando acima dos períodos é diferente de zero, você também deve especificar um duração e limiar.
Duração indica a quantidade de tempo que o não silêncio deve ser detectado antes de
pára de cortar o áudio. Ao aumentar a duração, a explosão de ruído pode ser tratada como
silêncio e cortado.

Limite é usado para indicar qual valor de amostra você deve tratar como silêncio. Para
áudio digital, um valor de 0 pode ser adequado, mas para áudio gravado de analógico, você pode
deseja aumentar o valor para compensar o ruído de fundo.

Ao cortar opcionalmente o silêncio do final do áudio, você especifica um abaixo de-
períodos contar. Nesse caso, abaixo do período significa remover todo o áudio após o silêncio
é detectado. Normalmente, este será um valor 1 de, mas pode ser aumentado para pular
durante os períodos de silêncio desejados. Por exemplo, se você tem uma música com 2
segundos de silêncio no meio e 2 segundos no final, você pode definir abaixo
período para um valor de 2 para pular o silêncio no meio do áudio.

Para a períodos inferiores, duração especifica um período de silêncio que deve existir antes
o áudio não é mais copiado. Ao especificar uma duração maior, o silêncio que é
queria pode ser deixado no áudio. Por exemplo, se você tem uma música com um esperado
1 segundo de silêncio no meio e 2 segundos de silêncio no final, uma duração
de 2 segundos pode ser usado para pular o silêncio do meio.

Infelizmente, você deve saber a duração do silêncio no final de seu áudio
arquivo para cortar o silêncio de forma confiável. Uma solução alternativa é usar o silêncio efeito em
combinação com o reverso efeito. Ao primeiro inverter o áudio, você pode usar o
acima dos períodos para cortar de forma confiável todo o áudio do que parece ser a parte frontal do
Arquivo. Em seguida, inverta o arquivo novamente para voltar ao normal.

Para remover o silêncio do meio de um arquivo, especifique um períodos inferiores isso é
negativo. Este valor é então tratado como um valor positivo e também é usado para
indica que o efeito deve reiniciar o processamento conforme especificado pelo acima dos períodos,
tornando-o adequado para remover períodos de silêncio no meio do áudio.

A opção -l indica que períodos inferiores duração a duração do áudio deve ser deixada
intacta no início de cada período de silêncio. Por exemplo, se você quiser
remova longas pausas entre palavras, mas não deseja removê-las completamente.

O significativo as contagens são em unidades de amostras. Duração as contagens podem estar no formato de
hh: mm: ss.frac, ou a contagem exata de amostras. Limite números podem ser sufixados
com d para indicar que o valor está em decibéis, ou % para indicar uma porcentagem de
valor máximo do valor da amostra (0% especifica puro silêncio digital).

O exemplo a seguir mostra como este efeito pode ser usado para iniciar uma gravação que
não contém o atraso no início que geralmente ocorre entre `pressionar o
botão de gravação 'e o início da performance:
rec parâmetros nome do arquivo outros-efeitos silêncio 1 5 2%

sincero [-a para|-b beta] [-p fase|-M|-I|-L] [-t tbw|-n torneiras] [frequênciaHP][-freqLP [-t tbw |-n
torneiras]]
Aplicar um filtro passa-baixo, passa-alto, passa-banda ou rejeição de banda sinc Kaiser
para o sinal. o frequênciaHP e freqLP parâmetros fornecem as frequências de 6dB
pontos de um filtro passa-alta e passa-baixa que pode ser invocado individualmente, ou
juntos. Se ambos forem fornecidos, então frequênciaHP menos que freqLP cria uma passagem de banda
filtro, frequênciaHP Melhor que freqLP cria um filtro de rejeição de banda. Por exemplo, o
invocações
desde 3k
sinc -4k
desde 3k-4k
desde 4k-3k
crie um filtro passa-alto, passa-baixo, passa-banda e rejeita-banda, respectivamente.

A atenuação de banda de parada padrão de 120dB pode ser substituída com -a;
alternativamente, o parâmetro kaiser-window `beta 'pode ser fornecido diretamente com -b.

A largura de banda de transição padrão de 5% da banda total pode ser substituída com -t
(E tbw em Hertz); alternativamente, o número de torneiras de filtro pode ser dado diretamente
com -n.

Se ambos frequênciaHP e freqLP são dados, então um -t or -n opção dada à esquerda de
as frequências se aplicam a ambas as frequências; uma dessas opções dadas ao
direito das frequências aplica-se apenas a freqLP.

O -p, -M, -I e -L as opções controlam a resposta de fase do filtro; Veja o taxas
efeito para detalhes.

Este efeito apóia o --enredo opção global.

espectrograma [opções]
Crie um espectrograma do áudio; o áudio é passado sem modificações através do SoX
cadeia de processamento. Este efeito é opcional - digite Sox --Socorro e verifique a lista de
efeitos suportados para ver se ele foi incluído.

O espectrograma é renderizado em um arquivo Portable Network Graphic (PNG) e mostra
tempo no eixo X, frequência no eixo Y e magnitude do sinal de áudio no Z-
eixo. Os valores do eixo Z são representados pela cor (ou opcionalmente pela intensidade) de
os pixels no plano XY. Se o sinal de áudio contiver vários canais, então
estes são mostrados de cima para baixo, começando no canal 1 (que é a esquerda
canal para áudio estéreo).

Por exemplo, se `my.wav 'é um arquivo estéreo, então com
espectrograma sox my.wav -n
um espectrograma de todo o arquivo será criado no arquivo `espectrograma.png '.
Porém, com mais frequência, é necessária a análise de uma parte menor do áudio; por exemplo
com
espectrograma sox my.wav -n remix 2 trim 20 30
o espectrograma mostra informações apenas do segundo canal (direito), e de
trinta segundos de áudio a partir de vinte segundos em. Para analisar um pequeno
parte do domínio da frequência, o taxas efeito pode ser usado, por exemplo
espectrograma sox my.wav -n rate 6k
permite a análise detalhada de frequências de até 3kHz (metade da taxa de amostragem), ou seja
onde o sistema auditivo humano é mais sensível. Com
sox my.wav -n trim 0 10 espectrograma -x 600 -y 200 -z 100
as opções fornecidas controlam o tamanho dos eixos X, Y e Z do espectrograma (neste
caso, a área do espectrograma da imagem produzida será de 600 por 200 pixels de tamanho
e a faixa do eixo Z será de 100 dB). Observe que a imagem produzida inclui eixos
legendas etc. e, portanto, serão um pouco maiores do que o tamanho do espectrograma especificado.
Neste exemplo:
sox -n -n synth 6 tri 10k: espectrograma 14k -z 100 -w kaiser
uma 'janela' de análise com alta faixa dinâmica é selecionada para melhor exibir o
espectrograma de uma onda triangular varrida. Para um exemplo semelhante, acrescente o seguinte
ao comando `chime 'na descrição do atraso efeito (acima):
taxa 2k espectrograma -X 200 -Z -10 -w kaiser
Opções também estão disponíveis para controlar a aparência (definição de cor, brilho,
contraste, etc.) e nome do arquivo do espectrograma; por exemplo, com
sox my.wav -n espectrograma -m -l -o print.png
um espectrograma é criado adequado para impressão em uma impressora 'preto e branco'.

opções:

-x Números Altere a largura (máxima) (eixo X) do espectrograma de seu padrão
valor de 800 pixels para um determinado número entre 100 e 200000. Veja também -X
e -d.

-X Números Pixels do eixo X / segundo; o padrão é calculado automaticamente para se ajustar ao ou
duração de áudio conhecida para o tamanho do eixo X ou 100 de outra forma. Se dado em
Conjunção com -d, esta opção afeta a largura do espectrograma;
caso contrário, afeta a duração do espectrograma. Números pode ser de 1
(resolução de baixo tempo) a 5000 (resolução de alto tempo) e não precisa ser um
inteiro. O SoX pode fazer um pequeno ajuste no número fornecido para
razões de quantização de processamento; em caso afirmativo, o SoX relatará o número real
usado (visível quando a opção global SoX -V está em vigor). Veja também -x e
-d.

-y Números Define o tamanho do eixo Y em pixels (por canal); este é o número de
'bins' de frequência usados ​​na análise de Fourier que produz o espectrograma.
NB, pode ser lento para produzir o espectrograma se este número não for um
mais de uma potência de dois (por exemplo, 129). Por padrão, o tamanho do eixo Y é escolhido
automaticamente (dependendo do número de canais). Ver -Y para alternativa
maneira de definir a altura do espectrograma.

-Y Números Define a altura total do alvo do (s) espectrograma (s). o valor padrão é
550 pixels. Usando esta opção (e por padrão), o SoX escolherá uma altura
para canais de espectrograma individuais que são um a mais do que uma potência de dois, então
a altura total real pode ficar aquém do número fornecido. No entanto, lá
também é uma altura mínima por canal, então, se houver muitos canais, o
número pode ser excedido. Ver -y para uma maneira alternativa de definir o espectrograma
altura.

-z Números Intervalo do eixo Z (cor) em dB, padrão 120. Isso define o intervalo dinâmico de
o espectrograma a ser -Números dBFS a 0 dBFS. Num pode variar de 20 a 180.
A diminuição da faixa dinâmica aumenta efetivamente o 'contraste' do
exibição do espectrograma e vice-versa.

-Z Números Define o limite superior do eixo Z em dBFS. Um negativo Números efetivamente
aumenta o `brilho 'da exibição do espectrograma e vice-versa.

-q Números Define a quantização do eixo Z, ou seja, o número de cores diferentes (ou
intensidades) para renderizar os valores do eixo Z. Um pequeno número (por exemplo, 4) irá
dar um efeito de 'pôster' tornando mais fácil discernir as bandas de magnitude de
nível semelhante. Números pequenos também costumam resultar em arquivos PNG pequenos. o
o número fornecido especifica o número de cores a serem usadas dentro do intervalo do eixo Z;
duas cores são reservadas para representar valores fora do intervalo.

-w nome
Janela: Hann (padrão), Hamming, Bartlett, Rectangular ou Kaiser. o
espectrograma é produzido usando a transformada discreta de Fourier (DFT)
algoritmo. Um parâmetro significativo para este algoritmo é a escolha de
`função de janela '. Por padrão, o SoX usa a janela Hann, que possui todos os
resolução de frequência redonda e propriedades de faixa dinâmica. Para melhor
resolução de frequência (mas menor faixa dinâmica), selecione uma janela Hamming; para
faixa dinâmica mais alta (mas resolução de frequência mais baixa), selecione um Kaiser
janela. Bartlett e janelas retangulares também estão disponíveis.

-W Números Parâmetro de ajuste de janela. Isso pode ser usado para fazer pequenos ajustes para
a forma da janela Kaiser. Um número positivo (até dez) aumenta seu
faixa dinâmica, um número negativo diminui.

-s Permitir sobreposição de folga das janelas DFT. Isso pode, em alguns casos, aumentar
nitidez da imagem e dar maior aderência ao -x valor, mas no
despesa de uma pequena perda espectral.

-m Cria um espectrograma monocromático (o padrão é colorido).

-h Seleciona uma paleta de cores - menos agradável visualmente do que o padrão
paleta de cores, mas pode tornar mais fácil diferenciar níveis diferentes.
Se esta opção for usada em conjunto com -m, o resultado será um híbrido
paleta monocromática / de cores.

-p Números Permute as cores em uma paleta de cores ou híbrida. o Números parâmetro, de
1 (o padrão) a 6, seleciona a permutação.

-l Cria um espectrograma "amigável para impressão" com um fundo claro (o
o padrão tem um fundo escuro).

-a Suprime a exibição das linhas do eixo. Isso às vezes é útil para ajudar
para discernir artefatos nas bordas do espectrograma.

-r Espectrograma bruto: suprime a exibição de eixos e legendas.

-A Seleciona um conjunto de cores fixo alternativo. Isso é fornecido apenas para
compatibilidade com espectrogramas produzidos por outro pacote. Não deveria
normalmente ser usado, pois tem alguns problemas, não menos importante, a falta de
diferenciação na extremidade inferior, o que resulta no mascaramento de baixo nível
artefatos.

-t texto
Defina o título da imagem - texto a ser exibido acima do espectrograma.

-c texto
Defina (ou desmarque) o comentário da imagem - texto a ser exibido abaixo e à esquerda de
o espectrograma.

-o texto
Nome do arquivo PNG de saída do espectrograma, padrão `espectrograma.png '.

Avançado opções:
Para processar uma seção menor de áudio sem afetar outros efeitos ou
o sinal de saída (ao contrário de quando o aparar efeito é usado), as seguintes opções podem
ser usado.

-d duração
Esta opção define a resolução do eixo X de forma que o áudio com o dado
duração ([[HH:] MM:] SS) ajusta-se à largura do eixo X selecionada (ou padrão). Para
exemplo,
sox input.mp3 output.wav -n espectrograma -d 1:00 estatísticas
cria um espectrograma mostrando o primeiro minuto do áudio, enquanto
da stats efeito é aplicado a todo o sinal de áudio.

Veja também -X para uma forma alternativa de definir a resolução do eixo X.

-S tempo
Inicie o espectrograma em um determinado ponto do fluxo de áudio. Por exemplo
espectrograma sox input.aiff output.wav -S 1:00
cria um espectrograma mostrando tudo, exceto o primeiro minuto do áudio (o
arquivo de saída, no entanto, recebe todo o fluxo de áudio).

Para a capacidade de realizar processamento off-line de dados espectrais, consulte o estado
efeito.

velocidade fator[c]
Ajuste a velocidade do áudio (pitch e andamento juntos). fator é a proporção de
a nova velocidade para a velocidade antiga: maior que 1 acelera, menos que 1 desacelera,
ou, se anexado à letra 'c', o número de centavos (ou seja, centésimos de um
semitom) pelo qual o tom (e o tempo) devem ser ajustados: maior que 0
aumenta, menos de 0 diminui.

Tecnicamente, o efeito de velocidade altera apenas as informações da taxa de amostragem, deixando o
amostras elas mesmas intocadas. o taxas efeito é invocado automaticamente para reamostrar
para a taxa de amostragem de saída, usando sua qualidade / velocidade padrão. Para maior qualidade ou
reamostragem de maior velocidade, além do velocidade efeito, especifique o taxas efeito
com a opção de qualidade desejada.

Veja também o dobrar, passo e tempo efeitos.

Emparelhar [-h|-t|-q] { posição[,excesso[,margem de manobra]]}
Divida as seções de áudio. Este efeito oferece duas coisas sobre áudio simples
concatenação: um cross-fade (geralmente curto) é aplicado na junção e uma onda
comparação de similaridade é feita para ajudar a determinar o melhor lugar para fazer o
Junte.

Uma das opções -h, -t, ou -q pode ser dado para selecionar o envelope fade como meio
onda cosseno (o padrão), onda triangular (também conhecida como linear) ou um quarto cosseno
respectivamente.

Formato em áudio Desvanecer nível Transições
t ganho constante correlacionado abrupto
h ganho constante correlacionado suave
q potência constante não correlacionada suave

Para realizar uma emenda, primeiro use o aparar efeito para selecionar as seções de áudio a serem
unidos. Como ao realizar uma emenda de fita, o final da seção a ser
emendado deve ser aparado com um pequeno excesso (padrão 0.005 segundos) de áudio
após o ponto de união ideal. O início da seção de áudio para unir
deve ser aparado com o mesmo excesso (antes do ponto de união ideal), mais um
adicional margem de manobra (padrão 0.005 segundos). SoX deve então ser invocado com os dois
seções de áudio como arquivos de entrada e o Emparelhar efeito dado com a posição em
qual realizar a emenda - esta é a duração da primeira seção de áudio (incluindo
o excesso).

O diagrama a seguir usa a analogia da fita para ilustrar a operação de emenda.
O efeito simula os cortes diagonais e junta as duas peças:

excesso de comprimento1
-----------> <--->
_________:: _________________
\::: \ `
\::: \ `
\::: \ `
*:: * - - *
\::: \ `
\::: \ `
_______________ \:: \ _____ `____
::::
<---> <----->
excesso de liberdade

onde * indica os pontos de união.

Por exemplo, uma longa canção começa com dois versos que começam (conforme determinado, por exemplo, por
usando o play comando com o aparar (começo) efeito) nos tempos 0: 30.125 e
1: 03.432. Os seguintes comandos eliminam o primeiro verso:
sox muito longo.wav part1.wav trim 0 30.130
(5 ms de excesso, após o início do primeiro verso)
sox too-long.wav part2.wav trim 1: 03.422
(5 ms de excesso mais 5 ms de margem de manobra, antes que o segundo verso comece)
sox part1.wav part2.wav just-right.wav emenda 30.130
Para outro exemplo, o comando SoX
tocar "| sox -n -p synth 1 sin% 1" "| sox -n -p synth 1 sin% 3"
gera e toca duas notas, mas há um clique desagradável na transição; a
o clique pode ser removido unindo em vez de concatenar o áudio, ou seja,
acrescentando Emparelhar 1 ao comando. (Clica no início e no final do áudio
pode ser removido por precedente o efeito de emenda com desvanecer q .01 2 .01).

Desde que sua aritmética seja boa o suficiente, várias emendas podem ser realizadas com um
solteiro Emparelhar invocação. Por exemplo:
#!/ Bin / sh
# Copiar e colar áudio
# acpo infile copy-start copy-stop colar-over-start outfile
# Todos os tempos medidos em amostras.
taxa = `soxi -r" $ 1 "`
e = `expr $ rate '*' 5 / 1000` # Usando o excesso padrão
l = $ e # e margem de manobra.
sox "$1" peça.wav trim `expr $2 - $e - $l`s
`expr $ 3 - $ 2 + $ e + $ l + $ e`s
sox "$ 1" part1.wav trim 0 `expr $ 4 + $ e`s
sox "$ 1" part2.wav trim `expr $ 4 + $ 3 - $ 2 - $ e - $ l`s
sox part1.wav piece.wav part2.wav emenda "$5"
`expr $4 + $e`s
`expr $ 4 + $ e + $ 3 - $ 2 + $ e + $ l + $ e`s
No script Bourne shell acima, duas emendas são usadas para `copiar e colar 'áudio.

* * *

Também é possível usar este efeito para realizar cross-fades gerais, por exemplo, para juntar
duas canções. Nesse caso, excesso normalmente seria um número de segundos, o -q
opção normalmente seria fornecida (para selecionar um cross-fade de "potência igual"), e margem de manobra
deve ser zero (que é o padrão se -q é dada). Por exemplo, se f1.wav e
f2.wav são arquivos de áudio a serem atenuados, então
sox f1.wav f2.wav out.wav splice -q $ (soxi -D f1.wav), 3
cross-fades os arquivos onde o ponto de volume igual é 3 segundos antes do final
de f1.wav, ou seja, o comprimento total do cross-fade é 2 × 3 = 6 segundos (Nota: o
$ (...) notação é POSIX shell).

estado [-s escada] [-rms] [-frequencia] [-v] [-d]
Exibe informações estatísticas de domínio de tempo e frequência sobre o áudio. Áudio
é passado sem modificações pela cadeia de processamento do SoX.

A informação é enviada para o fluxo de `erro padrão '(stderr) e é
calculado, onde n é a duração do áudio nas amostras, c é o número de
canais de áudio, r é a taxa de amostragem de áudio e xk representa o valor PCM (no
intervalo de -1 a +1 por padrão) de cada amostra sucessiva no áudio, da seguinte forma:

amostras ler n×c
Comprimento (segundos) n÷r
Escalado by Veja -s abaixo.
Máximo amplitude max (xk) O valor máximo da amostra
no áudio; usualmente
isso será um positivo
número.
Mínimo amplitude min (xk) O valor mínimo da amostra
no áudio; usualmente
isso vai ser negativo
número.
Linha média amplitude ½min (xk) + ½max (xk)
Média norma ¹ / nΣ│xk│ A média do
valor absoluto de cada
amostra no áudio.
Média amplitude ¹ / nΣxk A média de cada
amostra no áudio. Se
este número é diferente de zero,
então indica o
presença de um DC
deslocamento (que pode ser
removido usando o
dc shift efeito).
RMS amplitude √ (¹ / nΣxk²) O nível de um DC
sinal que teria
o mesmo poder que o
potência média do áudio.
Máximo delta max (│xk-xk-1│)
Mínimo delta min (│xk-xk-1│)
Média delta ¹ / n-1Σ│xk-xk-1
RMS delta √ (¹ / n-1Σ (xk-xk-1) ²)
áspero freqüência Em Hz.
Volume Ajustamento O parâmetro para o vol
efeito que faria
o áudio tão alto quanto
possível sem
recorte. Nota: Veja o
discussão sobre Clipping
acima por razões porque isso
raramente é uma boa ideia
realmente para fazer isso.

Observe que as medidas delta não são aplicáveis ​​para áudio multicanal.

O -s A opção pode ser usada para dimensionar os dados de entrada por um determinado fator. O padrão
valor de escada é 2147483647 (ou seja, o valor máximo de um inteiro assinado de 32 bits).
Os efeitos internos sempre funcionam com dados PCM longos assinados e, portanto, o valor deve
relacionam-se a este fato.

O -rms opção irá converter todos os valores médios de saída para 'raiz quadrada média'
formato.

O -v opção exibe apenas o valor de `Ajuste de Volume '.

O -frequencia opção calcula o espectro de potência da entrada (4096 pontos DFT) em vez de
as estatísticas listadas acima. Isso só deve ser usado com um único canal de áudio
arquivo.

O -d opção exibe um dump hexadecimal do áudio de dados PCM assinado de 32 bits no SoX
buffer interno. Isso é usado principalmente para ajudar a rastrear problemas endian que
às vezes ocorrem em versões de plataforma cruzada do SoX.

Veja também o stats efeito.

stats [-b pedaços|-x pedaços|-s escada] [-w tempo de janela]
Exibir informações estatísticas de domínio de tempo sobre os canais de áudio; áudio é
passou sem modificações pela cadeia de processamento do SoX. As estatísticas são calculadas e
exibido para cada canal de áudio e, quando aplicável, uma figura geral também é
dado.

Por exemplo, para um arquivo de música estéreo bem dominado típico:

Geral Esquerda Direita
DC offset 0.000803 -0.000391 0.000803
Nível mínimo -0.750977 -0.750977 -0.653412
Nível máximo 0.708801 0.708801 0.653534
Pk lev dB -2.49 -2.49 -3.69
RMS lev dB -19.41 -19.13 -19.71
RMS Pk dB -13.82 -13.82 -14.38
RMS Tr dB -85.25 -85.25 -82.66
Fator de crista - 6.79 6.32
Fator plano 0.00 0.00 0.00
Contagem Pk 2 2 2
Profundidade de bits 16/16 16/16 16/16
Num samples 7.72M
Comprimento s 174.973
Escala máx. 1.000000
Janela s 0.050

DC compensar, min nível e Max nível são mostrados, por padrão, no intervalo ± 1. Se o
-b (bits) opções são fornecidas, então essas três medições serão escaladas para um
inteiro assinado com o número fornecido de bits; por exemplo, para 16 bits, a escala
seria -32768 a +32767. o -x opção se comporta da mesma maneira que -b exceto aquilo
os valores inteiros com sinal são exibidos em hexadecimal. o -s opção dimensiona o
três medições por um determinado número de ponto flutuante.

Pk lev dB e RMS lev dB são o pico padrão e o nível RMS medido em dBFS.
RMS Pk dB e RMS Tr dB são os valores de pico e vale para o nível RMS medido ao longo de um
janela curta (padrão 50ms).

CREST fator é a proporção padrão do pico para o nível RMS (nota: não em dB).

Plano fator é uma medida do nivelamento (ou seja, amostras consecutivas com o mesmo
valor) do sinal em seus níveis de pico (ou seja, min nível, ou Max nível).
Pk contar é o número de ocasiões (não o número de amostras) que o sinal
alcançou qualquer um min nível, ou Max nível.

A mão direita Profundidade de bits figura é a definição padrão de profundidade de bits, ou seja, bits
menos significativo do que o número fornecido são fixados em zero. A figura do lado esquerdo é
o número de bits mais significativos que são fixados em zero (ou um para o negativo
números) subtraídos da figura à direita (o número subtraído é diretamente
relacionado com Pk lev dB).

Para áudio multicanal, um valor geral para cada uma das medidas acima é
dados e derivados dos números do canal da seguinte forma: DC compensar: máximo
magnitude; Max nível, Pk lev dB, RMS Pk dB, Profundidade de bits: máximo; min nível,
RMS Tr dB: mínimo; RMS lev dB, Plano fator, Pk contar: média; CREST fator: não
aplicável.

Comprimento s é a duração em segundos do áudio, e Num amostras é igual ao
taxa de amostragem multiplicada por Comprimento. Escala Max é a escala aplicada ao primeiro
três medições; especificamente, é o valor máximo que poderia ser aplicado a
Max nível. Janela s é o comprimento da janela usada para o pico e o vale RMS
medições.

Veja também o estado efeito.

trocar Troque os canais estéreo. Veja também Remix para um efeito que permite canal arbitrário
seleção e ordenação (e mistura).

esticam fator [janela desvanecer mudança desbotando]
Altere a duração do áudio (mas não o tom). Este efeito é amplamente equivalente
ao tempo efeito com (fator invertido e) pesquisar definido como zero, então, em geral,
seus resultados são comparativamente pobres; é retido, pois às vezes pode superar o desempenho
tempo para pequenas fators.

fator de alongamento:> 1 aumentar, <1 diminuir a duração. janela o tamanho está em ms.
O padrão é 20 ms. o desvanecer opção, pode ser `lin '. mudança proporção, em [0 1]. Predefinição
depende do fator de alongamento. 1 para reduzir, 0.8 para aumentar. o desbotando proporção, em [0
0.5]. A quantidade de default de um fade depende de fator e mudança.

Veja também o tempo efeito.

synth [-j KEY] [-n] [len [WOW! [ph [p1 [p2 [p3]]]]]] {[tipo] [combinar]
[[%]frequencia[k][:|+|/|-[%]frequência2[k]]] [WOW! [ph [p1 [p2 [p3]]]]]}
Este efeito pode ser usado para gerar tons de áudio de frequência fixa ou varrida com
várias formas de onda, ou para gerar ruído de banda larga de várias 'cores'. Múltiplo
efeitos de sintetizador podem ser colocados em cascata para produzir formas de onda mais complexas; em cada estágio isso
é possível escolher se a forma de onda gerada será misturada com, ou
modulado na saída do estágio anterior. Áudio para cada canal em um
arquivo de áudio multicanal pode ser sintetizado independentemente.

Embora este efeito seja usado para gerar áudio, um arquivo de entrada ainda deve ser fornecido,
cujas características serão usadas para definir a duração do áudio sintetizado, o
número de canais e a taxa de amostragem; no entanto, uma vez que o áudio do arquivo de entrada é
normalmente não é necessário, um `arquivo nulo '(com o nome especial -n) é frequentemente dado
em vez disso (e o comprimento especificado como um parâmetro para synth ou por outro dado
efeito que pode ter um comprimento associado).

Por exemplo, o seguinte produz um arquivo de áudio de 3 segundos, 48 ​​kHz, contendo um
onda senoidal varrida de 300 a 3300 Hz:
sox -n output.wav synth 3 seno 300-3300
e isso produz uma versão de 8 kHz:
sox -r 8000 -n output.wav synth 3 seno 300-3300
Vários canais podem ser sintetizados especificando o conjunto de parâmetros mostrado
entre colchetes várias vezes; o seguinte coloca o tom varrido à esquerda
canal e adiciona ruído 'marrom' à direita:
sox -n saída.wav sintetizador 3 seno 300-3300 brownnoise
O exemplo a seguir mostra como dois efeitos de sintetizador podem ser colocados em cascata para criar mais
forma de onda complexa:
play -n synth 0.5 seno 200-500 synth 0.5 seno fmod 700-100
As frequências também podem ser fornecidas em notação de nota `científica 'ou prefixando`%'
caractere, como um número de semitons em relação ao 'A médio' (440 Hz). Por exemplo,
o seguinte pode ser usado para ajudar a afinar a corda "E" grave de uma guitarra:
tocar sintetizador -n 4 dedilhar% -29
ou com um loop (Bourne shell), toda a guitarra:
para n em E2 A2 D3 G3 B3 E4; Faz
tocar -n sintetizador 4 dedilhar $ n repetir 2; feito
veja a atraso efeito (acima) e a referência aos 'exemplos de script SoX' (abaixo)
para mais synth exemplos.

NB Este efeito gera áudio no volume máximo (0dBFS), o que significa que há
é uma grande chance de corte ao usar o áudio posteriormente, então, em muitos casos,
você vai querer seguir este efeito com o de ganho efeito para prevenir isso de
acontecendo. (Veja também Clipping acima.) Observe que, por padrão, o synth efeito
incorpora a funcionalidade de de ganho -h (Ver a de ganho efeito para detalhes);
synth's -n pode ser fornecida a opção para desativar esse comportamento.

Uma descrição detalhada de cada synth parâmetro a seguir:

len é a duração do áudio a sintetizar, expressa como um tempo ou um número de
amostras; 0 = comprimento de entrada, padrão = 0.

O formato para especificar comprimentos de tempo é hh: mm: ss.frac. O formato para
especificar contagens de amostra é o número de amostras com a letra `s 'anexada a
.

tipo é um de seno, quadrado, triângulo, dente de serra, trapézio, exp, ruído [branco],
tpdfnoise pinknoise, brownnoise, arrancar; padrão = seno.

combinar é um de criar, misturar, amod (modulação de amplitude), fmod (frequência
modulação); padrão = criar.

frequencia/frequência2 são as frequências no início / fim da síntese em Hz ou, se
precedido de `% ', semitons relativos a A (440 Hz); alternativamente, 'científico'
notação de nota (por exemplo, E2) pode ser usada. A frequência padrão é 440Hz. Por padrão,
a afinação usada com as notações de nota é 'temperamento igual'; a -j KEY opção
seleciona `apenas entonação ', onde KEY é um número inteiro de semitons relativo a
A (por exemplo, -9 ou 3 seleciona a tonalidade de C), ou uma nota em notação científica.

If frequência2 é dado, então len também deve ter sido dado e o tom gerado será
ser varrido entre as frequências fornecidas. As duas frequências fornecidas devem ser
separados por um dos caracteres `: ',` +', `/ 'ou` -'. Este personagem é usado
para especificar a função de varredura da seguinte forma:

: Linear: o tom mudará em um número fixo de hertz por segundo.

+ Quadrado: uma função de segunda ordem é usada para alterar o tom.

/ Exponencial: o tom mudará em um número fixo de semitons por segundo.

- Exponencial: como `/ ', mas a fase inicial sempre zero, e escalonada (menos
suave) mudanças de frequência.

Não é usado para ruído.

WOW! é a polarização (DC-offset) do sinal em porcentagem; padrão = 0.

ph é a mudança de fase em porcentagem de 1 ciclo; padrão = 0. Não é usado para ruído.

p1 é a porcentagem de cada ciclo que está "ligado" (quadrado) ou "crescente" (triângulo,
exp, trapézio); padrão = 50 (quadrado, triângulo, exp), padrão = 10 (trapézio) ou
sustentar (arrancar); padrão = 40.

p2 (trapézio): a porcentagem ao longo de cada ciclo no qual a 'queda' começa;
padrão = 50. exp: a amplitude em múltiplos de 2dB; padrão = 50 ou tom-1 (dedilhar);
padrão = 20.

p3 (trapézio): a porcentagem ao longo de cada ciclo no qual termina a 'queda';
padrão = 60 ou tom-2 (dedilhada); padrão = 90.

tempo [-q] [-m|-s|-l] fator [segmento [pesquisar [sobreposição]]]
Altere a velocidade de reprodução de áudio, mas não seu tom. Este efeito usa o WSOLA
algoritmo. O áudio é dividido em segmentos que são então deslocados no tempo
domínio e sobreposto (cross-faded) em pontos onde suas formas de onda são mais
semelhantes conforme determinado pela medição dos 'mínimos quadrados'.

Por padrão, pesquisas lineares são usadas para encontrar os melhores pontos de sobreposição. Se o
opcional -q parâmetro é fornecido, buscas em árvore são usadas em seu lugar. Isso torna o
efeito funcionam mais rapidamente, mas o resultado pode não soar tão bom. No entanto, se você
deve melhorar a velocidade de processamento, isso geralmente reduz a qualidade do som menos
do que reduzir os valores de pesquisa ou sobreposição.

O -m opção é usada para otimizar os valores padrão do segmento, pesquisa e sobreposição para
processamento de música.

O -s opção é usada para otimizar os valores padrão do segmento, pesquisa e sobreposição para
processamento de fala.

O -l opção é usada para otimizar os valores padrão do segmento, pesquisa e sobreposição para
processamento "linear" que tende a causar distorção mais perceptível, mas pode ser
útil quando o fator é próximo a 1.

Se -m, -s ou -l for especificado, o valor padrão do segmento será calculado
com base no fator, enquanto a pesquisa padrão e os valores de sobreposição são baseados no segmento. Algum
os valores que você fornece ainda substituem esses valores padrão.

fator dá a proporção do novo tempo para o ritmo antigo, então, por exemplo, 1.1 acelera o
o andamento em 10% e 0.9 diminui em 10%.

O opcional segmento parâmetro seleciona o tamanho do segmento do algoritmo em
milissegundos. Se nenhum outro sinalizador for especificado, o valor padrão é 82 e é
normalmente adequado para fazer pequenas alterações no andamento da música. Para mudanças maiores
(por exemplo, um fator de 2), 41 ms pode dar um resultado melhor. Os sinalizadores -m, -s e -l
fará com que o padrão do segmento seja ajustado automaticamente com base no fator. Para
exemplo, usando -s (para fala) com um tempo de 1.25 irá calcular um segmento padrão
valor de 32.

O opcional pesquisar parâmetro fornece a duração do áudio em milissegundos durante a qual o
algoritmo irá procurar por pontos sobrepostos. Se nenhum outro sinalizador for especificado, o
o valor padrão é 14.68. Valores maiores usam mais tempo de processamento e podem ou não
produzir melhores resultados. Um máximo prático é a metade do valor do segmento. Procurar
pode ser reduzido para reduzir o tempo de processamento com o risco de degradar a qualidade da saída. o
Os sinalizadores -m, -s e -l farão com que o padrão de pesquisa seja ajustado automaticamente
com base no segmento.

O opcional sobreposição parâmetro fornece o comprimento de sobreposição do segmento em milissegundos.
O valor padrão é 12, mas os sinalizadores -m, -s ou -l ajustam automaticamente a sobreposição com base em
tamanho do segmento. Aumentar a sobreposição aumenta o tempo de processamento e pode aumentar
qualidade. Um máximo prático para sobreposição é o valor da pesquisa, com sobreposição
normalmente sendo (pelo menos) um pouco menor do que a pesquisa.

Veja também velocidade para um efeito que muda o andamento e a afinação juntos, passo e dobrar
para efeitos que mudam apenas o tom, e esticam para um efeito que muda o andamento
usando um algoritmo diferente.

triplo de ganho [freqüência[k] [largura[s|h|k|o|q]]]
Aplique um efeito de controle de tom agudo. Veja a descrição do baixo efeito para
Detalhes.

tremolo velocidade [profundidade]
Aplique um efeito de tremolo (modulação de amplitude de baixa frequência) ao áudio. o
a frequência do tremolo em Hz é dada por velocidade, e a profundidade como uma porcentagem por profundidade
(padrão 40).

aparar {[=|-]posição}
Corta partes do áudio. Qualquer número de posiçãos podem ser dados; áudio não é
enviado para a saída até o primeiro posição é atingido. O efeito então se alterna
entre copiar e descartar áudio em cada posição.

Se um posição é precedido por um sinal de igual ou menos, é interpretado em relação a
o início ou o fim do áudio, respectivamente. (A duração do áudio deve ser
conhecido para locais relativos finais para trabalhar.) Caso contrário, é considerado um deslocamento
do último posição, ou desde o início do áudio para o primeiro parâmetro. Usando
um valor de 0 para o primeiro posição parâmetro permite copiar desde o início de
o áudio.

Todos os parâmetros podem ser especificados usando um período de tempo ou uma contagem exata de
amostras. O formato para especificar comprimentos de tempo é hh: mm: ss.frac. Um valor de
1: 30.5 para o primeiro parâmetro não começará até 1 minuto, trinta e ½ segundos
no áudio. O formato para especificar contagens de amostra é o número de amostras
com a letra `s 'anexada a ele. Um valor de 8000s para o primeiro parâmetro
espere até que 8000 amostras sejam lidas antes de começar a processar o áudio.

Por exemplo, nos
guarnição de arquivo de entrada sox 0 10
irá copiar os primeiros dez segundos, enquanto
jogo infil trim 12:34 = 15: 00 -2: 00
tocará de 12 minutos e 34 segundos no áudio até 15 minutos no áudio
(ou seja, 2 minutos e 26 segundos de duração) e, em seguida, retome a reprodução dois minutos antes do
fim do áudio.

aumentar a amostragem [fator]
Faça um upsample do sinal por um fator inteiro: fator-1 amostras de valor zero são inseridas
entre cada par de amostras de entrada. Como resultado, o espectro original é
replicado no novo espaço de frequência (aliasing) e atenuado. Esse
a atenuação pode ser compensada adicionando vol fator depois de mais
em processamento. O efeito upsample é normalmente usado em combinação com a filtragem
efeitos.

Para um efeito geral de reamostragem com anti-aliasing, consulte taxas. Veja também reduzir a amostra.

como [opções]
Detector de atividade de voz. Tentativas de cortar o silêncio e sons de fundo silenciosos de
o fim das gravações de voz (resolução razoavelmente alta, ou seja, 16 bits, 44-48 kHz).
O algoritmo atualmente usa uma medição de potência cepstral simples para detectar voz,
então pode ser enganado por outras coisas, especialmente música. O efeito pode cortar apenas de
a frente do áudio, então, para cortar a partir da parte de trás, o reverso efeito deve
também ser usado. Por exemplo
tocar speech.wav norm vad
aparar pela frente,
reproduzir speech.wav norma reversa vad reversa
aparar na parte de trás, e
reproduzir speech.wav norma vad reverso vad reverso
para cortar de ambas as extremidades. O uso do norma efeito é recomendado, mas lembre-se
que nem reverso nem norma é adequado para uso com áudio em fluxo.

opções:
Os valores padrão são mostrados entre parênteses.

-t Números (7).
O nível de medição usado para acionar a detecção de atividade. Isso pode precisar
a ser alterado dependendo do nível de ruído, nível de sinal e outros
características do áudio de entrada.

-T Números (0.25).
A constante de tempo (em segundos) usada para ajudar a ignorar rajadas curtas de som.

-s Números (1).
A quantidade de áudio (em segundos) para procurar rajadas mais silenciosas / curtas de
áudio a ser incluído antes do ponto de acionamento detectado.

-g Números (0.25).
Intervalo permitido (em segundos) entre bursts mais silenciosos / curtos de áudio para incluir
antes do ponto de disparo detectado.

-p Números (0).
A quantidade de áudio (em segundos) a ser preservada antes do ponto de acionamento e
quaisquer rajadas mais silenciosas / curtas encontradas.

Avançado opções:
Isso permite o ajuste fino dos parâmetros internos do algoritmo.

-b Números O algoritmo (internamente) usa estimativa / redução adaptativa de ruído para
para detectar o início do áudio desejado. Esta opção define a hora para o
estimativa inicial de ruído.

-N Números Constante de tempo usada pelo estimador de ruído adaptativo para quando o nível de ruído
está aumentando.

-n Números Constante de tempo usada pelo estimador de ruído adaptativo para quando o nível de ruído
está diminuindo.

-r Números Quantidade de redução de ruído a ser usada no algoritmo de detecção (por exemplo, 0, 0.5,
...).

-f Números Frequência de processamento / medições do algoritmo.

-m Números Duração da medição; por padrão, duas vezes o período de medição; ou seja, com
sobreposição.

-M Números Constante de tempo usada para suavizar as medições espectrais.

-h Números Freqüência de 'parede de tijolo' do filtro passa-alta aplicado na entrada do
algoritmo do detector.

-l Números Frequência de 'parede de tijolo' do filtro passa-baixa aplicado na entrada do
algoritmo do detector.

-H Números Freqüência de 'parede de tijolos' do elevador passa-alto usado no algoritmo do detector.

-L Números Freqüência de 'parede de tijolos' do elevador passa-baixo usado no algoritmo do detector.

Veja também o silêncio efeito.

vol de ganho [tipo [Limergain]]
Aplique uma amplificação ou atenuação ao sinal de áudio. Ao contrário do -v opção
(que é usado para equilibrar vários arquivos de entrada conforme eles entram nos efeitos SoX
cadeia de processamento), vol é um efeito como qualquer outro, então pode ser aplicado em qualquer lugar, e
várias vezes, se necessário, durante a cadeia de processamento.

A quantidade para alterar o volume é fornecida por de ganho que é interpretado, de acordo com
o dado tipo, da seguinte forma: se tipo is amplitude (ou é omitido), então de ganho é um
relação de amplitude (ou seja, tensão ou linear), se poder, então uma potência (ou seja, wattagem ou
razão de voltagem quadrada), e se dB, então uma mudança de potência em dB.

Quando tipo is amplitude or poder, um de ganho de 1 deixa o volume inalterado, menos que
1 diminui e maior que 1 aumenta; um negativo de ganho inverte o áudio
sinal, além de ajustar seu volume.

Quando tipo is dB, um de ganho de 0 deixa o volume inalterado, menos de 0 diminui,
e maior que 0 aumenta.

Veja [4] para uma discussão detalhada sobre tensão elétrica (e, portanto, sinal de áudio)
e relações de potência.

Cuidado com Clipping ao aumentar o volume.

O de ganho e tipo parâmetros podem ser concatenados se desejado, por exemplo vol 10dB.

Um opcional Limergain valor pode ser especificado e deve ser um valor muito menor que
1 (por exemplo, 0.05 ou 0.02) e é usado apenas em picos para evitar corte. Não
especificar este parâmetro fará com que nenhum limitador seja usado. No modo detalhado, este
efeito exibirá a porcentagem do áudio que precisava ser limitada.

Veja também de ganho para um efeito de mudança de volume com diferentes recursos, e comando
para um efeito de compressão / expansão / limitação de faixa dinâmica.

Obsoleto Efeito
Os seguintes efeitos foram renomeados ou têm sua funcionalidade incluída em outro
efeito; eles continuam a funcionar nesta versão do SoX, mas podem ser removidos no futuro.

conjugar [ -l|-r|-f|-b|-1|-2|-3|-4|n{,n}]
Reduza o número de canais de áudio mixando ou selecionando canais, ou aumente
o número de canais por canais duplicados. Nota: este efeito opera no
auditivo canais dentro da cadeia de processamento de efeitos SoX; não deve ser confundido
com o -m opção global (onde vários arquivos são misturados antes de entrar
a cadeia de efeitos).

Ao reduzir o número de canais, é possível usar o -l, -r, -f, -b, -1,
-2, -3, -4, opções para selecionar apenas os canais esquerdo, direito, frontal, traseiro ou
canal específico para a saída em vez de calcular a média dos canais. o -l e -r
opções farão a média em arquivos de quatro canais, então selecione o canal exato para
evitar isso.

O conjugar efeito também pode ser invocado com até 16 números, separados por vírgulas,
que especificam a proporção (0 = 0% e 1 = 100%) de cada canal de entrada que deve
ser mixado em cada canal de saída. No modo de dois canais, 4 números são dados: l →
l, l → r, r → l e r → r, respectivamente. No modo de quatro canais, os primeiros 4
os números fornecem as proporções para o canal de saída frontal esquerdo, como segue: lf →
lf, rf → lf, lb → lf e rb → rf. Os próximos 4 fornecem a saída frontal direita no
mesma ordem, depois lateral esquerdo e lateral direito.

Também é possível usar os 16 números para expandir ou reduzir a contagem de canais;
apenas especifique 0 para canais não utilizados.

Finalmente, certas combinações reduzidas de números podem ser especificadas para certos
combinações de canais de entrada / saída.

In Ch Ch Num Mapeamentos
2 1 2 eu → eu, r → eu
2 2 1 ajustar equilíbrio
4 1 4 se → eu, rf → eu, lb → eu, rb → eu
4 2 2 lf → l & rf → r, lb → l & rb → r
4 4 1 ajustar equilíbrio
4 4 2 equilíbrio frontal, equilíbrio traseiro

Este efeito foi substituído pelo Remix efeito que lida com qualquer número de
Canais.

DIAGNÓSTICO


O status de saída é 0 para nenhum erro, 1 se houver um problema com os parâmetros da linha de comando,
ou 2 se ocorrer um erro durante o processamento do arquivo.

Use o jogo online usando os serviços onworks.net



Programas online mais recentes para Linux e Windows