GoGPT Best VPN GoSearch

Icône de favori OnWorks

jouer - En ligne dans le Cloud

Exécutez le jeu dans le fournisseur d'hébergement gratuit OnWorks sur Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS

Il s'agit du jeu de commandes qui peut être exécuté dans le fournisseur d'hébergement gratuit OnWorks à l'aide de l'un de nos multiples postes de travail en ligne gratuits tels que Ubuntu Online, Fedora Online, l'émulateur en ligne Windows ou l'émulateur en ligne MAC OS.

PROGRAMME:

Nom


SoX - Sound eXchange, le couteau suisse de la manipulation audio

SYNOPSIS


Sox [options-globales] [options-format] fichier d'entrée1
[[options-format] fichier d'entrée2] ... [options-format] fichier de sortie
[effet [effets-options]] ...

jeux et sport [options-globales] [options-format] fichier d'entrée1
[[options-format] fichier d'entrée2] ... [options-format]
[effet [effets-options]] ...

rec [options-globales] [options-format] fichier de sortie
[effet [effets-options]] ...

DESCRIPTION


Introduction
SoX lit et écrit des fichiers audio dans les formats les plus courants et peut éventuellement appliquer des effets
pour eux. Il peut combiner plusieurs sources d'entrée, synthétiser l'audio et, sur de nombreux systèmes,
agir comme un lecteur audio à usage général ou un enregistreur audio multipiste. Il a également limité
possibilité de diviser l'entrée en plusieurs fichiers de sortie.

Toutes les fonctionnalités SoX sont disponibles en utilisant simplement le Sox commander. Pour simplifier le jeu et
enregistrement audio, si SoX est invoqué en tant que jeux et sport, le fichier de sortie est automatiquement défini comme le
périphérique audio par défaut, et s'il est invoqué en tant que rec, le périphérique audio par défaut est utilisé comme entrée
la source. De plus, le sexe(1) la commande fournit un moyen pratique de simplement interroger l'audio
informations d'en-tête de fichier.

Le cœur de SoX est une bibliothèque appelée libSoX. Ceux qui souhaitent étendre SoX ou utiliser
il dans d'autres programmes devrait se référer à la page de manuel de libSoX : libsox (3).

SoX est un outil de traitement audio en ligne de commande, particulièrement adapté pour faire des
modifications et au traitement par lots. Si vous avez besoin d'un éditeur audio graphique interactif, utilisez
audace (1).

* * *

La chaîne globale de traitement SoX peut être résumée comme suit :

Entrée(s) → Combineur → Effets → Sortie(s)

Notez cependant que sur la ligne de commande SoX, les positions des sorties et des effets
sont échangés par rapport au flux logique qui vient d'être montré. Notez également que tandis que les options concernant
aux fichiers sont placés avant leur nom de fichier respectif, l'inverse est vrai pour les effets.
Pour montrer comment cela fonctionne dans la pratique, voici une sélection d'exemples de la façon dont SoX pourrait être
utilisé. Le simple
sox récital.au récital.wav
traduit un fichier audio au format Sun AU en un fichier Microsoft WAV, tandis que
sox recital.au -b 16 canaux recital.wav 1 taux 16k fondu 3 norme
effectue la même traduction de format, mais applique également quatre effets (down-mix à un
canal, changement de fréquence d'échantillonnage, fondu d'entrée, nomaliser) et stocke le résultat à une profondeur de bits de
16.
sox -r 16k -e signé -b 8 -c 1 voice-memo.raw voice-memo.wav
convertit l'audio « brut » (alias « sans en-tête ») en un format de fichier auto-descriptif,
sox slow.aiff fixe.aiff vitesse 1.027
ajuste la vitesse audio,
sox short.wav long.wav long.wav
concatène deux fichiers audio, et
sox -m musique.mp3 voix.wav mixte.flac
mélange deux fichiers audio.
jouer "The Moonbeams/Greatest/*.ogg" basse +3
lit une collection de fichiers audio tout en appliquant un effet d'amplification des basses,
play -n -c1 synth sin %-12 sin %-9 sin %-5 sin %-2 fade h 0.1 1 0.1
joue un accord synthétisé de « La septième mineure » avec un son d'orgue à tuyaux,
rec -c 2 radio.aiff garniture 0 30:00
enregistre une demi-heure d'audio stéréo, et
play -q take1.aiff & rec -M take1.aiff take1-dub.aiff
(avec shell POSIX et lorsque pris en charge par le matériel) enregistre une nouvelle piste dans un multipiste
enregistrement. Finalement,
rec -r 44100 -b 16 -s -p silence 1 0.50 0.1% 1 10:00 0.1% | \
sox -p song.ogg silence 1 0.50 0.1% 1 2.0 0.1% : \
nouveaufichier : redémarrer
enregistre un flux audio tel que LP/cassette et se divise en plusieurs fichiers audio à
points avec 2 secondes de silence. De plus, il ne démarre pas l'enregistrement tant qu'il n'a pas détecté
l'audio est en cours de lecture et s'arrête après 10 minutes de silence.

NB Ce qui précède n'est qu'un aperçu des capacités de SoX ; des explications détaillées sur la façon de
utilisé tous Les paramètres SoX, les formats de fichiers et les effets se trouvent ci-dessous dans ce manuel, dans
format sox(7), et dans sexe (1).

Fichier Format Types
SoX peut fonctionner avec des fichiers audio « auto-descriptifs » et « bruts ». formats "auto-descriptifs"
(par exemple WAV, FLAC, MP3) ont un en-tête qui décrit complètement le signal et l'encodage
attributs des données audio qui suivent. Les formats « brut » ou « sans en-tête » ne contiennent pas
ces informations, donc les caractéristiques audio de celles-ci doivent être décrites sur le SoX
ligne de commande ou déduits de ceux du fichier d'entrée.

Les quatre caractéristiques suivantes sont utilisées pour décrire le format des données audio de telle sorte que
il peut être traité avec SoX :

taux d'échantillonnage
La fréquence d'échantillonnage en échantillons par seconde ('Hertz' ou 'Hz'). Téléphonie numérique
utilise traditionnellement un taux d'échantillonnage de 8000 Hz (8 kHz), bien que de nos jours, 16 et même
32 kHz sont de plus en plus courants. Les disques compacts audio utilisent 44100 44.1 Hz (XNUMX kHz).
La bande audio numérique et de nombreux systèmes informatiques utilisent 48 kHz. Systèmes audio professionnels
utilisent souvent 96 kHz.

taille de l'échantillon
Le nombre de bits utilisés pour stocker chaque échantillon. Aujourd'hui, le 16 bits est couramment utilisé.
Le 8 bits était populaire au début de l'audio informatique. 24 bits est utilisé dans le
arène audio professionnelle. D'autres tailles sont également utilisées.

encodage de données
La manière dont chaque échantillon audio est représenté (ou "encodé"). Quelques encodages
ont des variantes avec des ordres d'octets ou des ordres de bits différents. Certains compressent le
données audio de sorte que les données audio stockées prennent moins d'espace (c'est-à-dire de l'espace disque ou
bande passante de transmission) que les autres paramètres de format et le nombre d'échantillons
impliquerait. Les types de codage couramment utilisés incluent la virgule flottante, la loi μ, l'ADPCM,
entier signé PCM, MP3 et FLAC.

indirect
Le nombre de canaux audio contenus dans le fichier. Un (`mono') et deux
(`stéréo') sont largement utilisés. L'audio « Surround » contient généralement six ou plus
Les canaux.

Le terme « débit binaire » est une mesure de la quantité de stockage occupée par un fichier audio codé
signal sur une unité de temps. Cela peut dépendre de tout ce qui précède et est généralement désigné par
un nombre de kilo-bits par seconde (kbps). Un signal de téléphonie A-law a un débit binaire de 64
kbps. La musique stéréo encodée au format MP3 a généralement un débit binaire de 128 à 196 kbps. Encodé en FLAC
la musique stéréo a généralement un débit binaire de 550-760 kbps.

La plupart des formats auto-descriptifs permettent également d'incorporer des « commentaires » textuels dans le fichier qui
peut être utilisé pour décrire l'audio d'une certaine manière, par exemple pour la musique, le titre, l'auteur, etc.

Une utilisation importante des commentaires de fichiers audio est de transmettre des informations sur le « gain de relecture ». SoX
prend en charge l'application des informations Replay Gain, mais ne les génère pas. Notez que par défaut,
SoX copie les commentaires du fichier d'entrée dans les fichiers de sortie qui prennent en charge les commentaires, de sorte que les fichiers de sortie peuvent
contiennent des informations de Replay Gain si certaines étaient présentes dans le fichier d'entrée. Dans ce cas, si
autre chose qu'une simple conversion de format a été effectuée puis le fichier de sortie Replay
Les informations de gain sont susceptibles d'être incorrectes et doivent donc être recalculées à l'aide d'un outil qui
prend en charge cela (pas SoX).

Le manuel de formation sexe(1) peut être utilisée pour afficher des informations à partir des en-têtes de fichiers audio.

Détermination & Paramètres Le manuel de formation Fichier Format
Il existe plusieurs mécanismes disponibles pour SoX à utiliser pour déterminer ou définir le format
caractéristiques d'un fichier audio. Selon les circonstances, l'individu
les caractéristiques peuvent être déterminées ou fixées à l'aide de différents mécanismes.

Pour déterminer le format d'un fichier d'entrée, SoX utilisera, par ordre de priorité et comme
donné ou disponible :

1. Options de format de ligne de commande.

2. Le contenu de l'en-tête du fichier.

3. L'extension du nom de fichier.

Pour définir le format du fichier de sortie, SoX utilisera, par ordre de priorité et comme indiqué ou
disponible:

1. Options de format de ligne de commande.

2. L'extension du nom de fichier.

3. Les caractéristiques du format de fichier d'entrée, ou le plus proche pris en charge par la sortie
Type de fichier.

Pour tous les fichiers, SoX se fermera avec une erreur si le type de fichier ne peut pas être déterminé. Commander-
il peut être nécessaire d'ajouter ou de modifier des options de format de ligne pour résoudre le problème.

En jouant & enregistrement Audio
Le manuel de formation jeux et sport et rec commandes sont fournies pour que la lecture et l'enregistrement de base soient aussi simples que
jouer fichier-existant.wav
et
rec nouveau-fichier.wav
Ces deux commandes sont fonctionnellement équivalentes à
sox fichier-existant.wav -d
et
sox -d nouveau-fichier.wav
Bien sûr, d'autres options et effets (comme décrit ci-dessous) peuvent être ajoutés aux commandes
sous l'une ou l'autre forme.

* * *

Certains systèmes fournissent plus d'un type de pilote audio (compatible SoX), par exemple ALSA et OSS,
ou SUNAU & AO. Les systèmes peuvent également avoir plus d'un périphérique audio (alias « carte son »).
Si plusieurs pilotes audio ont été intégrés à SoX et que le pilote par défaut est sélectionné par SoX
lorsque l'enregistrement ou la lecture n'est pas celui qui est souhaité, alors le PILOTE AUDIO convivial
La variable peut être utilisée pour remplacer la valeur par défaut. Par exemple (sur de nombreux systèmes) :
définir AUDIODRIVER=oss
jouer ...
Le manuel de formation AUDIODEV La variable d'environnement peut être utilisée pour remplacer le périphérique audio par défaut, par exemple
définir AUDIODEV=/dev/dsp2
jouer ...
sox ... -t oss
or
définir AUDIODEV=hw:soundwave,1,2
jouer ...
sox ... -t aussi
Notez que la manière de définir les variables d'environnement varie d'un système à l'autre - pour certains
exemples spécifiques, voir `SOX_OPTS' ci-dessous.

Lors de la lecture d'un fichier avec une fréquence d'échantillonnage qui n'est pas prise en charge par le périphérique de sortie audio,
SoX invoquera automatiquement le taux effet pour effectuer le taux d'échantillonnage nécessaire
conversion. Pour la compatibilité avec l'ancien matériel, la valeur par défaut taux le niveau de qualité est défini sur
'faible'. Cela peut être modifié en spécifiant explicitement le taux effet avec un autre
niveau de qualité, par exemple
jouer ... noter -m
ou en utilisant le --play-rate-arg option (voir ci-dessous).

* * *

Sur certains systèmes, SoX permet de régler le volume de lecture audio tout en utilisant jeux et sport. Où
pris en charge, ceci est réalisé en appuyant sur les touches « v » et « V » pendant la lecture.

Pour aider à définir un niveau d'enregistrement approprié, SoX comprend un indicateur de niveau de crête qui peut
être invoqué (avant de procéder à l'enregistrement proprement dit) comme suit :
rec -n
Le niveau d'enregistrement doit être ajusté (en utilisant le programme de mixage fourni par le système, pas SoX)
pour que le compteur soit at (en fait, presque toutes) occasionnellement pleine échelle, et jamais « dans le rouge » (un
un point d'exclamation s'affiche). Voir également -S ci-dessous.

Précision
De nombreux formats de fichiers qui compressent l'audio rejettent certaines des informations du signal audio tout en
Ce faisant. La conversion vers un tel format puis la reconversion ne produira pas de
copie exacte de l'audio d'origine. C'est le cas de nombreux formats utilisés en téléphonie
(par exemple A-law, GSM) où une faible bande passante de signal est plus importante qu'une haute fidélité audio,
et pour de nombreux formats utilisés dans les lecteurs de musique portables (par exemple MP3, Vorbis) lorsqu'ils sont adéquats
la fidélité peut être conservée même avec les taux de compression élevés qui sont nécessaires pour faire
lecteurs portables pratiques.

Les formats qui rejettent les informations de signal audio sont appelés « avec perte ». Les formats qui ne sont pas
appelé « sans perte ». Le terme « qualité » est utilisé pour mesurer à quel point l'original
le signal audio peut être reproduit lors de l'utilisation d'un format avec perte.

La conversion de fichiers audio avec SoX est sans perte lorsqu'elle peut l'être, c'est-à-dire lorsqu'elle n'est pas utilisée avec perte
compression, lorsque vous ne réduisez pas la fréquence d'échantillonnage ou le nombre de canaux, et lorsque le
nombre de bits utilisés dans le format de destination n'est pas inférieur à celui du format source. Par exemple
la conversion d'un format PCM 8 bits vers un format PCM 16 bits est sans perte, mais la conversion à partir de
un format PCM 8 bits à (8 bits) A-law ne l'est pas.

NB SoX convertit tous les fichiers audio dans un format interne non compressé avant d'effectuer
tout traitement audio. Cela signifie que la manipulation d'un fichier stocké dans un format avec perte
peut entraîner d'autres pertes de fidélité audio. Par exemple avec
sox long.mp3 court.mp3 garniture 10
SoX décompresse d'abord le fichier MP3 d'entrée, puis applique le réduire effet, et enfin
crée le fichier MP3 de sortie en recompressant l'audio - avec une possible réduction de
fidélité supérieure à celle qui s'est produite lors de la création du fichier d'entrée. Par conséquent, si ce qui est
en fin de compte, l'audio compressé avec perte est souhaité, il est fortement recommandé d'effectuer toutes les
traitement audio à l'aide de formats de fichiers sans perte, puis conversion au format avec perte uniquement à
la dernière étape.

NB L'application de plusieurs effets avec une seule invocation SoX produira, en général,
des résultats plus précis que ceux produits à l'aide de plusieurs appels SoX.

Tramage
Le dithering est une technique utilisée pour maximiser la plage dynamique de l'audio stocké à un
profondeur de bits particulière. Toute distorsion introduite par la quantification est décorrélée en ajoutant
une petite quantité de bruit blanc au signal. Dans la plupart des cas, SoX peut déterminer si le
le traitement sélectionné nécessite un tramage et l'ajoutera lors du formatage de sortie si
approprié.

Plus précisément, par défaut, SoX ajoute automatiquement un tramage TPDF lorsque la profondeur de bits de sortie est
moins de 24 et l'une des affirmations suivantes est vraie :

· la réduction de la profondeur de bits a été spécifiée explicitement à l'aide d'une option de ligne de commande

· le format de fichier de sortie ne prend en charge que les profondeurs de bits inférieures à celle du fichier d'entrée
le format

· un effet a augmenté la profondeur de bits effective au sein de la chaîne de traitement interne

Par exemple, régler le volume avec vol 0.25 nécessite deux bits supplémentaires pour
stocker sans perte ses résultats (puisque 0.25 décimal équivaut à 0.01 binaire). Donc si l'entrée
la profondeur de bits du fichier est de 16, alors la représentation interne de SoX utilisera 18 bits après
traiter ce changement de volume. Afin de stocker la sortie à la même profondeur que le
entrée, le dithering est utilisé pour supprimer les bits supplémentaires.

Utilisez l'option -V option pour voir quel traitement SoX a automatiquement ajouté. Les -D l'option peut être
donné pour remplacer le dithering automatique. Pour invoquer le dithering manuellement (par exemple pour sélectionner un
courbe de mise en forme du bruit), voir la tergiversent effet.

Coupure
L'écrêtage est une distorsion qui se produit lorsqu'un niveau de signal audio (ou « volume ») dépasse le
gamme de la représentation choisie. Dans la plupart des cas, l'écrêtage n'est pas souhaitable et devrait donc
être corrigé en ajustant le niveau avant le point (dans la chaîne de traitement) auquel
ça arrive.

Dans SoX, un écrêtage peut se produire, comme vous pouvez vous y attendre, lors de l'utilisation du vol or Gain effets à
augmenter le volume sonore. L'écrêtage peut également se produire avec de nombreux autres effets, lorsque
conversion d'un format à un autre, et même lors de la simple lecture de l'audio.

La lecture d'un fichier audio implique souvent un rééchantillonnage, et le traitement par des composants analogiques peut
introduire un petit décalage CC et/ou une amplification, qui peuvent tous produire une distorsion si
le niveau du signal audio était initialement trop proche du point d'écrêtage.

Pour ces raisons, il est habituel de s'assurer que le niveau de signal d'un fichier audio a un certain
« espace libre », c'est-à-dire qu'il ne dépasse pas un niveau particulier en dessous du niveau maximum possible
pour la représentation donnée. Certains organismes de normalisation recommandent jusqu'à 9 dB de marge,
mais dans la plupart des cas, 3dB (≈ 70% linéaire) est suffisant. Notez que cette sagesse semble avoir été
perdu dans la production de musique moderne; en fait, de nombreux CD, MP3, etc. sont maintenant maîtrisés à des niveaux
au dessus de 0dBFS, c'est-à-dire que l'audio est écrêté tel qu'il est livré.

SoX état et stats les effets peuvent aider à déterminer le niveau du signal dans un fichier audio.
Le manuel de formation Gain or vol l'effet peut être utilisé pour empêcher l'écrêtage, par exemple
sox dull.wav bright.wav gain -6 aigu +6
garantit que l'amplification des aigus ne saturera pas.

Si un écrêtage se produit à tout moment pendant le traitement, SoX affichera un message d'avertissement pour
cet effet.

Voir aussi -G et la Gain et norme effets.

Entrée Fichier La combinaison
Le combineur d'entrée de SoX peut être configuré (voir OPTIONS ci-dessous) pour combiner plusieurs fichiers en utilisant
l'une des méthodes suivantes : "concaténer", "sequence", "mix", "mix-power", "merge" ou
« multiplier ». La méthode par défaut est « sequence » pour jeux et sport, et "concaténer" pour rec et Sox.

Pour toutes les méthodes autres que "séquence", plusieurs fichiers d'entrée doivent avoir le même échantillonnage
taux. Si nécessaire, des invocations SoX distinctes peuvent être utilisées pour effectuer des ajustements de taux d'échantillonnage
avant de combiner.

Si la méthode de combinaison « concaténer » est sélectionnée (généralement, ce sera par défaut) alors
les fichiers d'entrée doivent également avoir le même nombre de canaux. Le son de chaque entrée
seront concaténés dans l'ordre donné pour former le fichier de sortie.

La méthode de combinaison « séquence » est sélectionnée automatiquement pour jeux et sport. C'est similaire à
« concaténer » en ce que l'audio de chaque fichier d'entrée est envoyé en série vers le fichier de sortie.
Cependant, ici le fichier de sortie peut être fermé et rouvert à la transition correspondante
entre les fichiers d'entrée. Cela peut être juste ce qui est nécessaire lors de l'envoi de différents types d'audio
vers un périphérique de sortie, mais n'est généralement pas utile lorsque la sortie est un fichier normal.

Si la méthode de combinaison "mix" ou "mix-power" est sélectionnée, alors deux entrées ou plus
Les fichiers doivent être fournis et seront mélangés pour former le fichier de sortie. Le nombre de
les canaux de chaque fichier d'entrée n'ont pas besoin d'être les mêmes, mais SoX émettra un avertissement s'ils sont
non et certains canaux du fichier de sortie ne contiendront pas l'audio de chaque fichier d'entrée. UNE
Le fichier audio mixé ne peut pas être démixé sans référence aux fichiers d'entrée d'origine.

Si la méthode de combinaison « fusionner » est sélectionnée, alors deux fichiers d'entrée ou plus doivent être fournis et
seront fusionnés pour former le fichier de sortie. Le nombre de canaux dans chaque entrée
le fichier n'a pas besoin d'être le même. Un fichier audio fusionné comprend tous les canaux de tous les
les fichiers d'entrée. L'annulation de la fusion est possible en utilisant plusieurs appels de SoX avec le remix
effet. Par exemple, deux fichiers mono peuvent être fusionnés pour former un fichier stéréo. La première
et les seconds fichiers mono deviendraient les canaux gauche et droit du fichier stéréo.

La méthode de combinaison « multiplier » multiplie les valeurs d'échantillon des canaux correspondants
(traités comme des nombres dans l'intervalle -1 à +1). Si le nombre de canaux dans l'entrée
fichiers n'est pas le même, les canaux manquants sont considérés comme contenant tous des zéros.

Lors de la combinaison de fichiers d'entrée, SoX applique tous les effets spécifiés (y compris, par exemple, le
vol effet de réglage du volume) après que l'audio a été combiné. Cependant, il est souvent
utile pour pouvoir régler le volume (c'est-à-dire « balancer ») les entrées individuellement, avant
la combinaison a lieu.

Pour toutes les méthodes de combinaison, les réglages du volume du fichier d'entrée peuvent être effectués manuellement à l'aide de la -v
option (ci-dessous) qui peut être donnée pour un ou plusieurs fichiers d'entrée. S'il n'est donné que pour
certains des fichiers d'entrée, puis les autres ne reçoivent aucun réglage de volume. Dans certaines
circonstances, des ajustements de volume automatiques peuvent être appliqués (voir ci-dessous).

Le manuel de formation -V (ci-dessous) peut être utilisée pour afficher les ajustements de volume du fichier d'entrée qui ont été
sélectionné (soit manuellement, soit automatiquement).

Certaines considérations particulières doivent être prises en compte lors du mixage des fichiers d'entrée :

Contrairement aux autres méthodes, la combinaison `mix' a le potentiel de provoquer un écrêtage dans le
combiner si aucun équilibrage n'est effectué. Dans ce cas, si les réglages manuels du volume ne sont pas
donné, SoX essaiera de s'assurer que l'écrêtage ne se produit pas en ajustant automatiquement le
volume (amplitude) de chaque signal d'entrée par un facteur de /n, où n est le nombre d'entrées
des dossiers. Si cela se traduit par un son trop faible ou autrement déséquilibré, l'entrée
les volumes de fichiers peuvent être définis manuellement comme décrit ci-dessus. En utilisant le norme effet sur le mélange est
une autre alternative.

Si l'audio mixte semble assez fort à certains moments mais trop faible à d'autres, alors la plage dynamique
la compression doit être appliquée pour corriger cela - voir le compagne effet.

Avec la méthode de combinaison « mix-power », le volume mélangé est approximativement égal à celui de
l'un des signaux d'entrée. Ceci est réalisé en équilibrant en utilisant un facteur de /√n au lieu de
/n. Notez que ce facteur d'équilibrage ne garantit pas que l'écrêtage ne se produira pas, mais
le nombre de clips sera généralement faible et la distorsion résultante est généralement
imperceptible.

Sortie Documents officiels
Le comportement par défaut de SoX est de prendre un ou plusieurs fichiers d'entrée et de les écrire dans un seul
fichier de sortie.

Ce comportement peut être modifié en spécifiant le pseudo-effet 'newfile' dans les effets
liste. SoX entrera alors en mode de sortie multiple.

En mode de sortie multiple, un nouveau fichier est créé lorsque les effets avant le « nouveau fichier »
indiquer qu'ils sont terminés. La chaîne d'effets listée après `newfile' est alors lancée et
sa sortie est enregistrée dans le nouveau fichier.

En mode de sortie multiple, un numéro unique sera automatiquement ajouté à la fin de tous
noms de fichiers. Si le nom de fichier a une extension, le numéro est inséré avant le
extension. Ce comportement peut être personnalisé en plaçant un %n n'importe où dans le nom de fichier
où le numéro doit être remplacé. Un nombre facultatif peut être placé après le % à
indiquer une largeur minimale fixe pour le numéro.

Le mode sortie multiple n'est pas très utile à moins d'avoir un effet qui arrête la chaîne d'effets
early est spécifié avant le `newfile'. Si la fin du fichier est atteinte avant les effets
chaîne s'arrête alors aucun nouveau fichier ne sera créé car il serait vide.

Voici un exemple de division des 60 premières secondes d'un fichier d'entrée en deux 30
deuxièmes fichiers et en ignorant le reste.
sox song.wav ringtone%1n.wav trim 0 30 : nouveaufichier : trim 0 30

Arrêt Sox
Habituellement, SoX termine son traitement et se ferme automatiquement une fois qu'il a tout lu
données audio disponibles à partir des fichiers d'entrée.

Si vous le souhaitez, il peut être terminé plus tôt en envoyant un signal d'interruption au processus
(généralement en appuyant sur la touche d'interruption du clavier qui est normalement Ctrl-C). C'est un
exigence naturelle dans certaines circonstances, par exemple lors de l'utilisation de SoX pour faire un enregistrement. Noter
que lors de l'utilisation de SoX pour lire plusieurs fichiers, Ctrl-C se comporte légèrement différemment : en appuyant sur
une fois, SoX passe au fichier suivant ; appuyer deux fois de suite rapidement provoque
SoX pour sortir.

Une autre option pour arrêter le traitement plus tôt consiste à utiliser un effet qui a une période ou
nombre d'échantillons pour déterminer le point d'arrêt. L'effet trim en est un exemple. Une fois que
toutes les chaînes d'effets se sont arrêtées, alors SoX s'arrêtera également.

NOMS DE FICHIER


Les noms de fichiers peuvent être des noms de fichiers simples, des noms de chemins absolus ou relatifs, ou des URL (fichiers d'entrée
seul). Notez que la prise en charge des URL nécessite que wget(1) est disponible.

Remarque : donner à SoX un nom de fichier d'entrée ou de sortie qui est le même qu'un nom d'effet SoX
ne fonctionnera pas car SoX le traitera comme une spécification d'effet. La seule solution de contournement à ce
est d'éviter de tels noms de fichiers. Ce n'est généralement pas difficile car la plupart des noms de fichiers audio
ont une "extension" de nom de fichier, alors que les noms d'effet n'en ont pas.

Spécial Noms de fichiers
Les noms de fichiers spéciaux suivants peuvent être utilisés dans certaines circonstances à la place d'un
nom de fichier sur la ligne de commande :

- SoX peut être utilisé dans des opérations de pipeline simples en utilisant le nom de fichier spécial « - »
qui, s'il est utilisé comme nom de fichier d'entrée, entraînera SoX à lire les données audio à partir de
« entrée standard » (stdin), et qui, s'il est utilisé comme nom de fichier de sortie, provoquera SoX
enverra les données audio à la « sortie standard » (stdout). Notez que lorsque vous utilisez ce
option pour le fichier de sortie, et parfois lors de son utilisation pour un fichier d'entrée, le
type de fichier (voir -t ci-dessous) doit également être indiqué.

"|Programme [Options]..."
Cela peut être utilisé à la place d'un nom de fichier d'entrée pour spécifier le programme donné
sortie standard (stdout) être utilisé comme fichier d'entrée. contrairement à - (ci-dessus), cela peut être
utilisé pour plusieurs entrées à une commande SoX. Par exemple, si `genw' génère mono
signaux formatés WAV à sa sortie standard, puis la commande suivante effectue un
fichier stéréo à partir de deux signaux générés :
sox -M "|genw --imd -" "|genw --thd -" out.wav
Pour l'audio sans en-tête (brut), -t (et peut-être d'autres options de format) devront être
donné, précédant la commande d'entrée.

"nom de fichier générique"
Spécifie que le nom de fichier « globbing » (correspondance avec des caractères génériques) doit être effectué par SoX
au lieu de par la coquille. Cela permet d'appliquer un seul ensemble d'options de fichier à
un groupe de fichiers. Par exemple, si le répertoire courant contient trois `vox'
files, file1.vox, file2.vox et file3.vox, puis
jouer --rate 6k *.vox
sera étendu par le `shell' (dans la plupart des environnements) pour
jouer --rate 6k fichier1.vox fichier2.vox fichier3.vox
qui traitera uniquement le premier fichier vox comme ayant un taux d'échantillonnage de 6k. Avec
play --rate 6k "*.vox"
l'option de taux d'échantillonnage donnée sera appliquée aux trois fichiers vox.

-p, --sox-tuyau
Cela peut être utilisé à la place d'un nom de fichier de sortie pour spécifier que la commande SoX
doit être utilisé comme dans le canal d'entrée vers une autre commande SoX. Par exemple, la commande :
jouer "|sox -n -p synth 2" "|sox -n -p synth 2 trémolo 10" stat
lit successivement deux « fichiers », chacun avec des effets différents.

-p est en fait un alias pour `-t Sox -'.

-d, --appareil par défaut
Cela peut être utilisé à la place d'un nom de fichier d'entrée ou de sortie pour spécifier que le
le périphérique audio par défaut (s'il a été intégré à SoX) doit être utilisé. C'est apparenté
invoquer rec or jeux et sport (comme décrit ci-dessus).

-n, --nul
Cela peut être utilisé à la place d'un nom de fichier d'entrée ou de sortie pour spécifier qu'un `null
fichier' doit être utilisé. Notez qu'ici, « fichier nul » fait référence à un fichier spécifique à SoX
mécanisme et n'est lié à aucun mécanisme de système d'exploitation portant un nom similaire.

L'utilisation d'un fichier nul pour l'entrée audio équivaut à l'utilisation d'un fichier audio normal qui
contient une quantité infinie de silence, et en tant que tel n'est généralement pas utile à moins que
utilisé avec un effet qui spécifie une durée finie (comme réduire or synthé).

L'utilisation d'un fichier nul pour produire de l'audio revient à rejeter l'audio et est utile
principalement avec des effets qui produisent des informations sur l'audio au lieu d'affecter
il (comme bruitprof or état).

Le taux d'échantillonnage associé à un fichier nul est par défaut de 48 kHz, mais, comme avec un
fichier normal, cela peut être remplacé si vous le souhaitez en utilisant les options de format de ligne de commande
(voir ci-dessous).

Appareils Fichier & Audio Appareil Types
See format sox(7) pour une liste et une description des formats de fichiers pris en charge et du périphérique audio
conducteurs.

OPTIONS


Global Options
Ces options peuvent être spécifiées sur la ligne de commande à tout moment avant le premier effet
nom.

Le manuel de formation SOX_OPTS La variable d'environnement peut être utilisée pour fournir des valeurs par défaut alternatives pour
Les options globales de SoX. Par exemple:
SOX_OPTS="--buffer 20000 --play-rate-arg -hs --temp /mnt/temp"
Notez que la définition de SOX_OPTS peut potentiellement créer des changements indésirables dans le comportement de
scripts ou autres programmes qui invoquent SoX. SOX_OPTS pourrait être mieux utilisé pour des choses (comme
comme dans l'exemple donné) qui reflètent l'environnement dans lequel SoX est exécuté. Activation
des options telles que --pas de frappe par défaut pourrait être mieux géré en utilisant un alias shell puisque
un alias shell n'affectera pas le fonctionnement dans les scripts, etc.

Une façon de s'assurer qu'un script ne peut pas être affecté par SOX_OPTS est d'effacer SOX_OPTS au
début du script, mais cela perd bien sûr l'avantage de SOX_OPTS portant certains
options par défaut à l'échelle du système. Une approche alternative consiste à invoquer explicitement SoX avec
valeurs d'option par défaut, par exemple
SOX_OPTS="-V --no-clobber"
...
sox -V2 --clobber $entrée $sortie ...
Notez que la façon de définir les variables d'environnement varie d'un système à l'autre. Voilà quelque
exemples:

Unix bash :
export SOX_OPTS="-V --no-clobber"
Unix csh :
setenv SOX_OPTS "-V --no-clobber"
MS-DOS/MS-Windows :
définir SOX_OPTS=-V --no-clobber
GUI MS-Windows : via le Panneau de configuration : Système : Avancé : Variables d'environnement

Interface graphique Mac OS X : reportez-vous au document Q&R QA1067 d'Apple.

--amortir OCTETS, --tampon d'entrée OCTETS
Définissez la taille en octets des tampons utilisés pour le traitement audio (par défaut 8192).
--amortir s'applique au traitement des entrées, des effets et des sorties ; --tampon d'entrée s'applique
uniquement au traitement d'entrée (pour lequel il remplace --amortir si les deux sont donnés).

Sachez que les valeurs élevées pour --amortir rendra SoX plus lent à répondre
aux demandes de terminer ou d'ignorer le fichier d'entrée actuel.

--tabasser
Ne pas demander avant d'écraser un fichier existant avec le même nom que celui donné
pour le fichier de sortie. C'est le comportement par défaut.

--combiner enchaîner|fusionner|mélanger|mélange-puissance|multiplier|séquence
Sélectionnez la méthode de combinaison du fichier d'entrée ; pour certains d'entre eux, des options courtes sont
disponible: -m sélectionne « mélanger », -M sélectionne "fusionner", et -T sélectionne « multiplier ».

See Entrée Fichier La combinaison ci-dessus pour une description des différentes combinaisons
méthodes.

-D, --pas de tramage
Désactivez le tramage automatique - voir "Dithering" ci-dessus. Un exemple de pourquoi cela pourrait
peut parfois être utile si un fichier a été converti de 16 à 24 bits avec le
intention d'effectuer un traitement dessus, mais en fait aucun traitement n'est nécessaire après
tout et le fichier 16 bits d'origine a été perdu, alors, à proprement parler, pas de tramage
est nécessaire si vous reconvertissez le fichier en 16 bits. Voir aussi le stats effet pour comment
pour déterminer la profondeur de bits réelle de l'audio dans un fichier.

--fichier-effets NOM DE FICHIER
Utilisez FILENAME pour obtenir tous les effets et leurs arguments. Le fichier est analysé comme si
les valeurs ont été spécifiées sur la ligne de commande. Une nouvelle ligne peut être utilisée à la place de
le spécial : marqueur pour séparer les chaînes d'effets. Pour plus de commodité, de tels marqueurs à
la fin du fichier est normalement ignorée ; si vous voulez spécifier un dernier vide
chaîne d'effets, utilisez un : par lui-même sur la dernière ligne du fichier. Cette
L'option entraîne la suppression de tous les effets spécifiés sur la ligne de commande.

-G, --gardien
Invoquer automatiquement le Gain effet pour se prémunir contre l'écrêtage. Par exemple
sox -G infile -b 16 taux de sortie 44100 tramage -s
est un raccourci pour
sox infile -b 16 outfile gain -h rate 44100 gain -rh tramage -s
Voir aussi -V, --norme, et la Gain effet.

-h, --Aidez-moi
Afficher le numéro de version et les informations d'utilisation.

--help-effet Nom
Afficher les informations d'utilisation sur l'effet spécifié. Le nom tous peut être utilisé pour montrer
utilisation sur tous les effets.

--help-format Nom
Affiche des informations sur le format de fichier spécifié. Le nom tous peut être utilisé pour montrer
informations sur tous les formats.

--je, --Info
Uniquement s'il est donné comme premier paramètre à Sox, se comporter comme sexe (1).

-m|-M Équivalent à --combiner mélanger et --combiner fusionner, Respectivement.

--la magie
Si SoX a été construit avec la bibliothèque optionnelle `libmagic' alors cette option peut être
donné pour permettre son utilisation pour aider à détecter les types de fichiers audio.

--multi-thread | --à filetage unique
Par défaut, SoX est `à thread unique'. Si la --multi-thread l'option est donnée
Cependant, SoX traitera les canaux audio pour la plupart des effets multicanaux dans
parallèle sur les architectures hyper-threading/multi-core. Cela peut réduire le traitement
temps, même si parfois il peut être nécessaire d'utiliser cette option en conjonction avec un
taille de tampon plus grande que la valeur par défaut pour tirer parti du multithread
traitement (par exemple 131072 ; voir --amortir au dessus de).

--pas de frappe
Demander avant d'écraser un fichier existant portant le même nom que celui donné pour le
fichier de sortie.

NB L'écrasement involontaire d'un fichier est plus facile que vous ne le pensez, car
exemple, si vous entrez accidentellement
sox fichier1 fichier2 effet1 effet2 ...
quand ce que tu voulais vraiment dire était
jouer fichier1 fichier2 effet1 effet2 ...
alors, sans cette option, file2 sera écrasé. Par conséquent, l'utilisation de cette option est
conseillé. SOX_OPTS (ci-dessus), un alias "shell", un script ou un fichier batch peut être un
manière appropriée de l'activer de façon permanente.

--norme[=niveau dB]
Invoquer automatiquement le Gain effet pour se prémunir contre l'écrêtage et pour normaliser le
l'audio. Par exemple
sox --norm infile -b 16 taux de sortie 44100 dither -s
est un raccourci pour
sox infile -b 16 outfile gain -h rate 44100 gain -nh tramage -s
En option, l'audio peut être normalisé à un niveau donné (généralement) inférieur à 0 dBFS :
sox --norm=-3 fichier d'entrée fichier de sortie

Voir aussi -V, -G, et la Gain effet.

--play-rate-arg ARG
Sélectionne une option de qualité à utiliser lorsque l'effet « taux » est automatiquement invoqué
pendant la lecture audio. Cette option est généralement définie via le SOX_OPTS convivial
variable (voir ci-dessus).

--terrain gnuplot|octave|de rabais
S'il n'est pas défini sur de rabais (la valeur par défaut si --terrain n'est pas donné), s'exécute dans un mode qui peut être
utilisé, en conjonction avec le programme gnuplot ou le programme GNU Octave, pour aider
avec la sélection et la configuration de la plupart des fonctions de transfert basées
effets. Pour le premier effet donné qui prend en charge le programme de traçage sélectionné,
SoX produira des commandes pour tracer la fonction de transfert de l'effet, puis quittera
sans réellement traiter aucun son. Par exemple
sox --plot octave input-file -n highpass 1320 > highpass.plt
passe-haut d'octave.plt

-q, --no-show-progress
Exécutez en mode silencieux lorsque SoX ne le ferait pas autrement. C'est le contraire du
-S option.

-R Exécuter en mode "répétable". Lorsque cette option est donnée, le cas échéant, SoX
intégrer un horodatage fixe dans le fichier de sortie (par exemple AIFF) et "semera" le pseudo
générateurs de nombres aléatoires (par exemple tergiversent) avec un nombre fixe, garantissant ainsi que
les appels SoX successifs avec les mêmes entrées et les mêmes paramètres donnent le
même sortie.

--rejouer-gain suivre|album|de rabais
Sélectionnez s'il faut appliquer ou non le réglage du gain de relecture aux fichiers d'entrée. Le défaut
is de rabais pour Sox et rec, album pour jeux et sport où (au moins) les deux premiers fichiers d'entrée
sont étiquetés avec les mêmes noms d'artiste et d'album, et suivre pour jeux et sport autrement.

-S, --show-progression
Afficher les informations sur le format/en-tête du fichier d'entrée et la progression du traitement en entrée
fichier(s) pourcentage terminé, temps écoulé et temps restant (si connu ; affiché dans
crochets) et le nombre d'échantillons écrits dans le fichier de sortie. Est également montré un
un indicateur de niveau de crête et une indication si un écrêtage s'est produit. L'indicateur de niveau de crête
affiche jusqu'à deux canaux et est calibré pour l'audio numérique comme suit (à droite
chaîne affichée) :

dB DSE Écran dB DSE Écran
-25 - -11 ====
-23 = -9 ====-
-21 =- -7 =====
-19 == -5 =====-
-17 ==- -3 ======

-15 === -1 ===== !
-13 ===-

Une valeur de garde de crête de trois secondes en dB s'affichera à droite du
compteur si celui-ci est inférieur à 6dB.

Cette option est activée par défaut lors de l'utilisation de SoX pour lire ou enregistrer de l'audio.

-T Équivalent à --combiner multiplier.

--temp ANNUAIRE
Spécifiez que tous les fichiers temporaires doivent être créés dans le ANNUAIRE
peut être utile s'il y a des problèmes d'autorisation ou d'espace libre avec la valeur par défaut
emplacement. Dans ce cas, en utilisant `--temp .' (pour utiliser le répertoire courant) est souvent un
bonne solution.

--version
Affichez le numéro de version de SoX et quittez.

-V[niveau]
Définir la verbosité. Ceci est particulièrement utile pour voir comment les effets automatiques
ont été invoqués par SoX.

SoX affiche les messages sur la console (stderr) selon la verbosité suivante
les niveaux:

0 Aucun message n'est affiché ; utiliser l'état de sortie pour déterminer si une erreur
s'est produite.

1 Seuls les messages d'erreur sont affichés. Ceux-ci sont générés si SoX ne peut pas terminer
les commandes demandées.

2 Des messages d'avertissement sont également affichés. Ceux-ci sont générés si SoX peut terminer
les commandes demandées, mais pas exactement selon la commande demandée
paramètres, ou si un écrêtage se produit.

3 Les descriptions des phases de traitement de SoX sont également affichées. Utile pour voir
exactement comment SoX traite votre audio.

4 et ci-dessus
Des messages d'aide au débogage de SoX sont également affichés.

Par défaut, le niveau de verbosité est défini sur 2 (affiche les erreurs et les avertissements). Chaque
survenance de la -V L'option augmente le niveau de verbosité de 1. Alternativement, l'option
le niveau de verbosité peut être défini sur un nombre absolu en le spécifiant immédiatement après
le -V, par exemple -V0 le met à 0.

Entrée Fichier Options
Ces options s'appliquent uniquement aux fichiers d'entrée et peuvent précéder uniquement les noms de fichiers d'entrée sur le
ligne de commande.

--ignore-longueur
Remplacer une longueur audio (incorrecte) donnée dans l'en-tête d'un fichier audio. Si ce
est donnée, alors SoX continuera à lire l'audio jusqu'à ce qu'il atteigne la fin de la
fichier d'entrée.

-v, --le volume FACTEUR
Conçue pour être utilisée lors de la combinaison de plusieurs fichiers d'entrée, cette option ajuste le
volume du fichier qui le suit sur la ligne de commande par un facteur de FACTEUR
lui permet d'être "équilibré" par rapport aux autres fichiers d'entrée. C'est un linéaire
(amplitude), donc un nombre inférieur à 1 diminue le volume et un nombre
supérieur à 1 l'augmente. Si un nombre négatif est donné, en plus du
réglage du volume, le signal audio sera inversé.

Voir aussi norme, volet Gain effets, et voir Entrée Fichier Équilibrage au dessus.

Entrée & Sortie Fichier Format Options
Ces options s'appliquent au fichier d'entrée ou de sortie dont elles précèdent immédiatement le nom sur le
ligne de commande et sont principalement utilisés lorsque vous travaillez avec des formats de fichiers sans en-tête ou lorsque
en spécifiant un format pour le fichier de sortie différent de celui du fichier d'entrée.

-b BITS, --morceaux BITS
Le nombre de bits (c'est-à-dire la profondeur de bits ou parfois la longueur des mots) dans chaque encodé
échantillon. Ne s'applique pas aux encodages complexes tels que MP3 ou GSM. Pas nécessaire
avec des codages qui ont un nombre fixe de bits, par exemple A/μ-law, ADPCM.

Pour un fichier d'entrée, l'utilisation la plus courante de cette option est d'informer SoX du
nombre de bits par échantillon dans un fichier audio « brut » (« sans en-tête »). Par exemple
sox -r 16k -e signé -b 8 input.raw output.wav
convertit un fichier « brut » particulier en un fichier « WAV » auto-descriptif.

Pour un fichier de sortie, cette option peut être utilisée (peut-être avec -e) pour régler le
taille d'encodage de sortie. Par défaut (c'est-à-dire si cette option n'est pas donnée), la sortie
la taille de l'encodage (à condition qu'elle soit prise en charge par le type de fichier de sortie) sera définie sur
la taille d'encodage d'entrée. Par exemple
sox entrée.cdda -b 24 sortie.wav
convertit l'audio numérique brut du CD (16 bits, entier signé) en 24 bits (entier signé)
fichier 'WAV'.

-1/-2/-3/-4/-8
Le nombre d'octets dans chaque échantillon codé. Alias ​​obsolètes pour -b 8, -b 16, -b
24, -b 32, -b 64 respectivement.

-c CANAUX, --canaux CANAUX
Le nombre de canaux audio dans le fichier audio. Cela peut être n'importe quel nombre supérieur à
zéro.

Pour un fichier d'entrée, l'utilisation la plus courante de cette option est d'informer SoX du
nombre de canaux dans un fichier audio « brut » (« sans en-tête »). Parfois, il peut être
utile d'utiliser cette option avec un fichier `headered', afin de remplacer le
valeur (vraisemblablement incorrecte) dans l'en-tête - notez que cela n'est pris en charge qu'avec
certains types de fichiers. Exemples:
sox -r 48k -e float -b 32 -c 2 entrée.raw sortie.wav
convertit un fichier « brut » particulier en un fichier « WAV » auto-descriptif.
play -c 1 musique.wav
interprète les données du fichier comme appartenant à un seul canal indépendamment de ce qui est
indiqué dans l'en-tête du fichier. Notez que si le fichier a en fait deux
canaux, le fichier sera lu à demi-vitesse.

Pour un fichier de sortie, cette option fournit un raccourci pour spécifier que le
indirect effet doit être invoqué pour modifier (si nécessaire) le nombre de
canaux du signal audio au nombre indiqué. Par exemple, les deux suivants
les commandes sont équivalentes :
sox entrée.wav -c 1 sortie.wav bass -b 24
sox input.wav output.wav bass -b 24 canaux 1
bien que la deuxième forme soit plus flexible car elle permet d'ordonner les effets
arbitrairement.

-e CODAGE, --codage CODAGE
Le type d'encodage audio. Parfois nécessaire avec des types de fichiers qui prennent en charge plus de
un type de codage. Par exemple, avec raw, WAV ou AU (mais pas, par exemple, avec
MP3 ou FLAC). Les types d'encodage disponibles sont les suivants :

entier-signé
Données PCM stockées sous forme d'entiers signés ("complément à deux"). Couramment utilisé avec
une taille de codage de 16 ou 24 bits. Une valeur de 0 représente le signal minimum
Puissance.

entier non signé
Données PCM stockées sous forme d'entiers non signés. Couramment utilisé avec un encodage 8 bits
Taille. Une valeur de 0 représente la puissance maximale du signal.

point flottant
Données PCM stockées au format IEEE 753 simple précision (32 bits) ou double précision
(64 bits) nombres à virgule flottante (`réels'). Une valeur de 0 représente le minimum
puissance du signal.

une loi Norme téléphonique internationale pour le codage logarithmique à 8 bits par
échantillon. Il a une précision équivalente à environ 13 bits PCM et est
parfois encodé avec un ordre de bits inversé (voir le -X option).

u-loi, mu-loi
Norme de téléphonie nord-américaine pour le codage logarithmique à 8 bits par
échantillon. Aka -loi. Il a une précision équivalente à environ 14 bits PCM
et est parfois codé avec un ordre de bits inversé (voir le -X option).

oki-adpcm
OKI (alias VOX, Dialogic ou Intel) ADPCM 4 bits ; il a une précision
équivalent à environ 12 bits PCM. ADPCM est une forme de compression audio qui
a un bon compromis entre la qualité audio et la vitesse d'encodage/décodage.

ima-adpcm
IMA (alias DVI) ADPCM 4 bits ; il a une précision équivalente à environ
PCM 13 bits.

ms-adpcm
ADPCM 4 bits de Microsoft ; il a une précision équivalente à environ 14 bits PCM.

gsm-plein-taux
Le GSM est actuellement utilisé pour la grande majorité des réseaux sans fil numériques dans le monde
appels téléphoniques. Il utilise plusieurs formats audio avec des débits binaires différents
et la qualité de la parole associée. SoX prend en charge le 13kbps d'origine du GSM
Format audio 'Full Rate'. Il est généralement gourmand en CPU de travailler avec GSM
audio.

Les noms de codage peuvent être abrégés là où cela ne serait pas ambigu ; par exemple
`unsigned-integer' peut être donné comme `un', mais pas `u' (ambigu avec `u-law').

Pour un fichier d'entrée, l'utilisation la plus courante de cette option est d'informer SoX du
encodage d'un fichier audio `brut' (`headerless') (voir les exemples dans -b et -c
au dessus de).

Pour un fichier de sortie, cette option peut être utilisée (peut-être avec -b) pour régler le
type de codage de sortie Par exemple
sox input.cdda -e float sortie1.wav

sox input.cdda -b 64 -e float sortie2.wav
convertir l'audio numérique de CD brut (16 bits, entier signé) en fichiers « WAV » à virgule flottante
(respectivement simple et double précision).

Par défaut (c'est-à-dire si cette option n'est pas donnée), le type d'encodage de sortie sera
(à condition qu'il soit pris en charge par le type de fichier de sortie) être défini sur l'encodage d'entrée
type.

-s/-u/-f/-A/-U/-o/-i/-a/-g
Alias ​​obsolètes pour spécifier les types d'encodage entier-signé, non signé-
entier, point flottant, une loi, mu-loi, oki-adpcm, ima-adpcm, ms-adpcm, gsm-complet-
taux respectivement (voir -e au dessus de).

--no-glob
Spécifie que le nom de fichier « globbing » (correspondance avec des caractères génériques) ne doit pas être effectué par
SoX sur le nom de fichier suivant. Par exemple, si le répertoire courant contient le
deux fichiers "cinq-secondes.wav" et "cinq*.wav", puis
jouer --no-glob "cinq*.wav"
peut être utilisé pour lire uniquement le fichier unique « cinq*.wav ».

-r, --taux EN PLUSIEURS FOIS[k]
Donne la fréquence d'échantillonnage en Hz (ou kHz si ajouté avec 'k') du fichier.

Pour un fichier d'entrée, l'utilisation la plus courante de cette option est d'informer SoX du
fréquence d'échantillonnage d'un fichier audio « brut » (« sans en-tête ») (voir les exemples dans -b et -c
dessus). Occasionnellement, il peut être utile d'utiliser cette option avec un fichier "en-tête",
afin de remplacer la valeur (vraisemblablement incorrecte) dans l'en-tête - notez que
ceci n'est pris en charge qu'avec certains types de fichiers. Par exemple, si l'audio a été enregistré
avec un taux d'échantillonnage de disons 48k à partir d'une source qui a joué un peu, disons 1.5%,
trop lentement, alors
sox -r 48720 entrée.wav sortie.wav
corrige efficacement la vitesse en changeant uniquement l'en-tête du fichier (mais voir aussi le
vitesse effet pour la solution la plus habituelle à ce problème).

Pour un fichier de sortie, cette option fournit un raccourci pour spécifier que le taux
doit être invoqué pour modifier (si nécessaire) la fréquence d'échantillonnage du
signal audio à la valeur donnée. Par exemple, les deux commandes suivantes sont
équivalent:
entrée sox.wav -r 48k sortie.wav bass -b 24
sox input.wav output.wav bass -b 24 taux 48k
bien que la deuxième forme soit plus flexible car elle permet taux les options à donner, et
permet d'ordonner arbitrairement les effets.

-t, --taper TYPE DE FICHIER
Donne le type du fichier audio. Pour les fichiers d'entrée et de sortie, cette option est
couramment utilisé pour informer SoX du type d'un fichier audio « sans en-tête » (par exemple raw, mp3)
où le type réel/désiré ne peut pas être déterminé à partir d'une extension de nom de fichier donnée.
Par exemple :
autre-commande | sox -t mp3 - sortie.wav

sox entrée.wav -t sortie brute.bin
Il peut également être utilisé pour remplacer le type impliqué par une extension de nom de fichier d'entrée,
mais en cas de substitution avec un type qui a un en-tête, SoX se terminera avec un
message d'erreur si un tel en-tête n'est pas réellement présent.

See format sox(7) pour une liste des types de fichiers pris en charge.

-L, --endien peu
-B, --endien big
-x, --endien échange
Ces options spécifient si l'ordre des octets des données audio est, respectivement,
`little endian', 'big endian', ou l'inverse de celui du système sur lequel SoX
est en train d'être utilisé. L'endianité ne s'applique qu'aux données codées en virgule flottante ou en
entiers signés ou non signés de 16 bits ou plus. Il est souvent nécessaire de préciser
une de ces options pour les fichiers sans en-tête, et parfois nécessaire pour (sinon)
fichiers auto-descriptifs. Une option de réglage endian donnée peut être ignorée pour une entrée
fichier dont l'entête contient un identifiant d'endianness spécifique, ou pour un fichier de sortie
c'est en fait un périphérique audio.

NB Contrairement à d'autres caractéristiques de format, le caractère endian (octet, quartet et bit
classement) du fichier d'entrée n'est pas automatiquement utilisé pour le fichier de sortie ; donc pour
exemple, lorsque ce qui suit est exécuté sur un système petit-boutiste :
sox -B audio.s16 coupé.s16 coupé 2
trimmed.s16 sera créé en tant que petit-boutiste ;
sox -B audio.s16 -B coupé.s16 trim 2
doit être utilisé pour préserver le caractère gros-boutiste dans le fichier de sortie.

Le manuel de formation -V L'option peut être utilisée pour vérifier les commandes sélectionnées.

-N, --reverse-nibbles
Spécifie que l'ordre des quartets (c'est-à-dire les 2 moitiés d'un octet) des échantillons
devrait être inversé; parfois utile avec les formats basés sur ADPCM.

NB Voir aussi NB dans la section sur -x au dessus.

-X, --bits inversés
Spécifie que l'ordre des bits des échantillons doit être inversé ; parfois utile
avec quelques formats (principalement sans en-tête).

NB Voir aussi NB dans la section sur -x au dessus.

Sortie Fichier Format Options
Ces options s'appliquent uniquement au fichier de sortie et peuvent précéder uniquement le nom du fichier de sortie sur
la ligne de commande.

--ajouter un commentaire TEXTE
Ajoutez un commentaire dans l'en-tête du fichier de sortie (le cas échéant).

--commenter TEXTE
Spécifiez le texte du commentaire à stocker dans l'en-tête du fichier de sortie (le cas échéant).

SoX fournira un commentaire par défaut si cette option (ou --commentaire-fichier) n'est pas donné.
Pour spécifier qu'aucun commentaire ne doit être stocké dans le fichier de sortie, utilisez --commenter "" .

--commentaire-fichier NOM DE FICHIER
Spécifiez un fichier contenant le texte du commentaire à stocker dans l'en-tête du fichier de sortie
(le cas échéant).

-C, --compression FACTEUR
Le facteur de compression pour la compression variable des formats de fichiers de sortie. Si ce
option n'est pas donnée, un facteur de compression par défaut s'appliquera. La compression
facteur est interprété différemment pour différents formats de fichier de compression. Voir le
description des formats de fichiers qui utilisent cette option dans format sox(7) pour plus
</br>L’Information.

EFFETS


En plus de convertir, lire et enregistrer des fichiers audio, SoX peut être utilisé pour invoquer un
nombre d'« effets » audio. Plusieurs effets peuvent être appliqués en les spécifiant un après l'autre
un autre à la fin de la ligne de commande SoX, formant une "chaîne d'effets". Noter que
l'application de plusieurs effets en temps réel (c'est-à-dire lors de la lecture audio) nécessitera probablement un
ordinateur hautes performances. L'arrêt d'autres applications peut atténuer les problèmes de performances
devraient-ils se produire.

Certains des effets SoX sont principalement destinés à être appliqués à un seul instrument ou
'voix'. Pour faciliter cela, le remix effet et l'option SoX globale -M peut être utilisé pour
isoler puis recombiner les pistes d'un enregistrement multipiste.

Multiple Effets Chaînes
Une seule chaîne d'effets est composée d'un ou plusieurs effets. L'audio de l'entrée s'exécute
à travers la chaîne jusqu'à ce que la fin du fichier d'entrée soit atteinte ou un effet dans le
chaîne demande de terminer la chaîne.

SoX prend en charge l'exécution de plusieurs chaînes d'effets sur l'audio d'entrée. Dans ce cas, lorsqu'un
la chaîne indique que le traitement audio est terminé, les données audio sont ensuite envoyées via le prochain
chaîne d'effets. Cela continue jusqu'à ce qu'il n'y ait plus de chaînes d'effets ou que l'entrée ait
atteint la fin du fichier.

Une chaîne d'effets se termine en plaçant un : (deux points) après un effet. Tout suivant
les effets font partie d'une nouvelle chaîne d'effets.

Il est important de placer l'effet qui arrêtera la chaîne comme premier effet dans le
chaîne. C'est parce que tous les échantillons qui sont tamponnés par des effets à gauche du
l'effet de terminaison sera rejeté. La quantité d'échantillons rejetés est liée à la
--amortir option et il doit rester petit, par rapport à la fréquence d'échantillonnage, si le
l'effet de terminaison ne peut pas être le premier. De plus amples informations sur les effets d'arrêt peuvent être trouvées
dans le Arrêt Sox .

Il existe quelques pseudo-effets qui facilitent l'utilisation de plusieurs chaînes d'effets. Ceux-ci inclus
nouveau fichier qui commencera à écrire dans un nouveau fichier de sortie avant de passer aux effets suivants
chaîne et recommencer qui reviendra à la première chaîne d'effets. Les pseudo-effets doivent être
spécifiés comme le premier effet d'une chaîne et comme le seul effet d'une chaîne (ils doivent avoir
a : avant et après leur spécification).

Ce qui suit est un exemple de chaînes d'effets multiples. Il divisera le fichier d'entrée en
plusieurs fichiers de 30 secondes. Chaque nom de fichier de sortie aura un numéro unique dans
son nom tel que documenté dans le Sortie Documents officiels .
sox infile.wav output.wav trim 0 30 : newfile : redémarrer

Commun Notation Et Paramètres
Dans les descriptions qui suivent, les crochets [ ] sont utilisés pour désigner les paramètres qui sont
facultatif, les accolades { } pour désigner celles qui sont à la fois facultatives et répétables, et l'angle
crochets < > pour désigner ceux qui sont répétables mais non facultatifs. Le cas échéant,
les valeurs par défaut des paramètres facultatifs sont indiquées entre parenthèses ( ).

Les paramètres suivants sont utilisés avec et ont la même signification pour plusieurs effets :

centre[k]
See fréquence.

fréquence[k]
Une fréquence en Hz, ou, si ajouté avec « k », en kHz.

Gain Un gain de puissance en dB. Zéro ne donne aucun gain ; inférieur à zéro donne une atténuation.

largeur[h|k|o|q]
Utilisé pour spécifier la bande passante d'un filtre. Un certain nombre de méthodes différentes pour
spécifier la largeur sont disponibles (mais pas tous pour chaque effet). Un de
les caractères affichés peuvent être ajoutés pour sélectionner la méthode souhaitée comme suit :

Méthode Remarques
h Hz
k kHz
o Octaves
q Facteur Q Voir [2]

Pour chaque effet qui utilise ce paramètre, la méthode par défaut (c'est-à-dire si aucun caractère
est ajouté) est celui qu'il a répertorié en premier dans la première ligne de l'effet
la description.

Pour voir si SoX prend en charge un effet facultatif, entrez Sox -h et cherchez son nom sous
la liste : 'EFFETS'.

Appareils Effets
Remarque : une liste catégorisée des effets se trouve dans le fichier `README' d'accompagnement.

tous passent fréquence[k] largeur[h|k|o|q]
Appliquer un filtre passe-tout bipolaire avec fréquence centrale (en Hz) fréquenceet
filtre-largeur largeur. Un filtre passe-tout change la fréquence de l'audio en phase
relation sans changer sa relation fréquence-amplitude. Le filtre
est décrit en détail dans [1].

Cet effet soutient la --terrain option globale.

bande [-n] centre[k] [largeur[h|k|o|q]]
Appliquez un filtre passe-bande. La réponse en fréquence chute de manière logarithmique autour de la
centre la fréquence. Les largeur paramètre donne la pente de la goutte. Les
fréquences à centre + largeur et centre - largeur seront la moitié de leur original
amplitudes. bande par défaut à un mode orienté vers l'audio aigu, c'est-à-dire la voix,
chant ou musique instrumentale. Les -n (pour le bruit) l'option utilise le mode alternatif
pour l'audio sans hauteur (par exemple, percussions). Mise en garde: -n introduit un gain de puissance de
environ 11dB dans le filtre, donc méfiez-vous de l'écrêtage de sortie. bande introduit du bruit dans
la forme du filtre, c'est-à-dire culminant au centre fréquence et s'installer
le

Cet effet soutient la --terrain option globale.

Voir aussi sincère pour un filtre passe-bande avec des épaules plus raides.

passe-bande|rejet de bande [-c] fréquence[k] largeur[h|k|o|q]
Appliquer un filtre passe-bande ou de rejet de bande Butterworth bipolaire avec fréquence centrale
fréquence, et (3dB-point) bande passante largeurL’ -c l'option ne s'applique qu'à
passe-bande et sélectionne un gain de jupe constant (gain de crête = Q) au lieu de la valeur par défaut :
gain de crête constant de 0 dB. Les filtres roulent à 6dB par octave (20dB par décennie)
et sont décrits en détail dans [1].

Ces effets soutiennent la --terrain option globale.

Voir aussi sincère pour un filtre passe-bande avec des épaules plus raides.

rejet de bande fréquence[k] largeur[h|k|o|q]
Appliquez un filtre de rejet de bande. Voir la description du passe-bande effet pour
détails.

basse|aigus Gain [fréquence[k] [largeur[s|h|k|o|q]]]
Augmentez ou coupez les fréquences graves (inférieures) ou aiguës (supérieures) de l'audio à l'aide d'un
filtre en plateau bipolaire avec une réponse similaire à celle d'une chaîne hi-fi standard
commandes de tonalité. Ceci est également connu sous le nom d'égalisation en plateau (EQ).

Gain donne le gain à 0 Hz (pour basse), ou la valeur la plus basse de ∼22 kHz et
la fréquence de Nyquist (pour aigus). Sa plage utile est d'environ -20 (pour un grand
cut) à +20 (pour un gros boost). Faîtes attention à Coupure lors de l'utilisation d'un positif Gain.

Si vous le souhaitez, le filtre peut être affiné à l'aide des paramètres facultatifs suivants :

fréquence définit la fréquence centrale du filtre et peut donc être utilisé pour étendre ou
réduire la plage de fréquences à amplifier ou à atténuer. La valeur par défaut est 100 Hz (pour
basse) ou 3 kHz (pour aigus).

largeur détermine la pente de la transition de plateau du filtre. En plus de
méthodes communes de spécification de largeur décrites ci-dessus, « pente » (la valeur par défaut, ou si
ajouté avec `s') peut être utilisé. La plage utile de "pente" est d'environ 0.3, pour un
pente douce, à 1 (le maximum), pour une pente raide ; la valeur par défaut est 0.5.

Les filtres sont décrits en détail dans [1].

Ces effets soutiennent la --terrain option globale.

Voir aussi but égalisateur pour un effet d'égalisation de pointe.

plier [-f débit d'images(25)] [-o suréchantillon(16)] { retarder,cents,durée }
Modifie la hauteur par des quantités spécifiées à des moments spécifiés. Chaque triple donné :
retarder,cents,durée spécifie un coude. retarder est le laps de temps après la
début du flux audio, ou la fin du virage précédent, auquel commencer
fléchir le ton; cents est le nombre de cents (100 cents = 1 demi-ton) par lequel
de fléchir le ton, et durée la durée pendant laquelle le pas sera
sont.

L'algorithme de pitch-bending utilise la transformée de Fourier discrète (DFT) à un
fréquence d'images particulière et taux de suréchantillonnage. Les -f et -o les paramètres peuvent être utilisés
pour ajuster ces paramètres et ainsi contrôler la douceur des changements de hauteur.

Par exemple, une tonalité initiale est générée, puis pliée trois fois, donnant quatre
différentes notes au total :
jouer -n synthé 2.5 sin 667 gain 1 \
bend .35,180,.25 .15,740,.53 0,-520,.3
Notez que l'écrêtage produit dans cet exemple est délibéré ; retirer
il, utiliser Gain -5 au lieu de Gain 1.

Voir aussi pas.

biquade b0 b1 b2 a0 a1 a2
Appliquer un filtre IIR biquad avec les coefficients donnés. Où b* et a* sont les
coefficients du numérateur et du dénominateur respectivement.

See http://en.wikipedia.org/wiki/Digital_biquad_filter (où a0 = 1).

Cet effet soutient la --terrain option globale.

indirect CANAUX
Invoquer un algorithme simple pour changer le nombre de canaux dans le signal audio en
le nombre donné CANAUX: mixage si diminution du nombre de canaux ou
duplication en cas d'augmentation du nombre de canaux.

Le manuel de formation indirect l'effet est invoqué automatiquement si SoX -c option spécifie un nombre
de canaux différent de celui du ou des fichiers d'entrée. Alternativement, si ce
l'effet est donné explicitement, alors les SoX -c l'option n'a pas besoin d'être donnée. Par exemple,
les deux commandes suivantes sont équivalentes :
sox entrée.wav -c 1 sortie.wav bass -b 24
sox input.wav output.wav bass -b 24 canaux 1
bien que la deuxième forme soit plus flexible car elle permet d'ordonner les effets
arbitrairement.

Voir aussi remix pour un effet qui permet aux canaux d'être mélangés/sélectionnés arbitrairement.

chœur gagner en gagner <retarder décadence vitesse profondeur -s|-t>
Ajoutez un effet de chœur à l'audio. Cela peut produire un seul son vocal comme un
chœur, mais peut aussi s'appliquer à l'instrumentation.

Le chorus ressemble à un effet d'écho avec un délai court, mais alors qu'avec l'écho le délai
est constant, avec chorus, il est varié en utilisant une modulation sinusoïdale ou triangulaire.
La profondeur de modulation définit la plage dans laquelle le retard modulé est joué avant ou
après le délai. Par conséquent, le son retardé sonnera plus lentement ou plus rapidement, c'est le
son retardé accordé autour de l'original, comme dans un refrain où certaines voix sont
légèrement décalé. Voir [3] pour plus de détails sur l'effet chorus.

Chaque paramètre à quatre tuples délai/décroissance/vitesse/profondeur donne le délai en millisecondes
et la décroissance (par rapport au gain) avec une vitesse de modulation en Hz utilisant la profondeur en
millisecondes. La modulation est soit sinusoïdale (-s) ou triangulaire (-t). Gagner-
out est le volume de la sortie.

Un délai typique est d'environ 40 ms à 60 ms ; la vitesse de modulation est meilleure près de 0.25 Hz
et la profondeur de modulation d'environ 2 ms. Par exemple, un seul délai :
jouer de la guitare1.wav chorus 0.7 0.9 55 0.4 0.25 2 -t
Deux delays des samples originaux :
jouer guitar1.wav chorus 0.6 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 1.3 -s
Un chorus au son plus riche (avec trois retards supplémentaires) :
jouer guitar1.wav chorus 0.5 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 2.3 -t 40 0.3 0.3 1.3 -s

compagne attaque1,pourriture1{,attaque2,pourriture2}
[soft-knee-dB:]en-dB1[,sortie-dB1]{,en-dB2,sortie-dB2}
[Gain [volume-initial-dB [retarder]]]

Compand (compresser ou étendre) la plage dynamique de l'audio.

Le manuel de formation attaque et décadence paramètres (en secondes) déterminent le temps pendant lequel le
le niveau instantané du signal d'entrée est moyenné pour déterminer son volume ;
les attaques font référence à des augmentations de volume et les déclins font référence à des diminutions. Pour la plupart
situations, le temps d'attaque (réponse à la musique devenant plus forte) doit être
plus court que le temps de décroissance car l'oreille humaine est plus sensible aux bruits soudains
la musique que la musique douce soudaine. Où plus d'une paire de paramètres d'attaque/décroissance
sont spécifiés, chaque canal d'entrée est compressé séparément et le nombre de paires
doit être en accord avec le nombre de canaux d'entrée. Les valeurs typiques sont 0.3,0.8 secondes.

Le deuxième paramètre est une liste de points sur la fonction de transfert du compander
spécifié en dB par rapport à l'amplitude maximale possible du signal. L'entrée
les valeurs doivent être dans un ordre strictement croissant mais la fonction de transfert ne
doivent augmenter de façon monotone. En cas d'omission, la valeur de sortie-dB1 par défaut
même valeur que en-dB1; niveaux inférieurs en-dB1 ne sont pas compressés (mais peuvent avoir un gain
leur est appliqué). Le point 0,0 est supposé mais peut être outrepassé (par 0,hors-dBn).
Si la liste est précédée d'un soft-knee-dB valeur, puis les points adjacents
les segments de droite de la fonction de transfert sont arrondis par le montant indiqué.
Les valeurs typiques de la fonction de transfert sont 6:-70,-60,-20.

Le troisième paramètre (facultatif) est un gain supplémentaire en dB à appliquer du tout
points sur la fonction de transfert et permet un réglage facile du gain global.

Le quatrième paramètre (facultatif) est un niveau initial à assumer pour chaque canal
lorsque la compression-extension commence. Cela permet à l'utilisateur de fournir un niveau nominal initialement,
de sorte que, par exemple, un gain très important n'est pas appliqué aux niveaux de signal initiaux
avant que l'action de compression n'ait commencé à opérer : il est fort probable qu'en
un tel événement, la sortie serait sévèrement écrêtée tandis que le gain de compression-extension
s'ajuste correctement. Une valeur typique (pour l'audio qui est initialement calme) est
- 90 dB.

Le cinquième paramètre (facultatif) est un délai en secondes. Le signal d'entrée est analysé
immédiatement pour contrôler le compresseur, mais il est retardé avant d'être alimenté au
régleur de volume. Spécification d'un délai approximativement égal aux temps d'attaque/de chute
permet au compandeur d'opérer efficacement de manière « prédictive » plutôt que d'une manière
mode réactif. Une valeur typique est 0.2 secondes.

* * *

L'exemple suivant peut être utilisé pour créer un morceau de musique à la fois calme et
passages forts adaptés à l'écoute dans un environnement bruyant tel qu'un
véhicule:
sox asz.wav asz-car.wav compand 0.3,1 6:-70,-60,-20 -5 -90 0.2
La fonction de transfert (`6:-70,...') indique que les sons très faibles (inférieurs à -70dB)
restent inchangés. Cela empêchera le compander d'augmenter le volume sur
passages « silencieux » comme entre les mouvements. Cependant, les sons compris entre -60 dB et
0 dB (volume maximum) sera amplifié de sorte que la plage dynamique de 60 dB de l'original
la musique sera compressée 3 à 1 dans une plage de 20 dB, ce qui est suffisamment large pour en profiter
la musique mais assez étroit pour contourner le bruit de la route. Le « 6 : » sélectionne 6 dB
compression douce des genoux. Le gain de sortie de -5 (dB) est nécessaire pour éviter l'écrêtage (le
nombre est inexact et a été dérivé par expérimentation). Les -90 (dB) pour le
le volume initial fonctionnera bien pour un clip qui commence par un quasi silence, et le
un délai de 0.2 (secondes) a pour effet de faire réagir un peu plus le compander
rapidement à des changements de volume soudains.

Dans l'exemple suivant, compand est utilisé comme porte de bruit lorsque le bruit est à
un niveau inférieur au signal :
jouer dans le fichier compand .1,.2 -inf,-50.1,-inf,-50,-50 0 -90 .1
Voici un autre noise gate, cette fois pour quand le bruit est à un niveau plus élevé que
le signal (le rendant, à certains égards, similaire au squelch) :
jouer dans le fichier compand .1,.1 -45.1,-45,-inf,0,-inf 45 -90 .1
Cet effet soutient la --terrain option globale (pour la fonction de transfert).

Voir aussi mcompand pour un effet de compression multibande.

contraste [montant-amélioration(75)]
Comparable à la compression, cet effet modifie un signal audio pour le faire sonner
Plus fort. montant-amélioration contrôle le montant de l'amélioration et est un nombre
dans la plage 0-100. Noter que montant-amélioration = 0 donne encore une valeur significative
amélioration du contraste.

Voir aussi compagne et mcompand effets.

décalage décalé décalage [gain limiteur]
Appliquez un décalage DC à l'audio. Cela peut être utile pour supprimer un décalage DC (causé
peut-être par un problème matériel dans la chaîne d'enregistrement) de l'audio. L'effet
d'un décalage DC est une hauteur libre et donc un volume réduits. Les état or stats effet peut
être utilisé pour déterminer si un signal a un décalage CC.

Le donné décalage décalé valeur est un nombre à virgule flottante dans la plage de ±2 qui
indique la quantité de décalage de l'audio (qui est dans la plage de ±1).

En option, gain limiteur peut également être spécifié. Il devrait avoir une valeur beaucoup moins
supérieur à 1 (par exemple 0.05 ou 0.02) et n'est utilisé que sur les pics pour éviter l'écrêtage.

* * *

Une approche alternative pour supprimer un décalage CC (bien qu'avec un court délai) consiste à
utiliser le passe-haut effet de filtre à une fréquence de 10 Hz, comme illustré dans le
exemple suivant :
sox -n dc.wav synthé 5 sin %0 50
sox dc.wav fixed.wav passe-haut 10

profond Appliquez la désaccentuation des disques compacts (IEC 60908) (un filtre en plateau d'atténuation des aigus).

L'accent a été mis sur le mastering de certains CD publiés au début des années 1980.
Ceux-ci comprenaient de nombreux albums de musique classique, ainsi que des numéros maintenant recherchés de
albums des Beatles, Pink Floyd et autres. La préaccentuation doit être supprimée à
temps de lecture par un filtre de désaccentuation dans l'appareil de lecture. Cependant, pas tous
les lecteurs de CD modernes ont ce filtre, et très peu de lecteurs de CD PC l'ont ; jouer avant
un son accentué sans le filtre de désaccentuation correct donne un son qui
sonne dur et est loin de ce que ses créateurs voulaient.

Avec la collection profond effet, il est possible d'appliquer la désaccentuation nécessaire à l'audio
qui a été extrait d'un CD pré-accentué, puis soit graver le
audio accentué sur un nouveau CD (qui sera ensuite lu correctement sur n'importe quel lecteur de CD), ou
il suffit de lire les fichiers audio correctement non accentués sur le PC. Par exemple:
sox track1.wav track1-deemph.wav profondeur
puis graver track1-deemph.wav sur CD, ou
lire la piste1-deemph.wav
ou simplement
jouer track1.wav deeph
Le filtre de désaccentuation est implémenté comme un biquad ; son écart maximal par rapport au
la réponse idéale n'est que de 0.06 dB (jusqu'à 20 kHz).

Cet effet soutient la --terrain option globale.

Voir aussi basse et aigus effets d'égalisation de plateau.

retarder {longueur}
Retardez un ou plusieurs canaux audio. longueur peut spécifier une heure ou, si ajouté avec
un `s', un certain nombre d'échantillons. Ne spécifiez pas à la fois les délais et les délais d'échantillonnage dans le
même commande. Par exemple, retarder 1.5 0 0.5 retarde le premier canal de 1.5
secondes, le troisième canal de 0.5 seconde, et quitte le deuxième canal (et tout
autres canaux qui peuvent être présents) sans retard. La commande suivante (une longue)
joue un carillon :
jouer -n synthé -j 3 sin %3 sin %-2 sin %-5 sin %-9 \
sin %-14 sin %-21 fondu h .01 2 1.5 retard \
1.3 1 .76 .54 .27 remix - fondu h 0 2.7 2.5 norme -1
et cela joue un accord de guitare :
jouer -n synthé pl G2 pl B2 pl D3 pl G3 pl D4 pl G4 \
délai 0 .05 .1 .15 .2 .25 remix - fade 0 4 .1 norme -1

tergiversent [-S|-s|-f une fonction filtre] [-a] [-p précision]
Appliquez le dithering à l'audio. Le tramage ajoute délibérément une petite quantité de bruit
au signal afin de masquer les effets de quantification audibles qui peuvent se produire si le
la taille de l'échantillon de sortie est inférieure à 24 bits. Sans options, cet effet ajoutera
bruit blanc triangulaire (TPDF). La mise en forme du bruit (uniquement pour certaines fréquences d'échantillonnage) peut
être sélectionné avec -s. Avec le -f option, il est possible de sélectionner un
filtre de mise en forme du bruit de la liste suivante : lipshitz, f-weighted, modifié-e-
pondéré, amélioré-e-pondéré, gesemann, shibata, low-shibata, high-shibata. Noter
que la plupart des types de filtres ne sont disponibles qu'avec une fréquence d'échantillonnage de 44100 XNUMX Hz. Le filtre
types se distinguent par les propriétés suivantes : audibilité du bruit, niveau de
(inaudible, mais dans certaines circonstances, autrement problématique) haute fréquence de forme
bruit et vitesse de traitement.
See http://sox.sourceforge.net/SoX/NoiseShaping pour les graphiques des différents bruits-
façonner les courbes.

Le manuel de formation -S L'option sélectionne un TPDF légèrement « incliné », biaisé vers des fréquences plus élevées.
Il peut être utilisé à n'importe quel taux d'échantillonnage, mais en dessous de ≈22k, le TPDF simple est probablement meilleur,
et au-dessus de ≈ 37k, la forme du bruit est probablement meilleure.

Le manuel de formation -a L'option active un mode où le tramage (et la mise en forme du bruit le cas échéant) sont
activé automatiquement uniquement en cas de besoin. L'utilisation la plus probable pour cela est lorsque
appliquer un fondu d'entrée ou de sortie à un fichier déjà tramé, de sorte que le
s'applique uniquement aux parties estompées. Cependant, le tramage automatique n'est pas infaillible, donc
les fondus doivent être soigneusement vérifiés pour toute modulation de bruit ; si cela se produit,
puis soit re-dither le fichier entier, soit utiliser réduire, fondu, et concaténer.

Le manuel de formation -p L'option permet de remplacer la précision de la cible.

Si l'option globale SoX -R option n'est pas donnée, alors le nombre pseudo-aléatoire
générateur utilisé pour générer le bruit blanc sera « réensemencé », c'est-à-dire que le
le bruit sera différent entre les invocations.

Cet effet ne doit être suivi d'aucun autre effet affectant l'audio.

Voir aussi la section "Dithering" ci-dessus.

sous-échantillonner [facteur(2)]
Sous-échantillonner le signal par un facteur entier : uniquement le premier de chaque facteur
échantillons est conservé, les autres sont rejetés.

Aucun filtre de décimation n'est appliqué. Si l'entrée n'est pas une bande correctement limitée
signal en bande de base, un repliement se produira. Cela peut être souhaitable, par exemple, pour la fréquence
Traduction.

Pour un effet de rééchantillonnage général avec anti-aliasing, voir taux. Voir également suréchantillonner.

cérumen Facilite l'écoute de l'audio au casque. Ajoute des "repères" à la stéréo 44.1 kHz (c'est-à-dire
format CD audio) audio de sorte que, lors de l'écoute au casque, l'image stéréo soit
déplacé de l'intérieur de votre tête (standard pour les écouteurs) vers l'extérieur et devant
l'auditeur (standard pour les haut-parleurs).

echo gagner en gagner <retarder décadence>
Ajoutez un écho à l'audio. Les échos sont des sons réfléchis et peuvent se produire naturellement
parmi les montagnes (et parfois de grands bâtiments) en parlant ou en criant ; numérique
les effets d'écho émulent ce comportement et sont souvent utilisés pour aider à remplir le son
d'un seul instrument ou vocal. La différence de temps entre le signal d'origine
et la réflexion est le « retard » (temps), et l'intensité du signal réfléchi
est la "pourriture". Les échos multiples peuvent avoir des retards et des décroissances différents.

Chaque donné retarder décadence paire donne le retard en millisecondes et la décroissance (relative
pour gagner) de cet écho. Le gain de sortie est le volume de la sortie. Par exemple : ce
fera sonner comme s'il y avait deux fois plus d'instruments qu'il n'y en a en réalité
en jouant:
jouer lead.aiff echo 0.8 0.88 60 0.4
Si le délai est très court, cela ressemble à un robot (métallique) jouant de la musique :
jouer lead.aiff echo 0.8 0.88 6 0.4
Un delay plus long sonnera comme un concert en plein air dans les montagnes :
jouer lead.aiff echo 0.8 0.9 1000 0.3
Une montagne de plus, et :
jouer lead.aiff echo 0.8 0.9 1000 0.3 1800 0.25

échos gagner en gagner <retarder décadence>
Ajoutez une séquence d'échos à l'audio. Chaque retarder décadence paire donne le retard dans
millisecondes et la décroissance (par rapport au gain) de cet écho. Le gain est le
volume de la sortie.

Comme l'effet d'écho, les échos signifient 'ECHO in Sequel', c'est-à-dire les premiers échos
prend l'entrée, le deuxième l'entrée et le premier échos, le troisième l'entrée et
le premier et le deuxième échos, ... et ainsi de suite. Des précautions doivent être prises en utilisant plusieurs
échos; un seul écho a le même effet qu'un seul écho.

L'échantillon sera rebondi deux fois en échos symétriques :
jouer les échos lead.aiff 0.8 0.7 700 0.25 700 0.3
L'échantillon sera rebondi deux fois en échos asymétriques :
jouer les échos lead.aiff 0.8 0.7 700 0.25 900 0.3
L'échantillon sonnera comme s'il était joué dans un garage :
jouer les échos lead.aiff 0.8 0.7 40 0.25 63 0.3

but égalisateur fréquence[k] largeur[q|o|h|k] Gain
Appliquez un filtre d'égalisation de crête (EQ) à deux pôles. Avec ce filtre, le signal
le niveau à et autour d'une fréquence sélectionnée peut être augmenté ou diminué, tandis que
(contrairement aux filtres passe-bande et de rejet de bande) qui à toutes les autres fréquences est
inchangé.

fréquence donne la fréquence centrale du filtre en Hz, largeur, la bande passante et
Gain le gain ou l'atténuation requis en dB. Faîtes attention à Coupure lors de l'utilisation d'un
positif Gain.

Afin de produire des courbes d'égalisation complexes, cet effet peut être donné plusieurs
fois, chacune avec une fréquence centrale différente.

Le filtre est décrit en détail dans [1].

Cet effet soutient la --terrain option globale.

Voir aussi basse et aigus pour les effets d'égalisation en plateau.

fondu [type] longueur de fondu [temps d'arrêt [longueur de fondu]]
Appliquez un effet de fondu au début, à la fin ou aux deux de l'audio.

En option, type peut être spécifié pour sélectionner la forme de la courbe de fondu : q pour
quart d'onde sinusoïdale, h pour une demi-onde sinusoïdale, t pour une pente linéaire (`triangulaire'),
l pour logarithmique, et p pour la parabole inversée. La valeur par défaut est logarithmique.

Un fondu d'entrée commence à partir du premier échantillon et augmente le niveau du signal de 0 à maximum
plus de volume longueur de fondu secondes. Spécifiez 0 seconde si aucun fondu entrant n'est souhaité.

Pour les fondus en sortie, l'audio sera tronqué à temps d'arrêt et le niveau du signal sera
passer du volume maximum à 0 à partir de longueur de fondu secondes avant le
temps d'arrêt. Si longueur de fondu n'est pas spécifié, il prend par défaut la même valeur que
longueur de fondu. Aucun fondu n'est effectué si temps d'arrêt n'est pas spécifié. Si la
la longueur du fichier peut être déterminée à partir de l'en-tête du fichier d'entrée et de la modification de la longueur
les effets ne sont pas en vigueur, alors 0 peut être spécifié pour temps d'arrêt pour indiquer le
cas habituel d'un fondu de sortie qui se termine à la fin du flux audio d'entrée.

Toutes les heures peuvent être spécifiées en périodes de temps ou en nombres d'échantillons. Spécifier
les périodes de temps utilisent le format hh:mm:ss.frac. Pour spécifier à l'aide du nombre d'échantillons,
spécifiez le nombre d'échantillons et ajoutez la lettre « s » au nombre d'échantillons (pour
exemple « 8000 »).

Voir aussi épissure effet.

sapin [fichier-coefs|coefs]
Utilisez le moteur de convolution FFT de SoX avec des coefficients de filtre FIR donnés. Si un seul
est donné, alors il est traité comme le nom d'un fichier contenant le filtre
coefficients (séparés par des espaces ; peut contenir des commentaires « # »). Si le donné
le nom du fichier est `-', ou si aucun argument n'est donné, alors les coefficients sont lus à partir de
l'« entrée standard » (stdin) ; sinon, des coefficients peuvent être donnés sur la commande
ligne. Exemples:
sox infile outfile sapin 0.0195 -0.082 0.234 0.891 -0.145 0.043
sox infile outfile sapin coefs.txt
avec coefs.txt contenant
# Filtre HP
# fréquence=10000
1.2311233052619888e-01
-4.4777096106211783e-01
5.1031563346705155e-01
-6.6502926320995331e-02
...

Cet effet soutient la --terrain option globale.

flanger [retarder profondeur remuer largeur vitesse forme phase interpréter]
Appliquez un effet de flanger à l'audio. Voir [3] pour une description détaillée de
bridage.

Tous les paramètres sont facultatifs (de droite à gauche).

Autonomie Réglage par défaut Description
retarder 0 - 30 0 Délai de base en millisecondes.
profondeur 0 - 10 2 Ajout d'un délai de balayage en millisecondes.
remuer -95 - 95 0 Pourcentage de régénération (retardé
retour de signal).
largeur 0 - 100 71 Pourcentage de signal retardé mélangé
avec l'original.
vitesse 0.1 - 10 0.5 Balayages par seconde (Hz).
forme sin Forme d'onde balayée : leur|triangle.
phase 0 - 100 25 Pourcentage de déphasage d'onde balayée
pour multicanal (par exemple stéréo)
bride; 0 = 100 = même phase allumée
chaque canal.
interpréter lin Interpolation de ligne à retard numérique :
linéaire|quadratique.

Gain [-e|-B|-b|-r] [-n] [-l|-h] [gain-dB]
Appliquez une amplification ou une atténuation au signal audio ou, dans certains cas, à certains
de ses canaux. Notez que l'utilisation de l'un des -e, -B, -b, -r, ou -n nécessite temporaire
l'espace fichier pour stocker l'audio à traiter, il peut donc ne pas être adapté à une utilisation avec
audio « diffusé ».

Sans autres options, gain-dB est utilisé pour ajuster le niveau de puissance du signal par le
nombre de dB donné : le positif amplifie (attention au Clipping), le négatif atténue.
Avec d'autres options, le gain-dB une amplification ou une atténuation est (logiquement) appliquée
après le traitement en raison de ces options.

Compte tenu du -e option, les niveaux des canaux audio d'un fichier multicanal sont
« égalisé », c'est-à-dire que le gain est appliqué à tous les canaux autres que celui avec le plus haut
niveau de crête, de sorte que tous les canaux atteignent le même niveau de crête (mais, sans également
donnant -n, le son n'est pas "normalisé").

Le manuel de formation -B (solde) l'option est similaire à -e, mais avec -B, le niveau RMS est utilisé
au lieu du niveau de crête. -B peut être utilisé pour corriger le déséquilibre stéréo causé par
une cartouche de platine disque imparfaite. Notez que contrairement -e, -B pourrait causer certains
coupure.

-b est similaire à -B mais a une protection contre l'écrêtage, c'est-à-dire si nécessaire pour empêcher
l'écrêtage lors de l'équilibrage, l'atténuation est appliquée à tous les canaux. Notez, cependant,
qu'en conjonction avec -n, -B et -b sont synonymes.

Le manuel de formation -r L'option est utilisée en conjonction avec une invocation préalable de Gain grâce à la fonction -h
option - voir ci-dessous pour plus de détails.

Le manuel de formation -n l'option normalise l'audio à 0 dB FSD ; il est souvent utilisé en conjonction avec
Un négatif gain-dB à l'effet que l'audio est normalisé à un niveau donné
en dessous de 0dB. Par exemple,
sox fichier d'entrée gain de fichier de sortie -n
se normalise à 0dB, et
sox fichier d'entrée gain de fichier de sortie -n -3
se normalise à -3dB.

Le manuel de formation -l l'option invoque un simple limiteur, par exemple
sox fichier d'entrée gain de fichier de sortie -l 6
appliquera 6dB de gain mais n'écrêtera jamais. Notez que limiter plus de quelques dB de plus
qu'occasionnellement (dans un morceau audio) n'est pas recommandé car cela peut
Distorsion. Voir le compagne effet pour un limiteur plus performant.

Le manuel de formation -h L'option est utilisée pour appliquer un gain afin de fournir une marge pour le traitement ultérieur.
Par exemple, avec
sox infile outfile gain -h basse +6
6 dB d'atténuation seront appliqués avant l'effet d'amplification des basses, assurant ainsi
qu'il ne se coupera pas. Bien sûr, avec la basse, il est évident combien de marge sera
être nécessaire, mais avec d'autres effets (par exemple, taux, dither), ce n'est pas toujours aussi clair.
Un autre avantage de l'utilisation Gain -h plutôt qu'une atténuation explicite, est-ce que si
la marge n'est pas utilisée par les effets ultérieurs, elle peut être récupérée avec Gain -r,
par exemple:
sox infile outfile gain -h bass +6 taux 44100 gain -r
La chaîne d'effets ci-dessus garantit de ne jamais écrêter ni amplifier ; il s'atténue si
nécessaire pour empêcher l'écrêtage, mais seulement dans la mesure nécessaire pour le faire.

Le formatage de sortie (dithering et réduction de la profondeur de bits) nécessite également une marge (qui
ne peut pas être "récupéré"), par exemple
sox infile outfile gain -h bass +6 taux 44100 gain -rh dither
Ici, le deuxième Gain invocation, récupère autant de marge que possible de
les effets précédents, mais conserve autant de marge que nécessaire pour les effets suivants
En traitement. L'option globale SoX -G peut être donné pour invoquer automatiquement Gain -h
et Gain -r.

Voir aussi norme et vol effets.

passe-haut|passe-bas [-1|-2] fréquence[k] [largeur[q|o|h|k]]
Appliquer un filtre passe-haut ou passe-bas avec un point 3dB fréquence. Le filtre peut être
soit unipolaire (avec -1), ou bipolaire (par défaut, ou avec -2). largeur
s'applique uniquement aux filtres bipolaires ; la valeur par défaut est Q = 0.707 et donne un
Réponse de Butterworth. Les filtres roulent à 6dB par pôle par octave (20dB par
pôle par décennie). Les filtres bipolaires sont décrits en détail dans [1].

Ces effets soutiennent la --terrain option globale.

Voir aussi sincère pour les filtres avec un roll-off plus raide.

Hilbert [-n robinets]
Appliquez un filtre de transformation de Hilbert à prise impaire, déphasant le signal de 90 degrés.

Ceci est utilisé dans de nombreux schémas de codage matriciel et pour la génération de signaux analytiques. Les
processus est souvent écrit comme une multiplication par i (ou j), l'unité imaginaire.

Un filtre de transformation de Hilbert à prise impaire a une caractéristique passe-bande, atténuant le
fréquences les plus basses et les plus hautes. Sa bande passante peut être contrôlée par le nombre de
robinets filtrants, qui peuvent être spécifiés avec -n. Par défaut, le nombre de coups est
choisi pour une fréquence de coupure d'environ 75 Hz.

Cet effet soutient la --terrain option globale.

spa module [plug-in] [argument...]
Appliquez un plugin LADSPA [5] (Linux Audio Developer's Simple Plugin API). Malgré la
nom, LADSPA n'est pas spécifique à Linux, et une large gamme d'effets est disponible comme
Les plugins LADSPA, tels que cmt [6] (le Computer Music Toolkit) et celui de Steve Harris
collection de plugins [7]. Le premier argument est le module plugin, le second le nom
du plugin (un module peut contenir plus d'un plugin) et tout autre argument
sont pour les ports de contrôle du plugin. Les arguments manquants sont fournis par défaut
valeurs si possible. Uniquement les plugins avec au plus une entrée audio et une sortie audio
port peut être utilisé. Si elle est trouvée, la variable d'environnement LADSPA_PATH sera utilisée comme
chemin de recherche des plugins.

intensité [Gain [référence]]
Contrôle du volume - similaire au Gain effet, mais fournit une égalisation pour le
système auditif humain. Voir http://en.wikipedia.org/wiki/Loudness pour un détail
description de l'intensité sonore. Le gain est ajusté par la donnée Gain paramètre (généralement
négatif) et le signal égalisé selon ISO 226 par rapport à un niveau de référence de
65dB, bien qu'une alternative référence le niveau peut être donné si l'audio d'origine a
égalisé pour un autre niveau optimal. Un gain par défaut de -10dB est utilisé si un
Gain la valeur n'est pas donnée.

Voir aussi Gain effet.

passe-bas [-1|-2] fréquence[k] [largeur[q|o|h|k]]
Appliquez un filtre passe-bas. Voir la description du passe-haut effet pour plus de détails.

mcompand "attaque1,pourriture1{,attaque2,pourriture2}
[soft-knee-dB:]en-dB1[,sortie-dB1]{,en-dB2,sortie-dB2}
[Gain [volume-initial-dB [retarder]]]" {fréquence de croisement[k] "attaque1,..."}

Le compandeur multibande est similaire au compandeur monobande mais l'audio est
d'abord divisé en bandes à l'aide de filtres croisés Linkwitz-Riley et d'un
Comander spécifiable exécuté sur chaque bande. Voir le compagne effet pour la définition
de ses paramètres. Les paramètres de Compand sont spécifiés entre guillemets et le
la fréquence de croisement pour cette bande est donnée par fréquence de croisement; ceux-ci peuvent être répétés
pour créer plusieurs bandes.

Par exemple, la commande suivante (une longue) montre comment la compression multibande est
généralement utilisé dans la radio FM :
jouer track1.wav gain -3 sinc 8000- 29 100 mcompand \
"0.005,0.1 -47,-40,-34,-34,-17,-33" 100 \
"0.003,0.05 -47,-40,-34,-34,-17,-33" 400 \
"0.000625,0.0125 -47,-40,-34,-34,-15,-33" 1600 \
"0.0001,0.025 -47,-40,-34,-34,-31,-31,-0,-30" 6400 \
"0,0.025 -38,-31,-28,-28,-0,-25" \
gain 15 passe-haut 22 passe-haut 22 sinc -n 255 -b 16 -17500 \
gain 9 passe-bas -1 17801
Le fichier audio est lu avec un son de radio FM simulé (ou un signal de diffusion
condition si le filtre passe-bas à la fin est sauté). Notez que le pipeline est
mis en place avec la préaccentuation 75us de style américain.

Voir aussi compagne pour un effet de compression-extension à bande unique.

bruitprof [fichier-profil]
Calculer un profil de l'audio à utiliser dans la réduction du bruit. Voir le descriptif
du système bruyant effet pour plus de détails.

bruyant [fichier-profil [montant]]
Réduisez le bruit dans le signal audio par le profilage et le filtrage. Cet effet est
modérément efficace pour éliminer les bruits de fond constants tels que le sifflement ou le bourdonnement.
Pour l'utiliser, lancez d'abord SoX avec le bruitprof effet sur une section de l'audio qui
contiendrait idéalement du silence mais contient en fait du bruit - de telles sections sont
se trouve généralement au début ou à la fin d'un enregistrement. bruitprof écrirai
un profil de bruit pour fichier-profil, ou à stdout si non fichier-profil ou si "-" est
étant donné. Par exemple
sox discours.wav -n trim 0 1.5 noiseprof discours.noise-profile
Pour supprimer réellement le bruit, exécutez à nouveau SoX, cette fois avec le bruyant effet;
bruyant réduira le bruit selon un profil de bruit (qui a été généré par
bruitprof), de fichier-profil, ou de stdin si non fichier-profil ou si "-" est donné.
Par exemple
sox speech.wav clean.wav noisered speech.noise-profile 0.3
La quantité de bruit à éliminer est spécifiée par montant-a nombre entre 0 et 1
avec une valeur par défaut de 0.5. Des nombres plus élevés supprimeront plus de bruit mais présenteront une plus grande
probabilité de supprimer les composantes utiles du signal audio. Avant de remplacer un
enregistrement original avec une version à bruit réduit, expérimentez avec différents montant
valeurs pour trouver celle qui convient le mieux à votre audio ; utilisez des écouteurs pour vérifier que vous êtes
satisfait des résultats, en accordant une attention particulière aux sections les plus calmes du
audio.

Sur la plupart des systèmes, les deux étapes - profilage et réduction - peuvent être combinées à l'aide d'un
tuyau, par exemple
sox noisy.wav -n trim 0 1 noiseprof | jouer noisy.wav bruité

norme [niveau dB]
Normalisez le son. norme est juste un alias pour Gain -n; voir le Gain effet pour
détails.

oops Effet stéréo hors phase. Mixe stéréo à twin-mono où chaque canal mono
contient la différence entre les canaux stéréo gauche et droit. C'est
parfois connu sous le nom d'effet « karaoké » car il a souvent pour effet d'éliminer la plupart des
ou toutes les voix d'un enregistrement. C'est équivalent à remix 1,2 1,2.

surmultipliée [Gain(20) [couleur(20)]]
Distorsion non linéaire. Les couleur paramètre contrôle la quantité d'harmoniques paires
contenu dans la sortie surchargée.

chemin { longueur[@position] }
Complétez l'audio avec du silence, au début, à la fin ou à tout point spécifié
à travers l'audio. Les deux longueur et position peut spécifier une heure ou, si ajouté
avec un `s', un certain nombre d'échantillons. longueur est la quantité de silence à insérer et
position la position dans le flux audio d'entrée à laquelle l'insérer. N'importe quel chiffre
de longueurs et de positions peuvent être spécifiées, à condition qu'une position spécifiée soit
pas moins que le précédent. position est facultatif pour le premier et le dernier
les longueurs spécifiées et si elles sont omises correspondent au début et à la fin du
audio respectivement. Par exemple, chemin 1.5 1.5 ajoute 1.5 seconde de rembourrage de silence
à chaque extrémité de l'audio, tandis que chemin 4000s à 3h00 insère 4000 échantillons de silence 3
minutes dans l'audio. Si le silence n'est souhaité qu'à la fin de l'audio, spécifiez
soit la position de fin, soit spécifiez un pad de longueur nulle au début.

Voir aussi retarder pour un effet qui peut ajouter du silence au début de l'audio sur
une base canal par canal.

phaseur gagner en gagner retarder décadence vitesse [-s|-t]
Ajoutez un effet de mise en phase à l'audio. Voir [3] pour une description détaillée du phasage.

delay/decay/speed donne le retard en millisecondes et la décroissance (par rapport au gain-
in) avec une vitesse de modulation en Hz. La modulation est soit sinusoïdale (-s) -
préférable pour plusieurs instruments, ou triangulaire (-t) - donne des instruments seuls
un effet de phasage plus marqué. La décroissance doit être inférieure à 0.5 pour éviter la rétroaction, et
généralement pas moins de 0.1. Le gain de sortie est le volume de la sortie.

Par exemple :
jouer à la caisse claire.flac phaser 0.8 0.74 3 0.4 0.5 -t
Plus doux :
jouer à la caisse claire.flac phaser 0.9 0.85 4 0.23 1.3 -s
Un son populaire :
jouer à la caisse claire.flac phaser 0.89 0.85 1 0.24 2 -t
Plus sévère:
jouer à la caisse claire.flac phaser 0.6 0.66 3 0.6 2 -t

pas [-q] décalage [clignotant [recherche [chevauchement]]]
Changez la hauteur audio (mais pas le tempo).

décalage donne le décalage de hauteur sous forme de « cents » positifs ou négatifs (c'est-à-dire des centièmes de
demi-ton). Voir le tempo effet pour une description des autres paramètres.

Voir aussi plier, vitesseet tempo effets.

taux [-q|-l|-m|-h|-v] [options de remplacement] EN PLUSIEURS FOIS[k]
Changez le taux d'échantillonnage audio (c'est-à-dire rééchantillonnez l'audio) à n'importe quel EN PLUSIEURS FOIS (même
non entier si cela est pris en charge par le format de fichier de sortie) en utilisant un niveau de qualité
défini comme suit:

Qualité Bande- Rej dB Typique Utilisez le
largeur
-q rapide n/a ≈30 @ lecture activée
Fs/4 matériel ancien
-l faible 80% 100 lecture sur ancien
matériel
-m moyenne 95 % 100 lecture audio
-h élevé 95% 125 mastering 16 bits
(utiliser avec tramage)
-v très élevé 95% 175 mastering 24 bits

Bande passante est le pourcentage de la bande de fréquence audio qui est préservé
et Rej dB est le niveau de réjection du bruit. Augmentation des niveaux de rééchantillonnage
la qualité se fait au détriment de l'augmentation du temps de traitement de l'audio. Si
aucune option de qualité n'est donnée, le niveau de qualité utilisé est « élevé » (mais voir « Playing &
Enregistrement audio' ci-dessus concernant la lecture).

L'algorithme « rapide » utilise l'interpolation cubique ; tous les autres utilisent une bande limitée
interpolation. Par défaut, tous les algorithmes ont une réponse en phase « linéaire » ; pour
« moyen », « élevé » et « très élevé », la réponse de phase est configurable (voir ci-dessous).

Le manuel de formation taux l'effet est invoqué automatiquement si SoX -r option spécifie un taux qui
est différent de celui du ou des fichiers d'entrée. Alternativement, si cet effet est donné
explicitement, alors SoX -r l'option n'a pas besoin d'être donnée. Par exemple, les deux suivants
les commandes sont équivalentes :
entrée sox.wav -r 48k sortie.wav bass -b 24
sox input.wav output.wav bass -b 24 taux 48k
bien que la deuxième commande soit plus flexible car elle permet taux options à donner,
et permet d'ordonner arbitrairement les effets.

* * *

Avertissement : une discussion techniquement détaillée suit.

La sélection de qualité simple décrite ci-dessus fournit des réglages qui satisfont aux
besoins de la grande majorité des tâches de rééchantillonnage. Parfois, cependant, il peut être
souhaitable d'affiner la réponse du filtre du rééchantillonneur ; ceci peut être réalisé en utilisant
Commande Options, comme détaillé dans le tableau suivant :

-M/-I/-L Réponse de phase = minimum/intermédiaire/linéaire
-s Filtre raide (bande passante = 99%)
-a Autoriser l'aliasing/l'imagerie au-dessus de la bande passante
-b 74-99.7 Toute bande passante %
-p 0-100 Toute réponse de phase (0 = minimum, 25 = intermédiaire,
50 = linéaire, 100 = maximum)

NB Les options Override ne peuvent pas être utilisées avec les algorithmes de qualité « rapide » ou « faible ».

Tous les rééchantillonneurs utilisent des filtres qui peuvent parfois créer un « écho » (alias « sonnerie »)
artefacts avec des signaux transitoires tels que ceux qui se produisent avec des « claquements de doigts » ou
d'autres sons très percutants. De tels artefacts sont beaucoup plus visibles pour le
l'oreille humaine s'ils surviennent avant le transitoire ("pré-écho") que s'ils surviennent après
il (`post-écho'). Notez que la fréquence de tels artefacts est liée à la
plus petit des taux d'échantillonnage d'origine et du nouveau, mais que si c'est au moins
44.1 kHz, alors les artefacts se situeront en dehors de la portée de l'audition humaine.

Un réglage de réponse de phase peut être utilisé pour contrôler la distribution de tout transitoire
écho entre 'pre' et 'post' : à phase minimale, il n'y a pas de pré-écho mais le
post-écho le plus long; avec phase linéaire, pré et post écho sont en quantités égales (en
termes de signal, mais pas les termes d'audibilité); le réglage de la phase intermédiaire tente de
trouver le meilleur compromis en sélectionnant une petite longueur (et niveau) de pré-écho et un
post-écho de longueur moyenne.

La réponse de phase minimale, intermédiaire ou linéaire est sélectionnée à l'aide de la -M, -I, ou -L
option; une réponse de phase personnalisée peut être créée avec le -p option. Notez cette phase
les réponses entre « linéaire » et « maximum » (supérieur à 50) sont rarement utiles.

Le réglage de la bande passante d'un rééchantillonneur détermine la part du contenu fréquentiel de
le signal d'origine (par rapport à la fréquence d'échantillonnage d'origine lors du suréchantillonnage, ou la nouvelle
fréquence d'échantillonnage lors du sous-échantillonnage) est conservé pendant la conversion. Le terme « passer »
bande' est utilisé pour désigner toutes les fréquences jusqu'au point de largeur de bande (par exemple pour
Taux d'échantillonnage de 44.1 kHz et bande passante de rééchantillonnage de 95 %, la bande passante représente
fréquences de 0 Hz (DC) à environ 21 kHz). Augmenter la bande passante du rééchantillonneur
entraîne une conversion plus lente et peut augmenter les artefacts d'écho transitoires (et vice
versa).

Le manuel de formation -s L'option « filtre raide » modifie la bande passante de rééchantillonnage par rapport aux 95 % par défaut
(basé sur le point 3dB), à 99%. Les -b L'option permet de régler la bande passante sur
toute valeur comprise entre 74 et 99.7 %, mais notez que les valeurs de bande passante supérieures à 99 %
ne sont pas recommandés pour une utilisation normale car ils peuvent provoquer un écho transitoire excessif.

Si la -a est donnée, alors l'aliasing/l'imagerie au-dessus de la bande passante est autorisée.
Par exemple, avec un taux d'échantillonnage de 44.1 kHz et une bande passante de rééchantillonnage de 95 %, ce
signifie que le contenu de fréquence au-dessus de 21 kHz peut être déformé ; cependant, puisqu'il s'agit
au-dessus de la bande passante (c'est-à-dire au-dessus de la fréquence d'intérêt/audibilité la plus élevée),
cela peut ne pas être un problème. Les avantages d'autoriser l'aliasing/l'imagerie sont réduits
temps de traitement et réduit (de près de moitié) les artefacts d'écho transitoires. Noter que
si cette option est donnée, alors la bande passante minimale autorisée avec -b augmente à
% 85.

Exemples :
sox input.wav -b 16 output.wav rate -s -a 44100 tramage -s
rééchantillonnage de (haute) qualité par défaut ; overrides : filtre raide, autoriser l'aliasing ; à
taux d'échantillonnage de 44.1 kHz ; tramage en forme de bruit vers un fichier WAV 16 bits.
sox entrée.wav -b 24 sortie.aiff débit -v -I -b 90 48k
rééchantillonnage de très haute qualité; dérogations : phase intermédiaire, bande passante 90 % ; à 48k
taux d'échantillonnage; stocker la sortie dans un fichier AIFF 24 bits.

* * *

Le manuel de formation pas et vitesse les effets utilisent le taux effet à leur base.

remix [-a|-m|-p]hors spécifications>
hors spécifications = conforme aux spécifications{,conforme aux spécifications} | 0
conforme aux spécifications = [en-chan][-[dans-chan2]][vol-spec]
vol-spec = p|i|v[le volume]

Sélectionnez et mixez les canaux audio d'entrée dans les canaux audio de sortie. Chaque sortie
canal est spécifié, à son tour, par un hors spécifications: une liste des contributions
canaux et spécifications de volume.

Notez que cet effet agit sur l'audio indirect dans les effets SoX
chaîne de transformation; il ne faut pas le confondre avec le -m option globale (où
plusieurs fichiers sont mixés avant d'entrer dans la chaîne d'effets).

An hors spécifications contient des numéros de canaux d'entrée séparés par des virgules et délimités par des tirets
plages de numéros de canaux ; alternativement, 0 peut être donné pour créer une sortie silencieuse
canaliser. Par exemple,
sox entrée.wav sortie.wav remix 6 7 8 0
crée un fichier de sortie avec quatre canaux, où les canaux 1, 2 et 3 sont des copies de
canaux 6, 7 et 8 dans le fichier d'entrée et le canal 4 est silencieux. Tandis que
sox entrée.wav sortie.wav remix 1-3,7 3
crée un fichier de sortie stéréo (un peu bizarre) où le canal gauche est un mix-
vers le bas des canaux d'entrée 1, 2, 3 et 7, et le canal droit est une copie de l'entrée
canal 3.

Lorsqu'une plage de canaux est spécifiée, les numéros de canaux à gauche et à droite
du trait d'union sont facultatifs et par défaut à 1 et au nombre de canaux d'entrée
respectivement. Ainsi
sox entrée.wav sortie.wav remix -
effectue un mixage de tous les canaux d'entrée en mono.

Par défaut, lorsqu'un canal de sortie est mélangé à partir de plusieurs (n) canaux d'entrée, chacun
canal d'entrée sera mis à l'échelle par un facteur de /n. Des volumes de mélange personnalisés peuvent être définis
en suivant un canal d'entrée donné ou une plage de canaux d'entrée avec un vol-spec
(spécification du volume). C'est l'une des lettres p, i, ou v, Suivi d'un
numéro de volume, dont la signification dépend de la lettre donnée et est défini comme
suit:

Courrier Volume nombre Remarques
p réglage de la puissance en dB 0 = pas de changement
i ajuste la puissance en dB Comme `p', mais inverse la
acoustique
v multiplicateur de tension 1 = pas de changement, 0.5 6dB
atténuation, 2 6dB
gain, -1 = inverser

Si une hors spécifications comprend au moins un vol-spec alors, par défaut, la mise à l'échelle ¹/n n'est pas
appliqué à n'importe quel autre canal dans le même out-spec (bien qu'il puisse être dans d'autres out-
spécifications). L'option -a (automatique) cependant, peut être donnée pour conserver l'automatique
mise à l'échelle dans ce cas. Par exemple,
sox entrée.wav sortie.wav remix 1,2 3,4v0.8
donne des multiplicateurs de niveau de canal de 0.5,0.5, 1,0.8 XNUMX, XNUMX, alors que
sox entrée.wav sortie.wav remix -a 1,2 3,4v0.8
donne des multiplicateurs de niveau de canal de 0.5,0.5, 0.5,0.8 XNUMX, XNUMX.

L'option -m (manuel) désactive tous les réglages automatiques du volume, donc
sox entrée.wav sortie.wav remix -m 1,2 3,4v0.8
donne des multiplicateurs de niveau de canal de 1,1, 1,0.8 XNUMX, XNUMX.

Le numéro de volume est facultatif et l'omettre correspond à aucun changement de volume ;
cependant, le seul cas dans lequel cela est utile est en conjonction avec i. For
exemple, si entrée.wav est stéréo, alors
sox entrée.wav sortie.wav remix 1,2i
est un équivalent mono de la oops effet.

Si la -p est donnée, alors toute mise à l'échelle automatique de ¹/n est remplacée par ¹/√n
('puissance') mise à l'échelle ; cela donne un mixage plus fort mais qui peut parfois saturer.

* * *

Une utilisation du remix effet est de diviser un fichier audio en un ensemble de fichiers, chacun
contenant l'un des canaux constitutifs (afin d'effectuer
traitement sur des canaux audio individuels). Où plus de quelques chaînes sont
impliqué, un script tel que le suivant (script Bourne shell) est utile :
#!/ Bin / sh
chans=`soxi -c "$1"`
while [ $chans -ge 1 ]; faire
chans0=`printf %02i $chans` # 2 chiffres donc jusqu'à 99 chans
out=`echo "$1"|sed "s/\(.*\)\.\(.*\)/\1-$chans0.\2/"`
sox "$1" "$out" remix $chans
chans=`expr $chans - 1`
fait
Si un fichier entrée.wav contenant six canaux audio ont été donnés, le script serait
produire six fichiers de sortie : entrée-01.wav, entrée-02.wav, ..., entrée-06.wav.

Voir aussi échange effet.

répéter [compter (1)]
Répéter l'intégralité de l'audio compter fois, ou une fois si compter n'est pas donné. A besoin
espace de fichier temporaire pour stocker l'audio à répéter. Notez que répéter une fois
donne deux copies : l'audio d'origine et l'audio répété.

réverbération [-w|--humide seulement] [réverbération (50 %) [Amortissement HF (50%)
[échelle de la pièce (100 %) [profondeur stéréo (100%)
[pré-retard (0 ms) [humide-gain (0dB)]]]]]]

Ajoutez de la réverbération à l'audio en utilisant l'algorithme « freeverb ». Une réverbération
l'effet est parfois souhaitable pour les salles de concert trop petites ou contenant
beaucoup de gens que la réverbération naturelle de la salle est diminuée. Appliquer un petit
la quantité de réverbération stéréo à un signal mono (sec) le fera généralement sonner plus
Naturel. Voir [3] pour une description détaillée de la réverbération.

Notez que cet effet augmente à la fois le volume et la longueur de l'audio, donc pour
empêcher l'écrêtage dans ces domaines, un appel typique peut être :
jouer dry.wav gain -3 pad 0 3 reverb
Le manuel de formation -w l'option peut être donnée pour sélectionner uniquement le signal « humide », lui permettant ainsi d'être
traité plus loin, indépendamment du signal "sec". Par exemple
play -m voice.wav "|sox voice.wav -p reverse reverb -w reverse"
pour un effet de réverbération inversée.

inverser
Inversez complètement le son. Nécessite un espace de fichier temporaire pour stocker l'audio dans
être inversé.

Ria Appliquez l'égalisation de lecture de vinyle RIAA. Le taux d'échantillonnage doit être l'un des suivants : 44.1,
48, 88.2, 96 kHz.

Cet effet soutient la --terrain option globale.

silence [-l] ci-dessus-périodes [durée порог[d|%]
[sous-périodes durée порог[d|%]]

Supprime le silence au début, au milieu ou à la fin de l'audio. "Silence" est
déterminé par un seuil spécifié.

Le manuel de formation ci-dessus-périodes La valeur est utilisée pour indiquer si l'audio doit être coupé au
début de l'audio. Une valeur de zéro indique qu'aucun silence ne doit être supprimé de
le début. Lorsque vous spécifiez une valeur différente de zéro ci-dessus-périodes, il coupe l'audio jusqu'à
il trouve le non-silence. Normalement, lors de la suppression du silence depuis le début de l'audio, le
ci-dessus-périodes sera 1 mais il peut être augmenté à des valeurs plus élevées pour couper tout l'audio
jusqu'à un nombre spécifique de périodes de non-silence. Par exemple, si vous aviez un audio
fichier avec deux chansons qui contenaient chacune 2 secondes de silence avant la chanson, vous
pourrait spécifier un au-dessus de la période de 2 pour supprimer les périodes de silence et la première
chanson.

Quand ci-dessus-périodes est différent de zéro, vous devez également spécifier un durée et порог.
Durée indications la durée pendant laquelle le non-silence doit être détecté avant qu'il
arrête de couper le son. En augmentant la durée, une rafale de bruit peut être traitée comme
silence et coupé.

seuil est utilisé pour indiquer quelle valeur d'échantillon vous devez traiter comme silence. Pour
audio numérique, une valeur de 0 peut convenir, mais pour l'audio enregistré à partir de l'analogique, vous pouvez
souhaitez augmenter la valeur pour tenir compte du bruit de fond.

Lorsque vous coupez éventuellement le silence à la fin de l'audio, vous spécifiez un au dessous de-
périodes compter. Dans ce cas, sous-période signifie supprimer tout le son après le silence
est détecté. Normalement, ce sera une valeur de 1 mais elle peut être augmentée pour sauter
sur des périodes de silence qui sont souhaitées. Par exemple, si vous avez une chanson avec 2
secondes de silence au milieu et 2 secondes à la fin, vous pouvez définir ci-dessous-
période à une valeur de 2 pour sauter le silence au milieu de l'audio.

Pour sous-périodes, durée spécifie une période de silence qui doit exister avant
l'audio n'est plus copié. En spécifiant une durée plus élevée, un silence
voulu peut être laissé dans l'audio. Par exemple, si vous avez une chanson avec un
1 seconde de silence au milieu et 2 secondes de silence à la fin, une durée
de 2 secondes pourrait être utilisé pour sauter le silence du milieu.

Malheureusement, vous devez connaître la durée du silence à la fin de votre audio
fichier pour couper le silence de manière fiable. Une solution de contournement consiste à utiliser le silence effet dans
combinaison avec le inverser effet. En inversant d'abord le son, vous pouvez utiliser le
ci-dessus-périodes pour couper de manière fiable tout le son de ce qui ressemble à l'avant du
déposer. Puis inversez à nouveau le fichier pour revenir à la normale.

Pour supprimer le silence au milieu d'un fichier, spécifiez un sous-périodes qui est
négatif. Cette valeur est ensuite traitée comme une valeur positive et est également utilisée pour
indiquer que l'effet doit redémarrer le traitement comme spécifié par le ci-dessus-périodes,
ce qui le rend approprié pour supprimer les périodes de silence au milieu de l'audio.

L'option -l indique que sous-périodes durée la longueur de l'audio doit être laissée
intact au début de chaque période de silence. Par exemple, si vous voulez
supprimez les longues pauses entre les mots mais ne souhaitez pas supprimer complètement les pauses.

Le manuel de formation période les comptes sont en unités d'échantillons. Durée les comptes peuvent être au format de
hh:mm:ss.frac, ou le nombre exact d'échantillons. seuil les nombres peuvent être suffixés
avec d pour indiquer que la valeur est en décibels, ou % pour indiquer un pourcentage de
valeur maximale de la valeur de l'échantillon (0% spécifie le silence numérique pur).

L'exemple suivant montre comment cet effet peut être utilisé pour démarrer un enregistrement qui
ne contient pas le retard au démarrage qui se produit généralement entre « appuyer sur le
bouton d'enregistrement' et le début de la performance :
rec paramètres nom de fichier autres-effets silencieux 1 5 2%

sincère [-a à|-b bêta] [-p phase|-M|-I|-L] [-t tbw|-n robinets] [fréqHP][-fréqLP [-t à savoir |-n
robinets]]
Appliquer un filtre passe-bas, passe-haut, passe-bande ou rejet de bande à fenêtre sinc Kaiser
au signal. Les fréqHP et fréqLP les paramètres donnent les fréquences du 6dB
points d'un filtre passe-haut et passe-bas qui peuvent être invoqués individuellement, ou
ensemble. Si les deux sont donnés, alors fréqHP moins que fréqLP crée un passe-bande
L’attache fréqHP plus grand que fréqLP crée un filtre de rejet de bande. Par exemple, le
appels
depuis 3k
depuis -4k
depuis 3k-4k
depuis 4k-3k
créer respectivement un filtre passe-haut, passe-bas, passe-bande et rejet de bande.

L'atténuation par défaut de la bande d'arrêt de 120 dB peut être remplacée par -a;
alternativement, le paramètre 'beta' de kaiser-window peut être donné directement avec -b.

La bande passante de transition par défaut de 5% de la bande totale peut être remplacée par -t
(Et tbw en Hertz); alternativement, le nombre de robinets de filtre peut être donné directement
avec -n.

Si les deux fréqHP et fréqLP sont donnés, alors un -t or -n option donnée à gauche de
les fréquences s'appliquent aux deux fréquences ; l'une de ces options donnée au
droit des fréquences ne s'applique qu'aux fréqLP.

Le manuel de formation -p, -M, -Iet -L les options contrôlent la réponse en phase du filtre ; voir le taux
effet pour plus de détails.

Cet effet soutient la --terrain option globale.

spectrogramme [Options]
Créez un spectrogramme de l'audio ; l'audio est transmis sans modification via le SoX
chaîne de transformation. Cet effet est facultatif - tapez Sox --Aidez-moi et consultez la liste des
effets pris en charge pour voir s'il a été inclus.

Le spectrogramme est rendu dans un fichier Portable Network Graphic (PNG) et affiche
temps dans l'axe X, fréquence dans l'axe Y et amplitude du signal audio dans le Z-
axe. Les valeurs de l'axe Z sont représentées par la couleur (ou éventuellement l'intensité) de
les pixels dans le plan XY. Si le signal audio contient plusieurs canaux, alors
ceux-ci sont affichés de haut en bas à partir du canal 1 (qui est le
canal pour l'audio stéréo).

Par exemple, si `my.wav' est un fichier stéréo, alors avec
spectrogramme sox my.wav -n
un spectrogramme de l'ensemble du fichier sera créé dans le fichier `spectrogram.png'.
Cependant, le plus souvent, l'analyse d'une plus petite partie de l'audio est requise ; par exemple
avec
sox my.wav -n remix 2 trim 20 30 spectrogramme
le spectrogramme ne montre des informations que du deuxième canal (droit), et de
trente secondes d'audio à partir de vingt secondes. Pour analyser un petit
partie du domaine fréquentiel, la taux effet peut être utilisé, par exemple
spectrogramme sox my.wav -n rate 6k
permet une analyse détaillée des fréquences jusqu'à 3 kHz (la moitié du taux d'échantillonnage), c'est-à-dire
où le système auditif humain est le plus sensible. Avec
sox my.wav -n trim 0 10 spectrogramme -x 600 -y 200 -z 100
les options données contrôlent la taille des axes X, Y et Z du spectrogramme (dans ce
cas, la zone de spectrogramme de l'image produite aura une taille de 600 par 200 pixels
et la plage de l'axe Z sera de 100 dB). Notez que l'image produite comprend des axes
légendes, etc. et sera donc un peu plus grande que la taille de spectrogramme spécifiée.
Dans cet exemple:
sox -n -n synth 6 tri 10k:14k spectrogramme -z 100 -w kaiser
une « fenêtre » d'analyse avec une plage dynamique élevée est sélectionnée pour afficher au mieux les
spectrogramme d'une onde triangulaire balayée. Pour un exemple similaire, ajoutez ce qui suit
à la commande 'chime' dans la description du retarder effet (ci-dessus):
taux 2k spectrogramme -X 200 -Z -10 -w kaiser
Des options sont également disponibles pour contrôler l'apparence (couleur, luminosité,
contraste, etc.) et le nom de fichier du spectrogramme ; par exemple avec
sox my.wav -n spectrogramme -m -l -o print.png
un spectrogramme est créé pour être imprimé sur une imprimante « noir et blanc ».

Options :

-x num Modifier la largeur (maximum) (axe X) du spectrogramme par rapport à sa valeur par défaut
valeur de 800 pixels à un nombre donné compris entre 100 et 200000 XNUMX. Voir aussi -X
et -d.

-X num Pixels de l'axe X/seconde ; la valeur par défaut est calculée automatiquement pour s'adapter à la donnée ou
durée audio connue à la taille de l'axe X, ou 100 autrement. Si donné en
conjonction avec -d, cette option affecte la largeur du spectrogramme ;
sinon, cela affecte la durée du spectrogramme. num peut être de 1
(faible résolution temporelle) à 5000 (haute résolution temporelle) et n'a pas besoin d'être un
entier. SoX peut apporter un léger ajustement au nombre donné pour
traitement des raisons de quantification ; si c'est le cas, SoX rapportera le nombre réel
utilisé (visible lorsque l'option globale SoX -V est en vigueur). Voir également -x et
-d.

-y num Définit la taille de l'axe Y en pixels (par canal) ; c'est le nombre de
« bacs » de fréquence utilisés dans l'analyse de Fourier qui produit le spectrogramme.
NB il peut être lent de produire le spectrogramme si ce nombre n'est pas un
plus qu'une puissance de deux (par exemple 129). Par défaut, la taille de l'axe Y est choisie
automatiquement (selon le nombre de canaux). Voir -Y pour alternative
moyen de régler la hauteur du spectrogramme.

-Y num Définit la hauteur totale cible du ou des spectrogrammes. La valeur par défaut est
550 pixels. En utilisant cette option (et par défaut), SoX choisira une hauteur
pour les canaux de spectrogramme individuels, c'est un de plus qu'une puissance de deux, donc
la hauteur totale réelle peut être inférieure au nombre donné. Cependant, là
est également une hauteur minimale par canal donc s'il y a plusieurs canaux, le
nombre peut être dépassé. Voir -y pour une autre façon de régler le spectrogramme
la taille.

-z num Plage de l'axe Z (couleur) en dB, 120 par défaut. Ceci définit la plage dynamique de
le spectrogramme à être -num dBFS à 0 dBFS. En peut aller de 20 à 180.
La diminution de la plage dynamique augmente efficacement le « contraste » de la
affichage du spectrogramme, et vice versa.

-Z num Définit la limite supérieure de l'axe Z en dBFS. Un négatif num de manière efficace
augmente la « luminosité » de l'affichage du spectrogramme, et vice versa.

-q num Définit la quantification de l'axe Z, c'est-à-dire le nombre de couleurs différentes (ou
intensités) dans lesquelles rendre les valeurs de l'axe Z. Un petit nombre (par exemple 4)
donner un effet de type « affiche », ce qui permet de discerner plus facilement les bandes de magnitude de
niveau similaire. De petits nombres donnent également généralement de petits fichiers PNG. Les
nombre donné spécifie le nombre de couleurs à utiliser dans la plage de l'axe Z ;
deux couleurs sont réservées pour représenter les valeurs hors limites.

-w prénom
Fenêtre : Hann (par défaut), Hamming, Bartlett, Rectangular ou Kaiser. Les
le spectrogramme est produit à l'aide de la transformée de Fourier discrète (DFT)
algorithme. Un paramètre important de cet algorithme est le choix de
« fonction de fenêtre ». Par défaut, SoX utilise la fenêtre de Hann qui a tout bon
propriétés rondes de résolution de fréquence et de plage dynamique. Pour mieux
résolution de fréquence (mais plage dynamique inférieure), sélectionnez une fenêtre de Hamming ; pour
plage dynamique plus élevée (mais résolution de fréquence plus faible), sélectionnez un Kaiser
la fenêtre. Des fenêtres Bartlett et rectangulaires sont également disponibles.

-W num Paramètre de réglage de la fenêtre. Cela peut être utilisé pour faire de petits ajustements à
la forme de la fenêtre Kaiser. Un nombre positif (jusqu'à dix) augmente son
plage dynamique, un nombre négatif la diminue.

-s Autoriser le chevauchement lâche des fenêtres DFT. Cela peut, dans certains cas, augmenter
netteté de l'image et donner une plus grande adhérence à la -x valeur, mais à la
au prix d'une petite perte spectrale.

-m Crée un spectrogramme monochrome (la valeur par défaut est la couleur).

-h Sélectionne une palette de couleurs vives - moins agréable visuellement que la palette par défaut
palette de couleurs, mais il peut être plus facile de différencier les différents niveaux.
Si cette option est utilisée avec -m, le résultat sera un hybride
palette monochrome/couleur.

-p num Permutez les couleurs dans une palette de couleurs ou hybride. Les num paramètre, de
1 (par défaut) à 6, sélectionne la permutation.

-l Crée un spectrogramme « imprimable » avec un fond clair (le
par défaut a un fond sombre).

-a Supprimer l'affichage des lignes d'axe. Ceci est parfois utile pour aider
pour discerner les artefacts aux bords du spectrogramme.

-r Spectrogramme brut : supprime l'affichage des axes et des légendes.

-A Sélectionne un autre jeu de couleurs fixe. Ceci est fourni uniquement pour
compatibilité avec les spectrogrammes produits par un autre package. Ça ne devrait pas
normalement être utilisé car il présente certains problèmes, notamment un manque de
différenciation à l'extrémité inférieure qui entraîne le masquage de bas niveau
des artefacts.

-t texte
Définissez le titre de l'image - texte à afficher au-dessus du spectrogramme.

-c texte
Définissez (ou effacez) le commentaire de l'image - texte à afficher en dessous et à gauche de
le spectrogramme.

-o texte
Nom du fichier PNG de sortie du spectrogramme, par défaut `spectrogram.png'.

Avancé Options :
Afin de traiter une plus petite section d'audio sans affecter d'autres effets ou
le signal de sortie (contrairement au réduire est utilisé), les options suivantes peuvent
être utilisé.

-d durée
Cette option définit la résolution de l'axe X de telle sorte que l'audio avec le
durée ([[HH:]MM:]SS) correspond à la largeur sélectionnée (ou par défaut) de l'axe X. Pour
Par exemple,
sox input.mp3 output.wav -n spectrogramme -d 1:00 stats
crée un spectrogramme montrant la première minute de l'audio, tandis que
le stats l'effet est appliqué à l'ensemble du signal audio.

Voir aussi -X pour une autre façon de régler la résolution de l'axe X.

-S Paisible
Démarrez le spectrogramme au point donné dans le flux audio. Par exemple
spectrogramme sox input.aiff output.wav -S 1:00
crée un spectrogramme montrant tout sauf la première minute de l'audio (le
le fichier de sortie reçoit cependant l'intégralité du flux audio).

Pour la possibilité d'effectuer un traitement hors ligne des données spectrales, voir le état
effet.

vitesse facteur[c]
Réglez la vitesse audio (hauteur et tempo ensemble). facteur est soit le rapport de
la nouvelle vitesse à l'ancienne vitesse : supérieur à 1 accélère, moins de 1 ralentit,
ou, s'il est accompagné de la lettre « c », le nombre de cents (c'est-à-dire les centièmes de
demi-ton) par lequel la hauteur (et le tempo) doit être ajustée : supérieure à 0
augmente, moins de 0 diminue.

Techniquement, l'effet de vitesse ne modifie que les informations de fréquence d'échantillonnage, laissant le
échantillons eux-mêmes intacts. Les taux l'effet est invoqué automatiquement pour rééchantillonner
à la fréquence d'échantillonnage de sortie, en utilisant sa qualité/vitesse par défaut. Pour une qualité supérieure ou
rééchantillonnage à plus grande vitesse, en plus du vitesse effet, précisez le taux effet
avec l'option de qualité souhaitée.

Voir aussi plier, paset tempo effets.

épissure [-h|-t|-q] { position[,excès[,marge de manœuvre]] }
Assemblez les sections audio. Cet effet fournit deux choses sur l'audio simple
concaténation : un fondu enchaîné (généralement court) est appliqué à la jointure, et une vague
comparaison de similitude est faite pour aider à déterminer le meilleur endroit où faire le
rejoindre.

L'une des options -h, -t, ou -q peut être donné pour sélectionner l'enveloppe de fondu en tant que demi-
onde cosinus (valeur par défaut), onde triangulaire (ou linéaire) ou quart de cosinus
respectivement.

Type Audio S'effacer niveau Transitions
t gain constant corrélé abrupt
h gain constant corrélé lisse
q puissance constante non corrélée lisse

Pour effectuer une épissure, utilisez d'abord le réduire pour sélectionner les sections audio à
réunis. Comme lors d'une épissure de ruban, l'extrémité de la section à
épissé sur doit être coupé avec un petit excès (par défaut 0.005 seconde) d'audio
après le point de jonction idéal. Le début de la section audio à raccorder
doit être coupé avec le même excès (avant le point de jonction idéal), plus un
supplémentaire marge de manœuvre (par défaut 0.005 seconde). SoX doit alors être invoqué avec les deux
sections audio en tant que fichiers d'entrée et les épissure effet donné avec le poste à
lequel effectuer l'épissure - il s'agit de la longueur de la première section audio (y compris
l'excès).

Le schéma suivant utilise l'analogie de la bande pour illustrer l'opération d'épissure.
L'effet simule les coupes en diagonale et joint les deux pièces :

longueur1 excédent
-----------><--->
_________ : : _________________
\ : : :\ `
\ : : : \ `
\: : \ `
* : : * - - *
\ : : :\ `
\ : : : \ `
_______________\ : : : \_____`____
: : : :
<---> <----->
marge de manœuvre excessive

où * indique les points de jonction.

Par exemple, une longue chanson commence par deux couplets qui commencent (comme déterminé par exemple par
en utilisant l' jeux et sport commande avec le réduire (Commencer) effet) aux heures 0:30.125 et
1:03.432. Les commandes suivantes découpent le premier verset :
sox trop long.wav part1.wav trim 0 30.130
(5 ms en excès, après le début du premier couplet)
sox too-long.wav part2.wav garniture 1:03.422
(5 ms de dépassement plus 5 ms de marge, avant le début du deuxième couplet)
sox part1.wav part2.wav just-right.wav épissure 30.130
Pour un autre exemple, la commande SoX
play "|sox -n -p synth 1 sin %1" "|sox -n -p synth 1 sin %3"
génère et joue deux notes, mais il y a un clic désagréable à la transition ; les
le clic peut être supprimé en épissant au lieu de concaténer l'audio, c'est-à-dire en
ajouter épissure 1 à la commande. (Clics au début et à la fin de l'audio
peut être supprimé par précédant l'effet d'épissure avec fondu q .01 2 .01).

À condition que votre arithmétique soit suffisamment bonne, des épissures multiples peuvent être effectuées avec un
unique épissure invocation. Par exemple:
#!/ Bin / sh
# Copier et coller audio
# acpo infile copy-start copy-stop coller-over-start outfile
# Tous les temps mesurés en échantillons.
taux=`soxi -r "$1"`
e=`expr $rate '*' 5 / 1000` # Utilisation de l'excédent par défaut
l=$e # et marge de manœuvre.
sox "$1" piece.wav trim `expr $2 - $e - $l`s \
`expr $3 - $2 + $e + $l + $e`s
sox "$1" part1.wav trim 0 `expr $4 + $e`s
sox "$1" part2.wav trim `expr $4 + $3 - $2 - $e - $l`s
sox part1.wav piece.wav part2.wav "$5" épissure \
`expr $4 + $e`s \
`expr $4 + $e + $3 - $2 + $e + $l + $e`s
Dans le script shell Bourne ci-dessus, deux épissures sont utilisées pour "copier et coller" l'audio.

* * *

Il est également possible d'utiliser cet effet pour effectuer des fondus enchaînés généraux, par exemple pour joindre
deux chansons. Dans ce cas, excès serait généralement un nombre de secondes, le -q
l'option serait généralement donnée (pour sélectionner un fondu enchaîné « à puissance égale »), et marge de manœuvre
devrait être zéro (ce qui est la valeur par défaut si -q est donné). Par exemple, si f1.wav et
f2.wav sont des fichiers audio à fondu enchaîné, puis
sox f1.wav f2.wav out.wav épissure -q $(soxi -D f1.wav),3
fondu enchaîné les fichiers où le point d'égale sonie est 3 secondes avant la fin
de f1.wav, c'est-à-dire que la longueur totale du fondu enchaîné est de 2 × 3 = 6 secondes (Remarque : le
La notation $(...) est un shell POSIX).

état [-s en échelon] [-rms] [-fréq] [-v] [-d]
Affichez les informations statistiques du domaine temporel et fréquentiel sur l'audio. l'audio
est transmis sans modification à travers la chaîne de traitement SoX.

Les informations sont sorties dans le flux « erreur standard » (stderr) et sont
calculé, où n est la durée de l'audio en échantillons, c est le nombre de
canaux audio, r est la fréquence d'échantillonnage audio, et xk représente la valeur PCM (dans le
plage -1 à +1 par défaut) de chaque échantillon successif dans l'audio, comme suit :

Échantillons lire n×c
longueur du câble (secondes) n÷r
Escaladé by Voir -s ci-dessous.
Maximum amplitude maximum(xk) La valeur d'échantillon maximale
dans le son ; d'habitude
ce sera un point positif
.
Minimum amplitude min (xk) La valeur d'échantillon minimale
dans le son ; d'habitude
ce sera négatif
.
Midline amplitude ½ mn(xk)+½max(xk)
Médian norme /nΣ│xkLa moyenne des
valeur absolue de chacun
échantillon dans l'audio.
Médian amplitude /nΣxk La moyenne de chacun
échantillon dans l'audio. Si
ce chiffre est non nul,
alors il indique le
présence d'un DC
décalage (qui pourrait être
supprimé à l'aide du
décalage décalé effet).
RMS amplitude (¹/nΣxk²) Le niveau d'un DC
signal qui aurait
la même puissance que le
puissance moyenne de l'audio.
Maximum delta maximum(│xk-xk-1)
Minimum delta min(│xk-xk-1)
Médian delta /n-1Σ│xk-xk-1
RMS delta (¹/n-1Σ(xk-xk-1)²)
Rugueux fréquence En Hz.
Volume Le réglage Le paramètre à la vol
effet qui ferait
le son aussi fort que
possible sans
coupure. Remarque : consultez le
conversation au sujet de Coupure
ci-dessus pour les raisons pour lesquelles il
est rarement une bonne idée
en fait pour le faire.

Notez que les mesures delta ne s'appliquent pas à l'audio multicanal.

Le manuel de formation -s L'option peut être utilisée pour mettre à l'échelle les données d'entrée par un facteur donné. Le défaut
valeur de en échelon est 2147483647 (c'est-à-dire la valeur maximale d'un entier signé de 32 bits).
Les effets internes fonctionnent toujours avec des données PCM longues signées et la valeur doit donc
se rapportent à ce fait.

Le manuel de formation -rms L'option convertira toutes les valeurs moyennes de sortie en « racine carrée moyenne »
le format.

Le manuel de formation -v L'option affiche uniquement la valeur « Réglage du volume ».

Le manuel de formation -fréq L'option calcule le spectre de puissance de l'entrée (4096 points DFT) au lieu de
les statistiques énumérées ci-dessus. Cela ne doit être utilisé qu'avec un seul canal audio
fichier.

Le manuel de formation -d L'option affiche un vidage hexadécimal des données audio PCM signées 32 bits dans les SoX
tampon interne. Ceci est principalement utilisé pour aider à traquer les problèmes endian qui
se produisent parfois dans les versions multiplateformes de SoX.

Voir aussi stats effet.

stats [-b les bits|-x les bits|-s en échelon] [-w fenêtre de temps]
Afficher les informations statistiques du domaine temporel sur les canaux audio ; le son est
passé sans modification dans la chaîne de traitement SoX. Les statistiques sont calculées et
affiché pour chaque canal audio et, le cas échéant, un chiffre global est également
donné.

Par exemple, pour un fichier de musique stéréo bien maîtrisé :

Globalement Gauche Droite
Décalage CC 0.000803 -0.000391 0.000803
Niveau minimum -0.750977 -0.750977 -0.653412
Niveau max 0.708801 0.708801 0.653534
Pk niv dB -2.49 -2.49 -3.69
RMS niv dB -19.41 -19.13 -19.71
RMS Pk dB -13.82 -13.82 -14.38
RMS Tr dB -85.25 -85.25 -82.66
Facteur de crête - 6.79 6.32
Facteur plat 0.00 0.00 0.00
Nombre de paquets 2 2 2
Profondeur de bits 16/16 16/16 16/16
Nombre d'échantillons 7.72M
Longueur s 174.973
Échelle max. 1.000000
Fenêtre s 0.050

DC compenser, Min niveauet Max niveau sont affichés, par défaut, dans la plage ±1. Si la
-b (bits) options est donnée, alors ces trois mesures seront mises à l'échelle à un
entier signé avec le nombre de bits donné ; par exemple, pour 16 bits, l'échelle
serait de -32768 à +32767. Les -x l'option se comporte de la même manière que -b excepté
les valeurs entières signées sont affichées en hexadécimal. Les -s l'option met à l'échelle le
trois mesures par un nombre à virgule flottante donné.

Pk lev dB et RMS lev dB sont des niveaux de crête et RMS standard mesurés en dBFS.
RMS Pk dB et RMS Tr dB sont des valeurs de crête et de creux pour le niveau RMS mesurées sur une
fenêtre courte (par défaut 50ms).

Encolure facteur est le rapport standard entre le niveau de crête et le niveau RMS (remarque : pas en dB).

Plat facteur est une mesure de la planéité (c'est-à-dire des échantillons consécutifs avec le même
valeur) du signal à ses niveaux de crête (c'est-à-dire soit Min niveau, ou Max niveau).
Pk compter est le nombre d'occasions (pas le nombre d'échantillons) que le signal
atteint soit Min niveau, ou Max niveau.

La main droite Peu profond le chiffre est la définition standard de la profondeur de bits, c'est-à-dire les bits
moins significatifs que le nombre donné sont fixés à zéro. La figure de gauche est
le nombre de bits de poids fort qui sont fixés à zéro (ou un pour les
nombres) soustraits du chiffre de droite (le nombre soustrait est directement
lié à Pk lev dB).

Pour l'audio multicanal, un chiffre global pour chacune des mesures ci-dessus est
donné et dérivé des chiffres du canal comme suit : DC compenser: maximale
ordre de grandeur; Max niveau, Pk lev dB, RMS Pk dB, Peu profond: maximale ; Min niveau,
RMS Tr dB: le minimum; RMS lev dB, Plat facteur, Pk compter: moyenne; Encolure facteur: ne pas
en vigueur.

longueur du câble s est la durée en secondes de l'audio, et En échantillons est égal à
taux d'échantillonnage multiplié par longueur du câble. Escaliers intérieurs Max est la mise à l'échelle appliquée au premier
trois mesures ; plus précisément, il s'agit de la valeur maximale qui pourrait s'appliquer à
Max niveau. Vitrine s est la longueur de la fenêtre utilisée pour le pic et le creux RMS
mesures.

Voir aussi état effet.

échange Échangez les canaux stéréo. Voir également remix pour un effet qui permet un canal arbitraire
sélection et commande (et mélange).

étendue facteur [fenêtre fondu décalage décoloration]
Modifiez la durée audio (mais pas sa hauteur). Cet effet est globalement équivalent
à la tempo effet avec (facteur inversé et) recherche mis à zéro, donc en général,
ses résultats sont comparativement médiocres ; il est conservé car il peut parfois surpasser
tempo pour les petits facteurs.

facteur d'étirement : > 1 allonger, <1 raccourcir la durée. fenêtre la taille est en ms.
La valeur par défaut est 20 ms. Les fondu option, peut être `lin'. décalage rapport, dans [0 1]. Défaut
dépend du facteur d'étirement. 1 pour raccourcir, 0.8 pour allonger. Les décoloration rapport, en [0
0.5]. La valeur par défaut d'un fondu dépend de facteur et décalage.

Voir aussi tempo effet.

synthé [-j clé - KEY] [-n] [len [de rabais [ph [p1 [p2 [p3]]]]]] {[type] [combiner]
[[%]fréq[k][:|+|/|-[%]fréq2[k]]] [de rabais [ph [p1 [p2 [p3]]]]]}
Cet effet peut être utilisé pour générer des tonalités audio à fréquence fixe ou balayée avec
différentes formes d'ondes, ou pour générer un bruit à large bande de différentes "couleurs". Plusieurs
les effets de synthé peuvent être mis en cascade pour produire des formes d'onde plus complexes ; à chaque étape, il
est possible de choisir si la forme d'onde générée sera mélangée avec, ou
modulé sur la sortie de l'étage précédent. Audio pour chaque canal dans un
Le fichier audio multicanal peut être synthétisé indépendamment.

Bien que cet effet soit utilisé pour générer de l'audio, un fichier d'entrée doit toujours être fourni,
dont les caractéristiques serviront à régler la longueur audio synthétisée, le
nombre de canaux et taux d'échantillonnage ; cependant, étant donné que l'audio du fichier d'entrée est
normalement pas nécessaire, un "fichier nul" (avec le nom spécial -n) est souvent donné
à la place (et la longueur spécifiée en tant que paramètre pour synthé ou par un autre donné
effet qui peut avoir une longueur associée).

Par exemple, ce qui suit produit un fichier audio de 3 secondes, 48 ​​kHz, contenant un
onde sinusoïdale balayée de 300 à 3300 Hz :
sox -n output.wav synthé 3 sinus 300-3300
et cela produit une version 8 kHz :
sox -r 8000 -n output.wav synthé 3 sinus 300-3300
Plusieurs canaux peuvent être synthétisés en spécifiant l'ensemble de paramètres affichés
entre les accolades plusieurs fois ; ce qui suit met le ton balayé à gauche
canal et ajoute du bruit « marron » à droite :
sox -n sortie.wav synthé 3 sinus 300-3300 brownnoise
L'exemple suivant montre comment deux effets de synthé peuvent être mis en cascade pour créer un plus
forme d'onde complexe :
jouer -n synthé 0.5 sinus 200-500 synthé 0.5 sinus fmod 700-100
Les fréquences peuvent également être données en notation « scientifique » ou, en préfixant un « % »
caractère, en nombre de demi-tons par rapport au "la moyen" (440 Hz). Par exemple,
ce qui suit peut être utilisé pour aider à accorder la corde de « mi » grave d'une guitare :
jouer -n synthé 4 plumer %-29
ou avec une boucle (Bourne shell), toute la guitare :
pour n dans E2 A2 D3 G3 B3 E4; faire
jouer -n synth 4 pincer $n répéter 2; terminé
Voir le retarder effet (ci-dessus) et la référence aux « exemples de scripts SoX » (ci-dessous)
pour plus d' synthé exemples.

NB Cet effet génère de l'audio au volume maximum (0dBFS), ce qui signifie qu'il
est un risque élevé d'écrêtage lors de l'utilisation ultérieure de l'audio, donc dans de nombreux cas,
vous voudrez suivre cet effet avec le Gain effet pour éviter que cela
événement. (Voir également Coupure ci-dessus.) Notez que, par défaut, le synthé effet
intègre la fonctionnalité de Gain -h (voir le Gain effet pour plus de détails);
synthé's -n option peut être donnée pour désactiver ce comportement.

Une description détaillée de chaque synthé paramètre suivant :

len est la durée de l'audio à synthétiser exprimée en temps ou en nombre de
échantillons; 0=longueur d'entrée, par défaut=0.

Le format pour spécifier les longueurs dans le temps est hh:mm:ss.frac. Le format pour
spécifier le nombre d'échantillons est le nombre d'échantillons avec la lettre « s » ajoutée à
le

type est l'un des sinus, carré, triangle, dents de scie, trapèze, exp, bruit [blanc],
tpdfnoise pinknoise, brownnoise, plumer; par défaut=sinus.

combiner est l'un de create, mix, amod (modulation d'amplitude), fmod (fréquence
modulation); par défaut=créer.

fréq/fréq2 sont les fréquences de début/fin de synthèse en Hz ou, si
précédé de '%', demi-tons par rapport à A (440 Hz); alternativement, « scientifique »
une notation de note (par exemple E2) peut être utilisée. La fréquence par défaut est de 440 Hz. Par défaut,
l'accord utilisé avec les notations de notes est « tempérament égal » ; les -j clé - KEY option
sélectionne "juste intonation", où clé - KEY est un nombre entier de demi-tons relatif à
A (ainsi par exemple, -9 ou 3 sélectionne la clé de C), ou une note en notation scientifique.

If fréq2 est donné, alors len doit également avoir été donné et la tonalité générée sera
être balayé entre les fréquences données. Les deux fréquences données doivent être
séparés par l'un des caractères « : », « + », « / » ou « - ». Ce caractère est utilisé
pour spécifier la fonction de balayage comme suit :

: Linéaire : la tonalité changera d'un nombre fixe de hertz par seconde.

+ Carré : une fonction de second ordre permet de changer la tonalité.

/ Exponentielle : la tonalité changera d'un nombre fixe de demi-tons par seconde.

- Exponentielle : comme `/', mais phase initiale toujours nulle, et échelonnée (moins
lisse) les changements de fréquence.

Non utilisé pour le bruit.

de rabais est le biais (DC-offset) du signal en pourcentage ; par défaut=0.

ph est le déphasage en pourcentage de 1 cycle ; par défaut=0. Non utilisé pour le bruit.

p1 est le pourcentage de chaque cycle qui est « actif » (carré) ou « montant » (triangle,
exp, trapèze); par défaut=50 (carré, triangle, exp), par défaut=10 (trapèze), ou
maintenir (pincer); par défaut=40.

p2 (trapèze) : le pourcentage au cours de chaque cycle auquel la « chute » commence ;
par défaut=50. exp : l'amplitude en multiples de 2dB ; par défaut=50, ou tone-1 (pluck) ;
par défaut=20.

p3 (trapèze) : le pourcentage à travers chaque cycle auquel la « chute » se termine ;
par défaut=60, ou tone-2 (pluck) ; par défaut=90.

tempo [-q] [-m|-s|-l] facteur [clignotant [recherche [chevauchement]]]
Modifiez la vitesse de lecture audio mais pas sa hauteur. Cet effet utilise le WSOLA
algorithme. L'audio est découpé en segments qui sont ensuite décalés dans le temps
domaine et superposés (fondu croisé) aux points où leurs formes d'onde sont les plus
similaire tel que déterminé par la mesure des « moindres carrés ».

Par défaut, les recherches linéaires sont utilisées pour trouver les meilleurs points de chevauchement. Si la
facultatif -q est donné, les recherches dans l'arborescence sont utilisées à la place. Cela rend le
effet fonctionne plus rapidement, mais le résultat peut ne pas sembler aussi bon. Cependant, si vous
doit améliorer la vitesse de traitement, cela réduit généralement moins la qualité sonore
que de réduire les valeurs de recherche ou de chevauchement.

Le manuel de formation -m L'option est utilisée pour optimiser les valeurs par défaut du segment, de la recherche et du chevauchement pour
traitement de la musique.

Le manuel de formation -s L'option est utilisée pour optimiser les valeurs par défaut du segment, de la recherche et du chevauchement pour
traitement de la parole.

Le manuel de formation -l L'option est utilisée pour optimiser les valeurs par défaut du segment, de la recherche et du chevauchement pour
traitement « linéaire » qui a tendance à provoquer une distorsion plus notable mais peut être
utile lorsque le facteur est proche de 1.

Si -m, -s ou -l est spécifié, la valeur par défaut du segment sera calculée
basé sur le facteur, tandis que les valeurs de recherche et de chevauchement par défaut sont basées sur le segment. Tout
les valeurs que vous fournissez remplacent toujours ces valeurs par défaut.

facteur donne le rapport du nouveau tempo à l'ancien tempo, donc par exemple 1.1 accélère le
le tempo de 10 % et 0.9 le ralentit de 10 %.

Le facultatif clignotant paramètre sélectionne la taille du segment de l'algorithme dans
millisecondes. Si aucun autre indicateur n'est spécifié, la valeur par défaut est 82 et est
généralement adapté pour apporter de petits changements au tempo de la musique. Pour des changements plus importants
(par exemple un facteur de 2), 41 ms peuvent donner un meilleur résultat. Les drapeaux -m, -s et -l
entraînera l'ajustement automatique de la valeur par défaut du segment en fonction du facteur. Pour
exemple en utilisant -s (pour la parole) avec un tempo de 1.25 calculera un segment par défaut
valeur de 32.

Le facultatif recherche paramètre donne la durée audio en millisecondes sur laquelle le
L'algorithme recherchera les points qui se chevauchent. Si aucun autre indicateur n'est spécifié, le
la valeur par défaut est 14.68. Des valeurs plus élevées nécessitent plus de temps de traitement et peuvent ou non
produire de meilleurs résultats. Un maximum pratique est la moitié de la valeur du segment. Chercher
peut être réduite pour réduire le temps de traitement au risque de dégrader la qualité de sortie. Les
Les indicateurs -m, -s et -l entraîneront l'ajustement automatique de la valeur par défaut de la recherche
basé sur le segment.

Le facultatif chevauchement Le paramètre donne la longueur de chevauchement des segments en millisecondes.
La valeur par défaut est 12, mais les indicateurs -m, -s ou -l ajustent automatiquement le chevauchement en fonction de
taille des segments. L'augmentation du chevauchement augmente le temps de traitement et peut augmenter
qualité. Un maximum pratique pour le chevauchement est la valeur de recherche, avec chevauchement
étant généralement (au moins) un peu plus petit que la recherche.

Voir aussi vitesse pour un effet qui change le tempo et la hauteur ensemble, pas et plier
pour les effets qui changent uniquement de hauteur, et étendue pour un effet qui change de tempo
en utilisant un algorithme différent.

aigus Gain [fréquence[k] [largeur[s|h|k|o|q]]]
Appliquez un effet de contrôle des aigus. Voir la description du basse effet pour
détails.

trémolo vitesse [profondeur]
Appliquez un effet de trémolo (modulation d'amplitude basse fréquence) à l'audio. Les
la fréquence du trémolo en Hz est donnée par vitesse, et la profondeur en pourcentage par profondeur
(40 par défaut).

réduire {[=|-]position}
Coupe des portions de l'audio. N'importe quel nombre de positions peut être donné; le son n'est pas
envoyé à la sortie jusqu'au premier position est atteint. L'effet alterne alors
entre la copie et la suppression de l'audio à chaque position.

Si un position est précédé d'un signe égal ou moins, il est interprété par rapport à
le début ou la fin de l'audio, respectivement. (La longueur audio doit être
connu pour que les emplacements relatifs à la fin fonctionnent.) Sinon, il est considéré comme un décalage
du dernier position, ou à partir du début de l'audio pour le premier paramètre. À l'aide de
une valeur de 0 pour le premier position paramètre permet de copier depuis le début de
l'audio.

Tous les paramètres peuvent être spécifiés à l'aide d'une durée ou d'un nombre exact de
échantillons. Le format pour spécifier les longueurs dans le temps est hh:mm:ss.frac. Une valeur de
1:30.5 pour le premier paramètre ne démarrera pas avant 1 minute, trente et ½ secondes
dans l'audio. Le format pour spécifier le nombre d'échantillons est le nombre d'échantillons
avec la lettre « s » ajoutée à celle-ci. Une valeur de 8000s pour le premier paramètre sera
attendez que 8000 échantillons soient lus avant de commencer à traiter l'audio.

Par exemple,
sox infile outfile garniture 0 10
copiera les dix premières secondes, tandis que
jouer le rognage d'infile 12:34 = 15:00 -2:00
jouera de 12 minutes 34 secondes dans l'audio jusqu'à 15 minutes dans l'audio
(c'est-à-dire 2 minutes et 26 secondes), puis reprenez la lecture deux minutes avant le
fin du son.

suréchantillonner [facteur]
Suréchantillonner le signal par un facteur entier : facteur-1 échantillons de valeur zéro sont insérés
entre chaque paire d'échantillons d'entrée. En conséquence, le spectre d'origine est
répliqué dans le nouvel espace de fréquence (aliasing) et atténué. Cette
l'atténuation peut être compensée en ajoutant vol facteur après plus
En traitement. L'effet de suréchantillonnage est généralement utilisé en combinaison avec le filtrage
effets.

Pour un effet de rééchantillonnage général avec anti-aliasing, voir taux. Voir également sous-échantillonner.

comme [Options]
Détecteur d'activité vocale. Tente de supprimer le silence et les bruits de fond
les extrémités des enregistrements de parole (assez haute résolution, c'est-à-dire 16 bits, 44-48 kHz).
L'algorithme utilise actuellement une simple mesure de puissance cepstrale pour détecter la voix,
donc peut être dupé par d'autres choses, en particulier la musique. L'effet ne peut être coupé qu'à partir de
l'avant de l'audio, donc afin de couper de l'arrière, le inverser effet doit
également être utilisé. Par exemple
jouer le discours.wav norme vad
à couper par l'avant,
jouer le discours.wav norme inverse vad inverse
couper par l'arrière, et
jouer le discours.wav norme vad inverse vad inverse
pour couper des deux extrémités. L'utilisation du norme l'effet est recommandé, mais n'oubliez pas
cela non plus inverser ni norme est adapté pour une utilisation avec l'audio en streaming.

Options :
Les valeurs par défaut sont indiquées entre parenthèses.

-t num (7)
Le niveau de mesure utilisé pour déclencher la détection d'activité. Cela pourrait nécessiter
à modifier en fonction du niveau de bruit, du niveau du signal et d'autres
caractéristiques de l'audio d'entrée.

-T num (0.25)
La constante de temps (en secondes) utilisée pour aider à ignorer les courtes rafales de son.

-s num (1)
La quantité d'audio (en secondes) pour rechercher des rafales plus calmes/plus courtes de
audio à inclure avant le point de déclenchement détecté.

-g num (0.25)
Écart autorisé (en secondes) entre les rafales audio plus calmes/plus courtes à inclure
avant le point de déclenchement détecté.

-p num (0)
La quantité d'audio (en secondes) à préserver avant le point de déclenchement et
toutes les rafales trouvées plus calmes/plus courtes.

Avancé Options :
Ceux-ci permettent un réglage fin des paramètres internes de l'algorithme.

-b num L'algorithme (en interne) utilise une estimation/réduction adaptative du bruit afin
pour détecter le début de l'audio souhaité. Cette option définit l'heure de la
estimation initiale du bruit.

-N num Constante de temps utilisée par l'estimateur de bruit adaptatif lorsque le niveau de bruit
augmente.

-n num Constante de temps utilisée par l'estimateur de bruit adaptatif lorsque le niveau de bruit
décroît.

-r num Quantité de réduction de bruit à utiliser dans l'algorithme de détection (par exemple 0, 0.5,
...).

-f num Fréquence des traitements/mesures de l'algorithme.

-m num Durée de mesure ; par défaut, deux fois la période de mesure ; c'est à dire avec
chevauchement.

-M num Constante de temps utilisée pour lisser les mesures spectrales.

-h num Fréquence « mur de brique » du filtre passe-haut appliqué à l'entrée du
algorithme de détection.

-l num Fréquence « mur de brique » du filtre passe-bas appliqué à l'entrée du
algorithme de détection.

-H num Fréquence « mur de brique » du poussoir passe-haut utilisé dans l'algorithme du détecteur.

-L num Fréquence « mur de brique » du poussoir passe-bas utilisé dans l'algorithme du détecteur.

Voir aussi silence effet.

vol Gain [type [gain limiteur]]
Appliquez une amplification ou une atténuation au signal audio. Contrairement au -v option
(qui est utilisé pour équilibrer plusieurs fichiers d'entrée lorsqu'ils entrent dans les effets SoX
chaîne de transformation), vol est un effet comme un autre et peut donc être appliqué n'importe où, et
plusieurs fois si nécessaire, au cours de la chaîne de traitement.

La quantité pour changer le volume est donnée par Gain qui est interprété, selon
le donné type, comme suit : si type is amplitude (ou est omis), alors Gain est un
rapport d'amplitude (c'est-à-dire tension ou linéaire), si power, puis une puissance (c'est-à-dire une puissance ou
rapport tension-carré), et si dB, puis une variation de puissance en dB.

Quand type is amplitude or power, un Gain de 1 laisse le volume inchangé, moins de
1 le diminue, et supérieur à 1 l'augmente ; Un négatif Gain inverse le son
signal en plus de régler son volume.

Quand type is dB, un Gain de 0 laisse le volume inchangé, moins de 0 le diminue,
et supérieur à 0 l'augmente.

Voir [4] pour une discussion détaillée sur la tension électrique (et donc le signal audio)
et les rapports de puissance.

Attention à Coupure lors de l'augmentation du volume.

Le manuel de formation Gain et la type les paramètres peuvent être concaténés si désiré, par exemple vol 10dB.

En option, gain limiteur valeur peut être spécifiée et doit être une valeur bien inférieure à
1 (par exemple 0.05 ou 0.02) et n'est utilisé que sur les pics pour éviter l'écrêtage. Pas
la spécification de ce paramètre n'entraînera l'utilisation d'aucun limiteur. En mode verbeux, ce
l'effet affichera le pourcentage de l'audio qui devait être limité.

Voir aussi Gain pour un effet de changement de volume avec différentes capacités, et compagne
pour un effet de compression/expansion/limitation de la plage dynamique.

Obsolète Effets
Les effets suivants ont été renommés ou ont leur fonctionnalité incluse dans un autre
effet; ils continuent de fonctionner dans cette version de SoX mais peuvent être supprimés à l'avenir.

mixer [ -l|-r|-f|-b|-1|-2|-3|-4|n{,n} ]
Réduisez le nombre de canaux audio en mixant ou en sélectionnant des canaux, ou augmentez
le nombre de canaux en dupliquant les canaux. Remarque : cet effet agit sur le
acoustique indirect au sein de la chaîne de traitement des effets SoX ; il ne devrait pas être confondu
grâce à la fonction -m option globale (où plusieurs fichiers sont mélangés avant d'entrer
la chaîne d'effets).

En réduisant le nombre de canaux, il est possible d'utiliser le -l, -r, -f, -b, -1,
-2, -3, -4, options pour sélectionner uniquement les canaux gauche, droit, avant, arrière ou
canal spécifique pour la sortie au lieu de faire la moyenne des canaux. Les -let -r
les options feront la moyenne dans les fichiers à quatre canaux, alors sélectionnez le canal exact à
empêcher cela.

Le manuel de formation mixer l'effet peut également être invoqué avec jusqu'à 16 chiffres, séparés par des virgules,
qui spécifient la proportion (0 = 0% et 1 = 100%) de chaque canal d'entrée qui doit
être mélangé dans chaque canal de sortie. En mode deux canaux, 4 chiffres sont donnés : l →
l, l → r, r → l et r → r, respectivement. En mode quatre canaux, les 4 premiers
les nombres donnent les proportions pour le canal de sortie avant gauche, comme suit : lf →
lf, rf → lf, lb → lf et rb → rf. Les 4 suivants donnent la sortie avant droite dans le
même ordre, puis arrière gauche et arrière droit.

Il est également possible d'utiliser les 16 chiffres pour augmenter ou réduire le nombre de canaux ;
spécifiez simplement 0 pour les canaux inutilisés.

Enfin, certaines combinaisons réduites de nombres peuvent être spécifiées pour certains
combinaisons de canaux d'entrée/sortie.

In Ch de stock Ch En Mappages
2 1 2 l → l, r → l
2 2 1 régler la balance
4 1 4 lf → l, rf → l, lb → l, rb → l
4 2 2 lf → l&rf → r, lb → l&rb → r
4 4 1 régler la balance
4 4 2 solde avant, solde arrière

Cet effet a été remplacé par le remix effet qui gère un nombre quelconque de
Les canaux.

DIAGNOSTIC


L'état de sortie est 0 pour aucune erreur, 1 s'il y a un problème avec les paramètres de ligne de commande,
ou 2 si une erreur se produit lors du traitement du fichier.

Utilisez le jeu en ligne en utilisant les services onworks.net


Serveurs et postes de travail gratuits

Télécharger des applications Windows et Linux

Commandes Linux

Ad




×
Publicité
❤ ️Achetez, réservez ou achetez ici — gratuitement, contribue à maintenir la gratuité des services.