GoGPT Best VPN GoSearch

Ulubiona usługa OnWorks

graj - Online w chmurze

Uruchom grę w bezpłatnym dostawcy hostingu OnWorks w systemie Ubuntu Online, Fedora Online, emulatorze online systemu Windows lub emulatorze online systemu MAC OS

To jest polecenie, które można uruchomić w bezpłatnym dostawcy hostingu OnWorks przy użyciu jednej z naszych wielu bezpłatnych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online systemu Windows lub emulator online systemu MAC OS

PROGRAM:

IMIĘ


SoX - Sound eXchange, szwajcarski scyzoryk manipulacji dźwiękiem

STRESZCZENIE


Sox [globalne-opcje] [opcje-formatu] plik wejściowy1
[[opcje-formatu] plik wejściowy2] ... [opcje-formatu] plik wyjściowy
[efekt [efekty-opcje]] ...

grać [globalne-opcje] [opcje-formatu] plik wejściowy1
[[opcje-formatu] plik wejściowy2] ... [opcje-formatu]
[efekt [efekty-opcje]] ...

rec [globalne-opcje] [opcje-formatu] plik wyjściowy
[efekt [efekty-opcje]] ...

OPIS


Wprowadzenie
SoX odczytuje i zapisuje pliki audio w najpopularniejszych formatach i może opcjonalnie stosować efekty
do nich. Może łączyć wiele źródeł wejściowych, syntezować dźwięk i, w wielu systemach,
działać jako odtwarzacz audio ogólnego przeznaczenia lub wielościeżkowy rejestrator audio. Ma też ograniczone
możliwość dzielenia wejścia na wiele plików wyjściowych.

Cała funkcjonalność SoX jest dostępna tylko za pomocą Sox Komenda. Aby uprościć grę i
nagrywanie dźwięku, jeśli SoX jest wywoływany jako grać, plik wyjściowy jest automatycznie ustawiany jako
domyślne urządzenie dźwiękowe, a jeśli jest wywoływane jako rec, jako wejście używane jest domyślne urządzenie dźwiękowe
źródło. Dodatkowo soxi(1) polecenie zapewnia wygodny sposób na zapytanie o dźwięk
informacje nagłówka pliku.

Sercem SoX jest biblioteka o nazwie libSoX. Osoby zainteresowane rozszerzeniem SoX lub użyciem
w innych programach powinien odnosić się do strony podręcznika libSoX: libsox(3).

SoX to narzędzie do przetwarzania dźwięku z wiersza poleceń, szczególnie nadające się do szybkiego i prostego
edycje i przetwarzanie wsadowe. Jeśli potrzebujesz interaktywnego, graficznego edytora audio, użyj
śmiałość(1).

* * *

Ogólny łańcuch przetwarzania SoX można podsumować w następujący sposób:

Wejście(a) → Sumator → Efekty → Wyjście(a)

Zauważ jednak, że w wierszu poleceń SoX, pozycje Wyjść(i) i Efekty
są zamieniane z pokazanym przed chwilą przepływem logicznym. Zwróć również uwagę, że podczas gdy opcje odnoszące się do
do plików są umieszczane przed ich nazwą pliku, odwrotnie jest w przypadku efektów.
Aby pokazać, jak to działa w praktyce, oto kilka przykładów tego, jak może wyglądać SoX
używany. Prosty
sox recital.au recital.wav
tłumaczy plik audio w formacie Sun AU na plik Microsoft WAV, podczas gdy
sox recital.au -b 16 recital.wav kanały 1 tempo 16k zanikanie 3 norm
wykonuje translację tego samego formatu, ale stosuje również cztery efekty (down-mix do jednego)
kanał, zmiana częstotliwości próbkowania, zanikanie, nomalizacja) i przechowuje wynik w głębi bitowej
16.
sox -r 16k -e podpisany -b 8 -c 1 notatka głosowa.raw notatka głosowa.wav
konwertuje `surowy' (aka `headerless') dźwięk na samoopisujący się format pliku,
sox slow.aiff fixed.aiff prędkość 1.027
dostosowuje prędkość dźwięku,
sox krótki.wav długi.wav dłuższy.wav
łączy dwa pliki audio i
sox -m muzyka.mp3 głos.wav mieszane.flac
miksuje ze sobą dwa pliki audio.
graj na basie "The Moonbeams/Greatest/*.ogg" +3
odtwarza kolekcję plików audio z efektem podbicia basów,
graj -n -c1 synth grzech %-12 grzech %-9 grzech %-5 grzech %-2 zanik h 0.1 1 0.1
gra zsyntetyzowany akord „a-moll septymowy” z dźwiękiem organów,
rec -c 2 radio.aiff trim 0 30:00
nagrywa pół godziny dźwięku stereo i
play -q take1.aiff & rec -M take1.aiff take1-dub.aiff
(z powłoką POSIX i obsługiwanym przez sprzęt) rejestruje nową ścieżkę w trybie wielościeżkowym
nagranie. Wreszcie,
rec -r 44100 -b 16 -s -p cisza 1 0.50 0.1% 1 10:00 0.1% | \
sox -p song.ogg cisza 1 0.50 0.1% 1 2.0 0.1% : \
nowy plik : uruchom ponownie
nagrywa strumień audio, taki jak LP/kaseta i dzieli się na wiele plików audio w
punkty z 2 sekundami ciszy. Ponadto nie rozpocznie nagrywania, dopóki nie wykryje
dźwięk jest odtwarzany i zatrzymuje się po 10 minutach ciszy.

NB Powyższe to tylko przegląd możliwości SoX; szczegółowe wyjaśnienia, jak
posługiwać się cała kolekcja Parametry SoX, formaty plików i efekty można znaleźć poniżej w tej instrukcji, w
soxformat(7) i w soxi(1).

filet Format: rodzaje
SoX może pracować z plikami audio „samoopisującymi się” i „surowymi”. formaty „samoopisujące się”
(np. WAV, FLAC, MP3) mają nagłówek, który całkowicie opisuje sygnał i kodowanie
atrybuty danych dźwiękowych, które następują. Formaty „surowe” lub „bez nagłówka” nie zawierają
te informacje, więc ich charakterystyka dźwiękowa musi być opisana na SoX
wiersza poleceń lub wywnioskowane z tych z pliku wejściowego.

Poniższe cztery cechy są używane do opisania formatu danych audio, takiego, że:
można go przetwarzać za pomocą SoX:

próbna stawka
Częstotliwość próbkowania w próbkach na sekundę ('Hertz' lub 'Hz'). Telefonia cyfrowa
tradycyjnie używa częstotliwości próbkowania 8000 Hz (8 kHz), choć obecnie 16, a nawet
32 kHz stają się coraz bardziej powszechne. Płyty kompaktowe audio wykorzystują 44100 Hz (44.1 kHz).
Cyfrowa taśma audio i wiele systemów komputerowych używa 48 kHz. Profesjonalne systemy audio
często używają 96 kHz.

wielkość próbki
Liczba bitów używanych do przechowywania każdej próbki. Obecnie powszechnie używany jest 16-bit.
8-bitowy był popularny we wczesnych dniach komputerowego audio. 24-bitowy jest używany w
profesjonalna arena audio. Stosowane są również inne rozmiary.

kodowanie danych
Sposób, w jaki każda próbka audio jest reprezentowana (lub „kodowana”). Niektóre kodowania
mają warianty z różnymi kolejnościami bajtów lub kolejnością bitów. Niektórzy kompresują
dane audio, dzięki czemu przechowywane dane audio zajmują mniej miejsca (tj. miejsce na dysku lub
szerokość pasma transmisji) niż pozostałe parametry formatu i liczba próbek
oznaczałoby. Powszechnie używane typy kodowania obejmują zmiennoprzecinkowe, μ-law, ADPCM,
sygnowane liczby całkowite PCM, MP3 i FLAC.

kanały
Liczba kanałów audio zawartych w pliku. Jeden („mono”) i dwa
("stereo") są szeroko stosowane. Dźwięk „Dźwięk przestrzenny” zazwyczaj zawiera sześć lub więcej
Kanały.

Termin „przepływność” jest miarą ilości pamięci zajmowanej przez zakodowany dźwięk
sygnał w jednostce czasu. Może zależeć od wszystkich powyższych i jest zwykle oznaczany jako
liczba kilobitów na sekundę (kbps). Sygnał telefonii A-law ma przepływność 64
kb/s. Muzyka stereo zakodowana w formacie MP3 ma zazwyczaj przepływność 128-196 kb/s. zakodowany w formacie FLAC
muzyka stereo ma zazwyczaj przepływność 550-760 kb/s.

Większość samoopisujących się formatów pozwala także na osadzanie „komentarzy” tekstowych w pliku, który:
może być użyty do pewnego opisania dźwięku, np. muzyki, tytułu, autora itp.

Jednym z ważnych zastosowań komentarzy do plików audio jest przekazanie informacji o 'Replay Gain'. SoX
obsługuje stosowanie informacji Replay Gain, ale nie generuje ich. Pamiętaj, że domyślnie
SoX kopiuje komentarze plików wejściowych do plików wyjściowych obsługujących komentarze, więc pliki wyjściowe mogą
zawierają informacje Replay Gain, jeśli niektóre były obecne w pliku wejściowym. W takim przypadku, jeśli
wykonano cokolwiek innego niż prostą konwersję formatu, a następnie plik wyjściowy Replay
Uzyskane informacje mogą być nieprawidłowe, dlatego należy je ponownie obliczyć za pomocą narzędzia, które:
obsługuje to (nie SoX).

soxi(1) polecenie może służyć do wyświetlania informacji z nagłówków plików audio.

Określanie & Oprawa filet Format:
Istnieje kilka mechanizmów dostępnych dla SoX do określenia lub ustawienia formatu
cechy pliku audio. W zależności od okoliczności, indywidualna
cechy mogą być określane lub ustalane za pomocą różnych mechanizmów.

Aby określić format pliku wejściowego, SoX użyje, w kolejności pierwszeństwa i jako
podane lub dostępne:

1. Opcje formatu wiersza poleceń.

2. Zawartość nagłówka pliku.

3. Rozszerzenie nazwy pliku.

Aby ustawić format pliku wyjściowego, SoX użyje, w kolejności i zgodnie z podanymi lub
dostępne:

1. Opcje formatu wiersza poleceń.

2. Rozszerzenie nazwy pliku.

3. Charakterystyka formatu pliku wejściowego lub najbliższy obsługiwany przez wyjście
Typ pliku.

W przypadku wszystkich plików SoX zakończy działanie z błędem, jeśli nie można określić typu pliku. Komenda-
Aby rozwiązać problem, konieczne może być dodanie lub zmiana opcji formatu wiersza.

Gra & Nagranie Audio
grać oraz rec dostępne są polecenia, dzięki czemu podstawowe odtwarzanie i nagrywanie jest tak proste, jak
odtwórz istniejący-plik.wav
oraz
rec nowy-plik.wav
Te dwa polecenia są funkcjonalnie równoważne z
sox istniejący-plik.wav -d
oraz
sox -d nowy-plik.wav
Oczywiście do poleceń można dodać dalsze opcje i efekty (opisane poniżej)
w obu formach.

* * *

Niektóre systemy zapewniają więcej niż jeden typ sterownika audio (zgodnego z SoX), np. ALSA i OSS,
lub SUNAU & AO. Systemy mogą również mieć więcej niż jedno urządzenie audio (aka `karta dźwiękowa').
Jeśli w SoX wbudowano więcej niż jeden sterownik audio, a domyślnie wybrany przez SoX
gdy nagrywanie lub odtwarzanie nie jest tym, czego chcemy, wtedy STEROWNIK AUDIO środowisko
zmiennej można użyć do zastąpienia wartości domyślnej. Na przykład (na wielu systemach):
ustaw AUDIODRIVER=oss
bawić się ...
AUDIODEW zmienna środowiskowa może być użyta do zastąpienia domyślnego urządzenia audio, np.
ustaw ODCH.AUDIO=/dev/dsp2
bawić się ...
sox ... -to oss
or
ustaw AUDIODEV=hw:soundwave,1,2
bawić się ...
sox... -t też
Zwróć uwagę, że sposób ustawiania zmiennych środowiskowych różni się w zależności od systemu - dla niektórych
konkretne przykłady, patrz `SOX_OPTS' poniżej.

Podczas odtwarzania pliku z częstotliwością próbkowania, która nie jest obsługiwana przez urządzenie wyjściowe audio,
SoX automatycznie wywoła stawka efekt, aby wykonać niezbędną częstotliwość próbkowania
konwersja. W celu zapewnienia zgodności ze starym sprzętem domyślnie stawka poziom jakości jest ustawiony na
„niski”. Można to zmienić, wyraźnie określając stawka efekt z innym
poziom jakości, np.
graj ... oceń -m
lub przy użyciu --argument-odtwarzania opcja (patrz poniżej).

* * *

W niektórych systemach SoX umożliwia regulację głośności odtwarzania dźwięku podczas używania grać. Gdzie
obsługiwane, osiąga się to poprzez stukanie klawiszy `v' i `V' podczas odtwarzania.

Aby pomóc w ustawieniu odpowiedniego poziomu nagrywania, SoX zawiera miernik poziomu szczytowego, który może:
być wywoływane (przed dokonaniem właściwego nagrania) w następujący sposób:
rec -rz
Poziom nagrywania należy dostosować (za pomocą dostarczonego przez system programu miksera, a nie SoX)
tak, że licznik jest at większość sporadycznie w pełnej skali i nigdy „na czerwono” (an
wyświetlany jest wykrzyknik). Zobacz też -S poniżej.

Dokładność
Wiele formatów plików, które kompresują dźwięk, odrzuca część informacji o sygnale dźwiękowym, podczas gdy
robiąc tak. Konwersja do takiego formatu, a następnie ponowna konwersja nie spowoduje
dokładna kopia oryginalnego dźwięku. Tak jest w przypadku wielu formatów używanych w telefonii
(np. A-law, GSM), gdzie niska przepustowość sygnału jest ważniejsza niż wysoka wierność dźwięku,
oraz dla wielu formatów używanych w przenośnych odtwarzaczach muzycznych (np. MP3, Vorbis) tam, gdzie jest to właściwe
wierność można zachować nawet przy dużych stopniach kompresji, które są potrzebne do wykonania
przenośne odtwarzacze praktyczne.

Formaty, które odrzucają informacje o sygnale dźwiękowym, nazywane są „stratnymi”. Formaty, które nie są
zwany „bezstratnym”. Termin „jakość” jest używany jako miara tego, jak blisko oryginału
sygnał audio może być odtwarzany w formacie stratnym.

Konwersja plików audio za pomocą SoX jest bezstratna, gdy tylko może, tj. gdy nie używasz stratnego
kompresja, gdy nie zmniejsza się częstotliwości próbkowania lub liczby kanałów oraz gdy
liczba bitów użytych w formacie docelowym jest nie mniejsza niż w formacie źródłowym. Np
konwersja z 8-bitowego formatu PCM do 16-bitowego formatu PCM jest bezstratna, ale konwersja z
8-bitowy format PCM do (8-bitowego) A-law nie jest.

NB SoX konwertuje wszystkie pliki audio do wewnętrznego nieskompresowanego formatu przed wykonaniem
dowolne przetwarzanie dźwięku. Oznacza to, że manipulowanie plikiem, który jest przechowywany w formacie stratnym
może spowodować dalsze straty w wierności dźwięku. Np. z
sox długi.mp3 krótki.mp3 przycinanie 10
SoX najpierw dekompresuje wejściowy plik MP3, a następnie stosuje trym efekt i wreszcie
tworzy wyjściowy plik MP3 poprzez ponowne skompresowanie dźwięku - z możliwą redukcją w
wierność powyżej tej, która miała miejsce podczas tworzenia pliku wejściowego. Stąd, jeśli co jest
ostatecznie pożądany jest dźwięk skompresowany stratnie, zdecydowanie zaleca się wykonanie wszystkich
przetwarzanie dźwięku przy użyciu bezstratnych formatów plików, a następnie konwersja do formatu stratnego tylko w
ostatni etap.

NB Zastosowanie wielu efektów za pomocą jednego wywołania SoX generalnie spowoduje:
dokładniejsze wyniki niż te uzyskane przy użyciu wielu wywołań SoX.

Roztrząsanie
Dithering to technika używana do maksymalizacji zakresu dynamicznego dźwięku przechowywanego w
konkretna głębia bitowa. Wszelkie zniekształcenia wprowadzone przez kwantyzację są dekorelowane przez dodanie
niewielka ilość białego szumu w sygnale. W większości przypadków SoX może określić, czy
wybrane przetwarzanie wymaga ditheringu i doda je podczas formatowania wyjścia, jeśli
właściwe.

W szczególności, domyślnie SoX automatycznie dodaje dithering TPDF, gdy wyjściowa głębia bitowa wynosi
mniej niż 24 i którekolwiek z poniższych jest prawdziwe:

· Redukcja głębi bitowej została wyraźnie określona za pomocą opcji wiersza poleceń

· format pliku wyjściowego obsługuje tylko głębię bitową mniejszą niż w pliku wejściowym
format

· efekt zwiększył efektywną głębię bitową w wewnętrznym łańcuchu przetwarzania

Na przykład regulacja głośności za pomocą vol 0.25 wymaga dwóch dodatkowych bitów, w których
bezstratnie przechowują jego wyniki (ponieważ 0.25 dziesiętnie równa się 0.01 binarnie). Więc jeśli dane wejściowe
głębia bitowa pliku wynosi 16, to wewnętrzna reprezentacja SoX będzie wykorzystywać 18 bitów później
przetwarzanie tej zmiany głośności. Aby przechowywać dane wyjściowe na tej samej głębokości, co
wejście, dithering służy do usuwania dodatkowych bitów.

Użyj -V opcja, aby zobaczyć, jakie przetwarzanie SoX automatycznie dodał. ten -D opcją może być
dane do zastąpienia automatycznego ditheringu. Aby ręcznie wywołać dithering (np. aby wybrać
krzywa kształtująca szum), patrz dither efekt.

Strzyżenie
Obcinanie to zniekształcenie, które występuje, gdy poziom sygnału audio (lub „głośność”) przekracza
zakres wybranej reprezentacji. W większości przypadków obcinanie jest niepożądane i dlatego powinno
być skorygowane poprzez dostosowanie poziomu przed punktem (w łańcuchu przetwarzania), w którym
Pojawia się.

W SoX może wystąpić przycinanie, jak można się spodziewać, podczas korzystania z vol or zdobyć efekty do
zwiększyć głośność dźwięku. Przycinanie może również wystąpić z wieloma innymi efektami, gdy
konwertując jeden format na inny, a nawet po prostu odtwarzając dźwięk.

Odtwarzanie pliku audio często wiąże się z ponownym próbkowaniem, a przetwarzanie przez komponenty analogowe może:
wprowadzić małe przesunięcie DC i/lub wzmocnienie, z których wszystkie mogą powodować zniekształcenia, jeśli
poziom sygnału audio był początkowo zbyt blisko punktu przecięcia.

Z tych powodów zwykle upewniamy się, że poziom sygnału pliku audio ma trochę
`zapasu', tj. nie przekracza określonego poziomu poniżej maksymalnego możliwego poziomu
dla danej reprezentacji. Niektóre organy normalizacyjne zalecają nawet 9dB zapasu,
ale w większości przypadków wystarczy 3 dB (≈ 70% liniowe). Zauważ, że ta mądrość wydaje się być
zagubiony we współczesnej produkcji muzycznej; w rzeczywistości wiele płyt CD, MP3 itp. jest teraz opanowanych na różnych poziomach
powyżej 0dBFS, tj. dźwięk jest obcinany w momencie dostarczenia.

SoX-y stan oraz statystyki Efekty mogą pomóc w określeniu poziomu sygnału w pliku audio.
zdobyć or vol efekt może być użyty, aby zapobiec przycinaniu, np.
sox dull.wav bright.wav wzmocnienie -6 tony wysokie +6
gwarantuje, że podbicie wysokich tonów nie będzie się przycinać.

Jeśli obcinanie wystąpi w dowolnym momencie podczas przetwarzania, SoX wyświetli komunikat ostrzegawczy, aby
ten efekt.

Zobacz też -G i zdobyć oraz norma efekty.

Wkład filet łącząc
Łącznik wejściowy SoX można skonfigurować (patrz OPCJE poniżej), aby łączyć wiele plików za pomocą
dowolna z następujących metod: 'concatenate', 'sequence', 'mix', 'mix-power', 'merge' lub
„pomnóż”. Domyślną metodą jest `sequence' dla graći `konkatenuj' dla rec oraz Sox.

W przypadku wszystkich metod innych niż `sequence' wiele plików wejściowych musi mieć to samo próbkowanie
wskaźnik. W razie potrzeby można użyć oddzielnych wywołań SoX, aby dostosować częstotliwość próbkowania
przed połączeniem.

Jeśli wybrano metodę łączenia `concatenate' (zazwyczaj będzie to domyślnie), to
pliki wejściowe również muszą mieć taką samą liczbę kanałów. Dźwięk z każdego wejścia
zostaną połączone w kolejności podanej w celu utworzenia pliku wyjściowego.

Metoda łączenia „sekwencji” jest wybierana automatycznie dla grać. To jest podobne do
`concatenate' w tym sensie, że dźwięk z każdego pliku wejściowego jest przesyłany szeregowo do pliku wyjściowego.
Jednak tutaj plik wyjściowy może zostać zamknięty i ponownie otwarty przy odpowiednim przejściu
między plikami wejściowymi. Może to być właśnie to, co jest potrzebne przy wysyłaniu różnych typów dźwięku
do urządzenia wyjściowego, ale generalnie nie jest przydatne, gdy wyjściem jest normalny plik.

Jeśli wybrano metodę łączenia `mix' lub `mix-power', wtedy dwa lub więcej danych wejściowych
pliki muszą być podane i zostaną zmieszane razem w celu utworzenia pliku wyjściowego. Liczba
kanały w każdym pliku wejściowym nie muszą być takie same, ale SoX wyświetli ostrzeżenie, jeśli są
nie, a niektóre kanały w pliku wyjściowym nie będą zawierać dźwięku z każdego pliku wejściowego. A
zmiksowany plik audio nie może być rozmiksowany bez odniesienia do oryginalnych plików wejściowych.

Jeśli wybrano metodę łączenia `merge', należy podać dwa lub więcej plików wejściowych i
zostaną połączone w plik wyjściowy. Liczba kanałów w każdym wejściu
plik nie musi być taki sam. Połączony plik audio zawiera wszystkie kanały ze wszystkich
pliki wejściowe. Rozłączenie jest możliwe przy użyciu wielu wywołań SoX z remix
efekt. Na przykład dwa pliki mono można połączyć w jeden plik stereo. Pierwszy
a drugie pliki mono staną się lewym i prawym kanałem pliku stereo.

Metoda łączenia `multiply' mnoży przykładowe wartości odpowiednich kanałów
(traktowane jako liczby w przedziale od -1 do +1). Jeśli liczba kanałów na wejściu
pliki nie są takie same, brakujące kanały są uważane za zawierające same zero.

Łącząc pliki wejściowe, SoX stosuje określone efekty (w tym na przykład
vol efekt regulacji głośności) po połączeniu dźwięku. Jednak często jest
przydatne, aby móc ustawić głośność (tj. „zrównoważenie”) wejść indywidualnie, przed
następuje łączenie.

W przypadku wszystkich metod łączenia, regulację głośności pliku wejściowego można wprowadzić ręcznie za pomocą -v
opcja (poniżej), którą można podać dla jednego lub więcej plików wejściowych. Jeśli jest podany tylko za
niektóre pliki wejściowe, a inne nie otrzymują regulacji głośności. W niektórych
W pewnych okolicznościach można zastosować automatyczną regulację głośności (patrz poniżej).

-V Opcja (poniżej) może być użyta do wyświetlenia korekt głośności pliku wejściowego, które zostały
wybrane (ręcznie lub automatycznie).

Podczas miksowania plików wejściowych należy wziąć pod uwagę pewne specjalne kwestie:

W przeciwieństwie do innych metod, łączenie `mix' może potencjalnie powodować obcinanie
sumator, jeśli nie jest wykonywane równoważenie. W takim przypadku, jeśli ręczna regulacja głośności nie jest
biorąc pod uwagę, SoX spróbuje zapewnić, że przycinanie nie wystąpi, automatycznie dostosowując
głośność (amplituda) każdego sygnału wejściowego przez współczynnik ¹/n, gdzie n to liczba wejść
pliki. Jeśli w wyniku tego dźwięk jest zbyt cichy lub w inny sposób niezbalansowany, wówczas wejście
woluminy plików można ustawić ręcznie, jak opisano powyżej. Używając norma wpływ na miks to
inna alternatywa.

Jeśli zmiksowany dźwięk wydaje się wystarczająco głośny w niektórych punktach, ale zbyt cichy w innych, to zakres dynamiki
należy zastosować kompresję, aby to naprawić - patrz towarzysz efekt.

W przypadku metody łączenia „mix-power” mieszana objętość jest w przybliżeniu równa tej z
jeden z sygnałów wejściowych. Osiąga się to poprzez równoważenie przy użyciu współczynnika ¹/√n zamiast
¹/n. Zwróć uwagę, że ten czynnik równoważący nie gwarantuje, że przycinanie nie wystąpi, ale
liczba klipów będzie zwykle niewielka, a wynikające z niej zniekształcenia są zazwyczaj
niedostrzegalny.

Wydajność Akta
Domyślnym zachowaniem SoX jest wzięcie jednego lub więcej plików wejściowych i zapisanie ich w jednym
plik wyjściowy.

To zachowanie można zmienić, określając pseudoefekt `nowy plik' w ramach efektów
lista. SoX wejdzie wtedy w tryb wielu wyjść.

W trybie wielu wyjść nowy plik jest tworzony, gdy efekty poprzedzające `nowy plik'
wskazać, że zostały wykonane. Następnie uruchamiany jest łańcuch efektów wymieniony po `newfile' i
jego dane wyjściowe są zapisywane w nowym pliku.

W trybie wielu wyjść unikalny numer zostanie automatycznie dodany na końcu wszystkich
nazwy plików. Jeśli nazwa pliku ma rozszerzenie, numer jest wstawiany przed
rozbudowa. To zachowanie można dostosować, umieszczając %n w dowolnym miejscu w nazwie pliku
gdzie numer powinien być podstawiony. Opcjonalną liczbę można umieścić po % do
wskazać minimalną stałą szerokość numeru.

Tryb wielu wyjść nie jest zbyt przydatny, chyba że efekt, który zatrzyma łańcuch efektów
Early jest określone przed `nowyplik'. Jeśli koniec pliku zostanie osiągnięty przed efektami
łańcuch zatrzymuje się, wtedy żaden nowy plik nie zostanie utworzony, ponieważ byłby pusty.

Poniżej znajduje się przykład podziału pierwszych 60 sekund pliku wejściowego na dwie części 30
drugie pliki i ignorując resztę.
sox song.wav dzwonek% 1n.wav przycinanie 0 30 : nowy plik : przycinanie 0 30

Zatrzymanie SoX
Zwykle SoX kończy przetwarzanie i kończy działanie automatycznie po przeczytaniu wszystkiego
dostępne dane audio z plików wejściowych.

W razie potrzeby można go zakończyć wcześniej, wysyłając sygnał przerwania do procesu
(zwykle przez naciśnięcie klawisza przerwania na klawiaturze, którym zwykle jest Ctrl-C). To jest
naturalne wymaganie w pewnych okolicznościach, np. podczas korzystania z SoX do nagrywania. Notatka
że podczas używania SoX do odtwarzania wielu plików, Ctrl-C zachowuje się nieco inaczej: naciśnięcie
raz powoduje, że SoX przechodzi do następnego pliku; naciśnięcie go dwa razy w krótkich odstępach czasu powoduje
SoX do wyjścia.

Inną opcją wcześniejszego zatrzymania przetwarzania jest użycie efektu, który ma okres czasu lub
liczba próbek w celu określenia punktu zatrzymania. Efekt przycinania jest tego przykładem. Pewnego razu
wszystkie łańcuchy efektów zostały zatrzymane, więc SoX również się zatrzyma.

NAZWY PLIKÓW


Nazwy plików mogą być prostymi nazwami plików, bezwzględnymi lub względnymi nazwami ścieżek lub adresami URL (pliki wejściowe
tylko). Pamiętaj, że obsługa adresów URL wymaga tego wget(1) jest dostępny.

Uwaga: Nadanie SoXowi nazwy pliku wejściowego lub wyjściowego, która jest taka sama jak nazwa efektu SoX, spowoduje
nie działa, ponieważ SoX potraktuje to jako specyfikację efektu. Jedyne obejście tego
jest unikanie takich nazw plików. Generalnie nie jest to trudne, ponieważ większość nazw plików audio
mieć nazwę pliku `rozszerzenie', podczas gdy nazwy-efektów nie.

Specjalny Nazwy plików
Następujące specjalne nazwy plików mogą być używane w pewnych okolicznościach zamiast normalnego
nazwa pliku w wierszu poleceń:

- SoX może być używany w prostych operacjach potokowych przy użyciu specjalnej nazwy pliku `-'
co, jeśli zostanie użyte jako nazwa pliku wejściowego, spowoduje, że SoX odczyta dane audio z
`standard input' (stdin), i które, jeśli zostanie użyte jako nazwa pliku wyjściowego, spowoduje SoX
wyśle ​​dane audio na `standardowe wyjście' (stdout). Pamiętaj, że podczas korzystania z tego
opcja dla pliku wyjściowego, a czasami, gdy jest używana dla pliku wejściowego,
typ pliku (patrz -t poniżej) należy również podać.

"|program [Opcje] ..."
Może być użyte zamiast nazwy pliku wejściowego do określenia danego programu
standardowe wyjście (stdout) może być używane jako plik wejściowy. w odróżnieniu - (powyżej), może to być
używany do kilku wejść do jednego polecenia SoX. Na przykład, jeśli `genw' generuje mono
Sygnały sformatowane w formacie WAV na standardowe wyjście, a następnie następujące polecenie sprawia, że
plik stereo z dwóch wygenerowanych sygnałów:
sox -M "|genw --imd -" "|genw --thd -" out.wav
W przypadku dźwięku bez nagłówka (surowego), -t (i być może inne opcje formatu) będą musiały być
podane, poprzedzające polecenie wejściowe.

"nazwa-pliku wieloznacznego"
Określa, że ​​nazwa pliku `globbing' (dopasowywanie symboli wieloznacznych) powinna być wykonywana przez SoX
zamiast przez powłokę. Pozwala to na zastosowanie pojedynczego zestawu opcji pliku
grupa plików. Na przykład, jeśli bieżący katalog zawiera trzy `vox'
pliki, plik1.vox, plik2.vox i plik3.vox, a następnie
play --ocena 6k *.vox
zostanie rozszerzona przez `powłokę' (w większości środowisk) do
play --rate 6k plik1.vox plik2.vox plik3.vox
który potraktuje tylko pierwszy plik vox jako mający częstotliwość próbkowania 6k. Z
play --rate 6k "*.vox"
podana opcja częstotliwości próbkowania zostanie zastosowana do wszystkich trzech plików vox.

-p, --sox-fajka
Można to wykorzystać zamiast nazwy pliku wyjściowego, aby określić, że polecenie SoX
powinno być używane jak w potoku wejściowym do innego polecenia SoX. Na przykład polecenie:
odtwórz "|sox -n -p synth 2" "|sox -n -p synth 2 tremolo 10" stat
odtwarza dwa „pliki” po kolei, każdy z różnymi efektami.

-p jest w rzeczywistości aliasem dla `-t Sox -'.

-d, --domyślne urządzenie
Może być użyte zamiast nazwy pliku wejściowego lub wyjściowego, aby określić, że
ma być używane domyślne urządzenie audio (jeśli zostało wbudowane w SoX). To jest podobne
do wywoływania rec or grać (jak opisano powyżej).

-n, --zero
Może być użyte zamiast nazwy pliku wejściowego lub wyjściowego, aby określić, że `null
plik”. Zauważ, że tutaj `null file' odnosi się do specyficznego dla SoX-a
mechanizm i nie jest powiązany z żadnym mechanizmem systemu operacyjnego o podobnej nazwie.

Używanie pustego pliku do wprowadzania dźwięku jest równoważne używaniu normalnego pliku audio, który
zawiera nieskończoną ilość ciszy i jako taka nie jest ogólnie przydatna, chyba że
używany z efektem, który określa skończoną długość czasu (np. trym or synth).

Używanie pustego pliku do wyprowadzania dźwięku sprowadza się do odrzucenia dźwięku i jest przydatne
głównie z efektami, które zamiast wpływać na dźwięk generują informacje o dźwięku
to (takie jak hałasprof or stan).

Częstotliwość próbkowania związana z pustym plikiem domyślnie wynosi 48 kHz, ale tak jak w przypadku a
normalny plik, można to zmienić w razie potrzeby za pomocą opcji formatu wiersza poleceń
(Patrz niżej).

Utrzymany filet & Audio Urządzenie rodzaje
See soxformat(7) lista i opis obsługiwanych formatów plików i urządzenia audio
sterowniki.

OPCJE


Globalny Opcje
Te opcje można określić w wierszu poleceń w dowolnym momencie przed pierwszym efektem
nazwa.

SOX_OPTS zmienna środowiskowa może być użyta do podania alternatywnych wartości domyślnych dla
Globalne opcje SoX. Na przykład:
SOX_OPTS = "--buffer 20000 --play-rate-arg -hs --temp /mnt/temp"
Pamiętaj, że ustawienie SOX_OPTS może potencjalnie spowodować niepożądane zmiany w zachowaniu
skrypty lub inne programy wywołujące SoX. SOX_OPTS najlepiej używać do rzeczy (takich
jak w podanym przykładzie), które odzwierciedlają środowisko, w którym działa SoX. Włączanie
opcje takie jak --bez-głowy jako domyślne może być lepiej obsługiwane przy użyciu aliasu powłoki, ponieważ
alias powłoki nie wpłynie na działanie skryptów itp.

Jednym ze sposobów, aby upewnić się, że SOX_OPTS nie ma wpływu na skrypt, jest wyczyszczenie SOX_OPTS w
początek skryptu, ale to oczywiście traci korzyść z SOX_OPTS niosącego trochę
opcje domyślne dla całego systemu. Alternatywnym podejściem jest jawne wywołanie SoX za pomocą
domyślne wartości opcji, np.
SOX_OPTS = "-V -- bez truchtu"
...
sox -V2 --clobber $wejście $wyjście ...
Zauważ, że sposób ustawiania zmiennych środowiskowych różni się w zależności od systemu. Oto kilka
przykłady:

Uniksowy atak:
eksportuj SOX_OPTS="-V --no-clobber"
Uniksowy csh:
setenv SOX_OPTS "-V --no-clobber"
MS-DOS/MS-Windows:
ustaw SOX_OPTS=-V --no-clobber
MS-Windows GUI: przez Panel sterowania : System : Zaawansowane : Zmienne środowiskowe

Mac OS X GUI: zapoznaj się z dokumentem QA1067 z pytaniami technicznymi firmy Apple.

--bufor BAJTÓW, --bufor-wejściowy BAJTÓW
Ustaw rozmiar w bajtach buforów używanych do przetwarzania dźwięku (domyślnie 8192).
--bufor dotyczy przetwarzania danych wejściowych, efektów i wyników; --bufor-wejściowy dotyczy
tylko do przetwarzania danych wejściowych (dla których to nadpisuje --bufor jeśli oba są podane).

Należy pamiętać, że duże wartości dla --bufor spowoduje spowolnienie reakcji SoX
żądać zakończenia lub pominięcia bieżącego pliku wejściowego.

--sprać
Nie pytaj przed nadpisaniem istniejącego pliku o tej samej nazwie, co podana
dla pliku wyjściowego. To jest zachowanie domyślne.

--łączyć powiązać|łączyć|mieszać|moc miksowania|mnożyć|sekwencja
Wybierz metodę łączenia plików wejściowych; w przypadku niektórych z nich krótkie opcje to
dostępne: -m wybiera `mix', -M wybiera `scal', a -T wybiera `mnożenie'.

See Wkład filet łącząc powyżej opis różnych kombinacji
Metody.

-D, --bez wahania
Wyłącz automatyczne dithering - patrz `Dithering' powyżej. Przykład, dlaczego może to być?
czasami przydatne jest, jeśli plik został przekonwertowany z 16 na 24 bity za pomocą
zamiar wykonania na nim jakiegoś przetwarzania, ale w rzeczywistości żadne przetwarzanie nie jest potrzebne po
wszystko i oryginalny 16-bitowy plik został utracony, a więc, ściśle mówiąc, bez wahania
jest potrzebne, jeśli konwertujesz plik z powrotem do 16-bitowego. Zobacz także statystyki efekt na jak
aby określić rzeczywistą głębię bitową dźwięku w pliku.

--plik-efektów NAZWA PLIKU
Użyj FILENAME, aby uzyskać wszystkie efekty i ich argumenty. Plik jest analizowany tak, jakby
wartości zostały określone w wierszu poleceń. Nowa linia może być użyta w miejsce
specjalny : znacznik do oddzielenia łańcuchów efektów. Dla wygody takie znaczniki w
koniec pliku jest zwykle ignorowany; jeśli chcesz podać puste ostatnie
łańcuch efektów, użyj wyraźnego : sam w ostatnim wierszu pliku. Ten
Opcja powoduje odrzucenie wszystkich efektów określonych w wierszu poleceń.

-G, --strażnik
Automatycznie wywołaj zdobyć efekt ochrony przed obcinaniem. Np
sox -G plik wejściowy -b 16 współczynnik plików wyjściowych 44100 roztrząsanie -s
jest skrótem od
sox plik wejściowy -b 16 plik wyjściowy wzmocnienie -h szybkość 44100 wzmocnienie -rh roztrząsanie -s
Zobacz też -V, --norma, i zdobyć efekt.

-h, --help
Pokaż numer wersji i informacje o użytkowaniu.

--pomoc-efekt IMIĘ
Pokaż informacje o użyciu określonego efektu. Imię cała kolekcja może być użyty do pokazania
użycie na wszystkich efektach.

--format-pomocy IMIĘ
Pokaż informacje o określonym formacie pliku. Imię cała kolekcja może być użyty do pokazania
informacje o wszystkich formatach.

--ja, --informacje
Tylko jeśli podany jako pierwszy parametr do Sox, zachowuj się jak soxi(1).

-m|-M Równoważny --łączyć mieszać oraz --łączyć łączyć, Odpowiednio.

--magia
Jeśli SoX został zbudowany z opcjonalną biblioteką `libmagic', to ta opcja może być
podane, aby umożliwić jego użycie w wykrywaniu typów plików audio.

--wielowątkowy | --jednowątkowy
Domyślnie SoX jest 'jednowątkowy'. Jeśli --wielowątkowy podana jest opcja
jednak wtedy SoX przetworzy kanały audio dla większości efektów wielokanałowych w
równolegle na architekturach hiperwątkowych/wielordzeniowych. Może to ograniczyć przetwarzanie
czas, choć czasami może być konieczne użycie tej opcji w połączeniu z
większy rozmiar bufora niż domyślny, aby uzyskać jakiekolwiek korzyści z wielowątkowości
przetwarzanie (np. 131072; patrz --bufor powyżej).

--bez-głowy
Pytaj przed nadpisaniem istniejącego pliku o tej samej nazwie, jak ta podana dla
plik wyjściowy.

NB Niezamierzone nadpisanie pliku jest łatwiejsze niż mogłoby się wydawać, bo
na przykład, jeśli przypadkowo wejdziesz
sox plik1 plik2 efekt1 efekt2 ...
kiedy tak naprawdę miałeś na myśli
odtwórz plik1 plik2 efekt1 efekt2 ...
wtedy bez tej opcji plik2 zostanie nadpisany. Dlatego użycie tej opcji jest
Zalecana. SOX_OPTS (powyżej), alias powłoki, skrypt lub plik wsadowy może być
odpowiedni sposób trwałego jej włączenia.

--norma[=poziom dB]
Automatycznie wywołaj zdobyć efekt ochrony przed przycinaniem i normalizacji
audio. Np
sox --norm plik wejściowy -b 16 wskaźnik pliku wyjściowego 44100 roztrząsanie -s
jest skrótem od
sox plik wejściowy -b 16 plik wyjściowy wzmocnienie -h szybkość 44100 wzmocnienie -nh roztrząsanie -s
Opcjonalnie dźwięk można znormalizować do określonego poziomu (zwykle) poniżej 0 dBFS:
sox --norm=-3 plik wejściowy plik wyjściowy

Zobacz też -V, -G, i zdobyć efekt.

--argument-odtwarzania ARG
Wybiera opcję jakości, która ma być użyta, gdy efekt `rate' jest wywoływany automatycznie
podczas odtwarzania dźwięku. Ta opcja jest zwykle ustawiana za pomocą SOX_OPTS środowisko
zmienna (patrz wyżej).

--wątek gnuplot|oktawa|poza
Jeśli nie jest ustawiony na poza (domyślnie jeśli --wątek nie podano), uruchom w trybie, który może być
używany, w połączeniu z programem gnuplot lub programem GNU Octave, do wspomagania
z wyborem i konfiguracją wielu funkcji transferu opartych
efekty. Dla pierwszego podanego efektu, który obsługuje wybrany program kreślenia,
SoX wypisze polecenia, aby wykreślić funkcję transferu efektu, a następnie wyjdzie
bez faktycznego przetwarzania dźwięku. Np
sox --plot oktawowy plik-wejściowy -n highpass 1320 > highpass.plt
oktawa highpass.plt

-q, --brak postępu
Uruchom w trybie cichym, gdy SoX inaczej by tego nie zrobił. Jest to przeciwieństwo
-S opcja.

-R Uruchom w trybie „powtarzalnym”. Gdy ta opcja jest podana, w stosownych przypadkach, SoX będzie
osadzić stałą sygnaturę czasową w pliku wyjściowym (np AIFF) i będzie `seed' pseudo
generatory liczb losowych (np. dither) ze stałą liczbą, zapewniając w ten sposób, że
kolejne wywołania SoX z tymi samymi danymi wejściowymi i tymi samymi parametrami dają
to samo wyjście.

--wzmocnienie powtórki śledzić|album|poza
Wybierz, czy zastosować korektę wzmocnienia odtwarzania do plików wejściowych. Domyślny
is poza dla Sox oraz rec, album dla grać gdzie (przynajmniej) pierwsze dwa pliki wejściowe
są oznaczone tymi samymi nazwami wykonawców i albumów, oraz śledzić dla grać Inaczej.

-S, --postęp-postęp
Wyświetl format pliku wejściowego/informacje nagłówka i postęp przetwarzania jako dane wejściowe
plik(i) ukończony w procentach, czas, który upłynął i pozostały czas (jeśli jest znany; pokazano w
nawiasy) oraz liczbę próbek zapisanych w pliku wyjściowym. Pokazano również
miernik poziomu szczytowego oraz wskazanie, czy wystąpiło obcięcie. Miernik poziomu szczytowego
pokazuje do dwóch kanałów i jest skalibrowany dla dźwięku cyfrowego w następujący sposób (po prawej
pokazany kanał):

dB FSD Wyświetlacz dB FSD Wyświetlacz
-25 - -11 ====
-23 = -9 ====-
-21 =- -7 =====
-19 == -5 =====-
-17 ==- -3 ======

-15 === -1 =====!
-13 ===-

Trzysekundowa wartość szczytowa zapasu w dB zostanie pokazana po prawej stronie
miernik, jeśli jest poniżej 6dB.

Ta opcja jest domyślnie włączona podczas używania SoX do odtwarzania lub nagrywania dźwięku.

-T Równoważny --łączyć mnożyć.

--temp KATALOG
Określ, że wszelkie pliki tymczasowe powinny być tworzone w podanym KATALOG, To
może być przydatne, jeśli występują problemy z uprawnieniami lub wolną przestrzenią w ustawieniach domyślnych
Lokalizacja. W tym przypadku użyj `--temp .' (aby użyć bieżącego katalogu) to często
dobre rozwiązanie.

--wersja
Pokaż numer wersji SoX i wyjdź.

-V[poziom]
Ustaw szczegółowość. Jest to szczególnie przydatne, aby zobaczyć, jak działają automatyczne efekty
zostały wywołane przez SoX.

SoX wyświetla komunikaty na konsoli (stderr) zgodnie z następującą szczegółowością
poziomy:

0 W ogóle nie są wyświetlane żadne wiadomości; użyj statusu wyjścia, aby określić, czy wystąpił błąd
Wystąpił.

1 Wyświetlane są tylko komunikaty o błędach. Są one generowane, jeśli SoX nie może ukończyć
żądane polecenia.

2 Wyświetlane są również komunikaty ostrzegawcze. Są one generowane, jeśli SoX może się zakończyć
żądane polecenia, ale nie dokładnie według żądanego polecenia
parametry lub jeśli występuje obcinanie.

3 Pokazane są również opisy faz przetwarzania SoX. Przydatne do oglądania
dokładnie w jaki sposób SoX przetwarza Twój dźwięk.

4 i wyżej
Wyświetlane są również komunikaty pomagające w debugowaniu SoX.

Domyślnie poziom szczegółowości jest ustawiony na 2 (pokazuje błędy i ostrzeżenia). Każdy
występowanie -V opcja zwiększa poziom szczegółowości o 1. Alternatywnie,
poziom szczegółowości można ustawić na wartość bezwzględną, określając go bezpośrednio po
dotychczasowy -Vnp -V0 ustawia go na 0.

Wkład filet Opcje
Te opcje dotyczą tylko plików wejściowych i mogą poprzedzać tylko nazwy plików wejściowych na
wiersz poleceń.

--ignoruj-długość
Zastąp (nieprawidłową) długość audio podaną w nagłówku pliku audio. Jeśli to
podana jest opcja, wtedy SoX będzie odczytywał dźwięk aż do końca
plik wejściowy.

-v, --Tom CZYNNIK
Przeznaczona do użytku podczas łączenia wielu plików wejściowych, ta opcja dostosowuje
objętość pliku następującego po nim w wierszu poleceń o współczynnik CZYNNIK, To
pozwala na "zrównoważenie" go z innymi plikami wejściowymi. To jest liniowy
(amplitudy), więc liczba mniejsza niż 1 zmniejsza głośność, a liczba
większa niż 1 zwiększa ją. Jeśli podano liczbę ujemną, to oprócz
regulacja głośności, sygnał audio zostanie odwrócony.

Zobacz też norma, vol, zdobyć efekty i zobacz Wkład filet Balancing powyżej.

Wkład & Wydajność filet Format: Opcje
Te opcje dotyczą pliku wejściowego lub wyjściowego, którego nazwa bezpośrednio poprzedza
wiersza poleceń i są używane głównie podczas pracy z formatami plików bez nagłówka lub gdy
określenie formatu pliku wyjściowego, który różni się od formatu pliku wejściowego.

-b BITS, --bity BITS
Liczba bitów (tzw. głębia bitowa lub czasami długość słowa) w każdym zakodowanym
próbka. Nie dotyczy złożonych kodowań, takich jak MP3 lub GSM. Niekoniecznie
z kodowaniami o stałej liczbie bitów, np. A/μ-law, ADPCM.

W przypadku pliku wejściowego, najczęstszym zastosowaniem tej opcji jest poinformowanie SoX o
liczba bitów na próbkę w "surowym" ("headerless") pliku audio. Na przykład
sox -r 16k -e ze znakiem -b 8 input.raw output.wav
konwertuje określony plik `surowy' na samoopisujący się plik `WAV'.

W przypadku pliku wyjściowego można użyć tej opcji (być może wraz z -e) aby ustawić
rozmiar kodowania wyjściowego. Domyślnie (tzn. jeśli ta opcja nie jest podana), wyjście
rozmiar kodowania (pod warunkiem, że jest obsługiwany przez typ pliku wyjściowego) zostanie ustawiony na
rozmiar kodowania wejściowego. Na przykład
sox wejście.cdda -b 24 wyjście.wav
konwertuje dźwięk cyfrowy raw CD (16-bitowy, liczba całkowita ze znakiem) na 24-bitowy (liczba całkowita ze znakiem)
plik `WAV'.

-1/-2/-3/-4/-8
Liczba bajtów w każdej zakodowanej próbce. Przestarzałe aliasy dla -b 8, -b 16, -b
24, -b 32, -b 64 odpowiednio.

-c KANAŁY, --kanały KANAŁY
Liczba kanałów audio w pliku audio. Może to być dowolna liczba większa niż
zero.

W przypadku pliku wejściowego, najczęstszym zastosowaniem tej opcji jest poinformowanie SoX o
liczba kanałów w 'surowym' ('headerless') pliku audio. Czasami może być
przydatne jest użycie tej opcji z plikiem `headed', aby nadpisać
(prawdopodobnie nieprawidłowa) wartość w nagłówku - pamiętaj, że jest to obsługiwane tylko z
niektóre typy plików. Przykłady:
sox -r 48k -e float -b 32 -c 2 wejście.surowe wyjście.wav
konwertuje określony plik `surowy' na samoopisujący się plik `WAV'.
odtwórz -c 1 muzyka.wav
interpretuje dane pliku jako należące do jednego kanału, niezależnie od tego, co jest
wskazane w nagłówku pliku. Zwróć uwagę, że jeśli plik faktycznie ma dwa
kanałów, spowoduje to odtwarzanie pliku z połową szybkości.

W przypadku pliku wyjściowego ta opcja zapewnia skrót określający, że
kanały efekt należy wywołać w celu zmiany (w razie potrzeby) liczby
kanałów w sygnale audio na podany numer. Na przykład następujące dwa
polecenia są równoważne:
sox wejście.wav -c 1 wyjście.wav bas -b 24
sox wejście.wav wyjście.wav bas -b 24 kanały 1
choć druga forma jest bardziej elastyczna, gdyż pozwala na uporządkowanie efektów
dowolnie.

-e KODOWANIE, --kodowanie KODOWANIE
Typ kodowania dźwięku. Czasami potrzebne w przypadku typów plików, które obsługują więcej niż
jeden typ kodowania. Na przykład z surowym, WAV lub AU (ale nie na przykład z
MP3 lub FLAC). Dostępne typy kodowania są następujące:

liczba całkowita ze znakiem
Dane PCM przechowywane jako liczby całkowite ze znakiem („uzupełnienie do dwóch”). Powszechnie używany z
16- lub 24-bitowy rozmiar kodowania. Wartość 0 reprezentuje minimalny sygnał
moc.

liczba całkowita bez znaku
Dane PCM przechowywane jako liczby całkowite bez znaku. Powszechnie używany z kodowaniem 8-bitowym
rozmiar. Wartość 0 reprezentuje maksymalną moc sygnału.

zmiennoprzecinkowy
Dane PCM przechowywane jako pojedyncza precyzja IEEE 753 (32-bitowa) lub podwójna precyzja
(64-bitowe) liczby zmiennoprzecinkowe („rzeczywiste”). Wartość 0 oznacza minimum
moc sygnału.

prawo Międzynarodowy standard telefonii do kodowania logarytmicznego do 8 bitów na
próbka. Ma precyzję odpowiadającą mniej więcej 13-bitowemu PCM i jest
czasami zakodowane z odwróconą kolejnością bitów (zobacz -X opcja).

prawo, mu-prawo
Północnoamerykański standard telefonii do kodowania logarytmicznego do 8 bitów na
próbka. Aka prawo μ. Ma precyzję odpowiadającą mniej więcej 14-bitowemu PCM
i czasami jest zakodowany z odwróconą kolejnością bitów (zobacz -X opcja).

oki-adpcm
OKI (aka VOX, Dialogic lub Intel) 4-bitowy ADPCM; ma precyzję
odpowiednik około 12-bitowego PCM. ADPCM to forma kompresji dźwięku, która
ma dobry kompromis między jakością dźwięku a szybkością kodowania/dekodowania.

ima-adpcm
IMA (aka DVI) 4-bitowy ADPCM; ma precyzję równą mniej więcej
13-bitowy PCM.

ms-adpcm
4-bitowy ADPCM firmy Microsoft; ma precyzję odpowiadającą mniej więcej 14-bitowemu PCM.

GSM-pełna stawka
GSM jest obecnie używany w zdecydowanej większości cyfrowych sieci bezprzewodowych na świecie
rozmowy telefoniczne. Wykorzystuje kilka formatów audio o różnych przepływnościach
i związana z tym jakość mowy. SoX obsługuje oryginalne 13kbps GSM
Format audio „Full Rate”. Praca z GSM zwykle wymaga dużej mocy obliczeniowej procesora
dźwięku.

Nazwy kodowania mogą być skrócone, jeśli nie byłoby to niejednoznaczne; np
`unsigned-integer' może być podana jako `un', ale nie `u' (niejednoznaczne z `u-law').

W przypadku pliku wejściowego, najczęstszym zastosowaniem tej opcji jest poinformowanie SoX o
kodowanie `surowego' (`headerless') pliku audio (zobacz przykłady w -b oraz -c
powyżej).

W przypadku pliku wyjściowego można użyć tej opcji (być może wraz z -b) aby ustawić
typ kodowania wyjścia Na przykład
sox wejście.cdda -e float wyjście1.wav

sox wejście.cdda -b 64 -e float wyjście2.wav
konwertować nieprzetworzone cyfrowe audio CD (16-bitowe, liczby całkowite ze znakiem) do zmiennoprzecinkowych plików `WAV'
(odpowiednio pojedyncza i podwójna precyzja).

Domyślnie (tj. jeśli ta opcja nie jest podana), typ kodowania wyjścia będzie:
(pod warunkiem, że jest to obsługiwane przez typ pliku wyjściowego) ustawić na kodowanie wejściowe
rodzaj.

-s/-u/-f/-A/-U/-o/-i/-a/-g
Przestarzałe aliasy do określania typów kodowania liczba całkowita ze znakiem, bez znaku-
liczba całkowita, zmiennoprzecinkowy, prawo, mu-prawo, oki-adpcm, ima-adpcm, ms-adpcm, GSM-pełny-
stawka odpowiednio (patrz -e powyżej).

--nie-glob
Określa, że ​​nazwa pliku `globbing' (dopasowywanie symboli wieloznacznych) nie powinna być wykonywana przez
SoX na następującej nazwie pliku. Na przykład, jeśli bieżący katalog zawiera
dwa pliki `five-seconds.wav' i `five*.wav', a następnie
odtwórz --no-glob "pięć*.wav"
może być użyty do odtworzenia pojedynczego pliku `five*.wav'.

-R, --wskaźnik OCENIAĆ[k]
Podaje częstotliwość próbkowania w Hz (lub kHz, jeśli jest dodany do `k') pliku.

W przypadku pliku wejściowego, najczęstszym zastosowaniem tej opcji jest poinformowanie SoX o
częstotliwość próbkowania `surowego' (`headerless') pliku audio (zobacz przykłady w -b oraz -c
nad). Czasami może być przydatne użycie tej opcji z plikiem `headed',
aby nadpisać (prawdopodobnie nieprawidłową) wartość w nagłówku - zauważ, że
jest to obsługiwane tylko w przypadku niektórych typów plików. Na przykład, jeśli dźwięk został nagrany
z częstotliwością próbkowania, powiedzmy 48k, ze źródła, które odtwarzało trochę, powiedzmy 1.5%,
zbyt wolno, więc
sox -r 48720 wejście.wav wyjście.wav
skutecznie koryguje prędkość, zmieniając tylko nagłówek pliku (ale zobacz także
prędkość skutku dla bardziej typowego rozwiązania tego problemu).

W przypadku pliku wyjściowego ta opcja zapewnia skrót określający, że stawka
należy wywołać efekt w celu zmiany (jeśli to konieczne) częstotliwości próbkowania
sygnał dźwiękowy do podanej wartości. Na przykład następujące dwa polecenia to
równowartość:
sox wejście.wav -r 48k wyjście.wav bas -b 24
sox wejście.wav wyjście.wav bas -b 24 szybkość 48k
chociaż druga forma jest bardziej elastyczna, ponieważ pozwala stawka opcje do podania i
pozwala na dowolną kolejność efektów.

-t, --rodzaj TYP PLIKU
Podaje typ pliku audio. Zarówno w przypadku plików wejściowych, jak i wyjściowych ta opcja to
powszechnie używane do informowania SoX o typie pliku audio bez nagłówka (np. raw, mp3)
gdzie rzeczywisty/pożądany typ nie może być określony na podstawie podanego rozszerzenia pliku.
Na przykład:
inne-polecenie | sox -t mp3 - wyjście.wav

sox input.wav -t surowe wyjście.bin
Może być również użyty do zastąpienia typu sugerowanego przez rozszerzenie nazwy pliku wejściowego,
ale jeśli nadpiszesz typ, który ma nagłówek, SoX zakończy działanie z odpowiednim
komunikat o błędzie, jeśli taki nagłówek nie występuje.

See soxformat(7) dla listy obsługiwanych typów plików.

-L, --endian mało
-B, --endian duży
-x, --endian zamiana
Te opcje określają, czy kolejność bajtów danych audio jest odpowiednio
`little endian', `big endian' lub przeciwieństwo systemu, w którym SoX
jest używany. Endianness dotyczy tylko danych zakodowanych jako zmiennoprzecinkowe lub jako
liczby całkowite ze znakiem lub bez znaku 16 lub więcej bitów. Często konieczne jest określenie
jedna z tych opcji dla plików bez nagłówków, a czasami konieczna dla (w przeciwnym razie)
pliki samoopisujące. Dana opcja ustawienia endian może zostać zignorowana dla danych wejściowych
plik, którego nagłówek zawiera określony identyfikator endianness, lub dla pliku wyjściowego
to właściwie urządzenie audio.

NB W przeciwieństwie do innych cech formatu, endianowość (bajt, nibble i bit
kolejność) pliku wejściowego nie jest automatycznie używana dla pliku wyjściowego; więc dla
na przykład, gdy następujące jest uruchamiane w systemie little-endian:
sox -B audio.s16 przycięty.s16 przycięty 2
trimmed.s16 zostanie utworzony jako little-endian;
sox -B audio.s16 -B przycięte.s16 przycięte 2
musi być używany do zachowania big-endianness w pliku wyjściowym.

-V opcja służy do sprawdzenia wybranych zamówień.

-N, --odwrotne-skubania
Określa, że ​​kolejność nibble (tj. 2 połówki bajtu) próbek
należy odwrócić; czasami przydatne w przypadku formatów opartych na ADPCM.

NB Zobacz także NB w sekcji na -x powyżej.

-X, --odwrócone bity
Określa, że ​​kolejność bitów próbek powinna zostać odwrócona; czasami przydatne
z kilkoma (w większości bez nagłówków) formatami.

NB Zobacz także NB w sekcji na -x powyżej.

Wydajność filet Format: Opcje
Te opcje dotyczą tylko pliku wyjściowego i mogą poprzedzać tylko nazwę pliku wyjściowego na
wiersz poleceń.

--Dodaj komentarz TEKST
Dołącz komentarz w nagłówku pliku wyjściowego (jeśli dotyczy).

--komentarz TEKST
Określ tekst komentarza do przechowywania w nagłówku pliku wyjściowego (jeśli dotyczy).

SoX zapewni domyślny komentarz, jeśli ta opcja (lub --plik-komentarzy) nie jest podany.
Aby określić, że żaden komentarz nie powinien być przechowywany w pliku wyjściowym, użyj --komentarz "" .

--plik-komentarzy NAZWA PLIKU
Określ plik zawierający tekst komentarza do przechowywania w nagłówku pliku wyjściowego
(jeśli dotyczy).

-C, --kompresja CZYNNIK
Współczynnik kompresji dla zmiennej kompresji formatów plików wyjściowych. Jeśli to
opcja nie jest podana, wtedy zostanie zastosowany domyślny współczynnik kompresji. Kompresja
czynnik jest różnie interpretowany dla różnych formatów kompresji plików. Zobacz
opis formatów plików, które używają tej opcji w soxformat(7) po więcej
informacje.

EFEKTY


Oprócz konwertowania, odtwarzania i nagrywania plików audio, SoX może być używany do wywoływania
liczba „efektów” dźwiękowych. Można zastosować wiele efektów, określając je jeden po
drugi na końcu wiersza poleceń SoX, tworząc `łańcuch efektów'. Zauważ, że
zastosowanie wielu efektów w czasie rzeczywistym (tj. podczas odtwarzania dźwięku) prawdopodobnie będzie wymagać
komputer o wysokiej wydajności. Zatrzymanie innych aplikacji może złagodzić problemy z wydajnością
powinny wystąpić.

Niektóre efekty SoX są przeznaczone głównie do zastosowania w jednym instrumencie lub
„głos”. Aby to ułatwić, remix efekt i globalna opcja SoX -M mogą być stosowane w celu
wyizoluj, a następnie ponownie połącz ścieżki z nagrania wielościeżkowego.

Wielokrotność Dodawanie efektów Więzy
Pojedynczy łańcuch efektów składa się z jednego lub więcej efektów. Dźwięk z wejścia działa
przez łańcuch, aż do osiągnięcia końca pliku wejściowego lub efektu w
łańcuch żąda zakończenia łańcucha.

SoX obsługuje uruchamianie wielu łańcuchów efektów na wejściowym dźwięku. W tym przypadku, gdy jeden
łańcuch wskazuje, że przetwarzanie dźwięku zostało zakończone, dane dźwiękowe są następnie przesyłane przez następny
łańcuch efektów. Trwa to do momentu, gdy nie będzie już więcej łańcuchów efektów lub dane wejściowe nie będą:
dotarł do końca pliku.

Łańcuch efektów kończy się poprzez umieszczenie : (dwukropek) po efekcie. Wszelkie następujące
efekty są częścią nowego łańcucha efektów.

Ważne jest, aby jako pierwszy efekt umieścić efekt, który zatrzyma łańcuch
łańcuch. Dzieje się tak, ponieważ wszelkie próbki, które są buforowane przez efekty po lewej stronie
efekt kończący zostanie odrzucony. Ilość odrzuconych próbek jest związana z
--bufor opcja i powinna być utrzymywana na niskim poziomie w stosunku do częstotliwości próbkowania, jeśli
efekt kończący nie może być pierwszy. Więcej informacji na temat efektów zatrzymania można znaleźć
Zatrzymanie SoX

Istnieje kilka pseudoefektów, które pomagają w korzystaniu z wielu łańcuchów efektów. Obejmują one
nowy plik który rozpocznie zapis do nowego pliku wyjściowego przed przejściem do kolejnych efektów
łańcuch i restart co spowoduje powrót do pierwszego łańcucha efektów. Pseudoefekty muszą być
określone jako pierwszy efekt w łańcuchu i jako jedyny efekt w łańcuchu (muszą mieć
a : przed i po ich określeniu).

Poniżej znajduje się przykład wielu łańcuchów efektów. Podzieli plik wejściowy na
wiele plików o długości 30 sekund. Każda nazwa pliku wyjściowego będzie miała unikalny numer w
jego nazwa zgodnie z dokumentacją w Wydajność Akta
sox infile.wav output.wav trim 0 30 : nowy plik : restart

wspólny Notacja oraz Parametry
W poniższych opisach nawiasy [ ] służą do oznaczenia parametrów, które są
opcjonalne, nawiasy klamrowe { } oznaczające te, które są zarówno opcjonalne, jak i powtarzalne, oraz kąt
nawiasy < > do oznaczenia tych, które są powtarzalne, ale nie opcjonalne. W stosownych przypadkach,
domyślne wartości parametrów opcjonalnych są pokazane w nawiasach ( ).

Następujące parametry są używane z kilkoma efektami i mają to samo znaczenie:

centrum[k]
See częstotliwość.

częstotliwość[k]
Częstotliwość w Hz lub, jeśli jest dodany do `k', kHz.

zdobyć Wzmocnienie mocy w dB. Zero nie daje żadnego zysku; mniej niż zero daje tłumienie.

szerokość[h|k|o|q]
Służy do określania szerokości pasma filtra. Szereg różnych metod, aby
Określ szerokość są dostępne (choć nie wszystkie dla każdego efektu). Jeden z
Wyświetlane znaki mogą być dołączone, aby wybrać żądaną metodę w następujący sposób:

Metoda wykonania Komentarz
h Hz
k kHz
o Oktawy
q Współczynnik Q Patrz [2]

Dla każdego efektu, który używa tego parametru, metoda domyślna (tj. jeśli nie ma znaku
jest dodany) to ten, który wymienił jako pierwszy w pierwszym wierszu efektu
opis.

Aby sprawdzić, czy SoX obsługuje opcjonalny efekt, wpisz Sox -h i poszukaj jego nazwy pod
lista: 'EFEKTY'.

Utrzymany Dodawanie efektów
Uwaga: skategoryzowaną listę efektów można znaleźć w towarzyszącym pliku 'README'.

wszyscy przechodzą częstotliwość[k] szerokość[h|k|o|q]
Zastosuj dwubiegunowy filtr wszechprzepustowy o częstotliwości środkowej (w Hz) częstotliwość,
szerokość-filtra szerokość. Filtr wszechprzepustowy zmienia częstotliwość dźwięku na fazę
zależność bez zmiany zależności częstotliwości na amplitudę. Filtr
opisano szczegółowo w [1].

Ten efekt wspiera --wątek opcja globalna.

pasmo [-n] centrum[k] [szerokość[h|k|o|q]]
Zastosuj filtr pasmowy. Pasmo przenoszenia spada logarytmicznie wokół
centrum częstotliwość. ten szerokość parametr podaje nachylenie spadku. ten
częstotliwości w centrum + szerokość oraz centrum - szerokość będzie połowa ich oryginału
amplitudy. pasmo domyślnie jest to tryb zorientowany na dźwięk, tj. głos,
śpiew lub muzyka instrumentalna. ten -n (dla szumu) opcja używa trybu alternatywnego
dla dźwięku bez stroju (np. perkusja). Ostrzeżenie: -n wprowadza przyrost mocy
około 11dB w filtrze, więc uważaj na przycinanie sygnału wyjściowego. pasmo wprowadza hałas w
kształt filtra, tj. szczyt przy centrum częstotliwość i osiedlanie się
to.

Ten efekt wspiera --wątek opcja globalna.

Zobacz też od dla filtra pasmowego z bardziej stromymi ramionami.

przepustka|odrzucenie zespołu [-c] częstotliwość[k] szerokość[h|k|o|q]
Zastosuj dwubiegunowy filtr pasmowoprzepustowy lub pasmowo-odrzutowy Butterwortha z częstotliwością środkową
częstotliwość, oraz (3dB-punkt) szerokość pasma szerokość, -c opcja dotyczy tylko
przepustka i wybiera stałe wzmocnienie osłony (wzmocnienie szczytowe = Q) zamiast domyślnego:
stałe wzmocnienie szczytowe 0 dB. Filtry toczą się przy 6dB na oktawę (20dB na dekadę)
i są szczegółowo opisane w [1].

Efekty te wspierają --wątek opcja globalna.

Zobacz też od dla filtra pasmowego z bardziej stromymi ramionami.

odrzucenie zespołu częstotliwość[k] szerokość[h|k|o|q]
Zastosuj filtr odrzucający pasma. Zobacz opis przepustka efekt dla
detale.

bas|potrójny zdobyć [częstotliwość[k] [szerokość[s|h|k|o|q]]]
Zwiększ lub zmniejsz niskie (niższe) lub wysokie (górne) częstotliwości dźwięku za pomocą a
dwubiegunowy filtr półkowy o reakcji zbliżonej do standardowego hi-fi
kontrola tonów. Jest to również znane jako wyrównywanie półek (EQ).

zdobyć daje wzmocnienie przy 0 Hz (dla bas) lub w zależności od tego, która z tych wartości jest niższa z ∼22 kHz i
częstotliwość Nyquista (dla potrójny). Jego użyteczny zasięg to około -20 (dla dużego
cut) do +20 (dla dużego wzmocnienia). Uważać na Strzyżenie podczas korzystania z pozytywu zdobyć.

W razie potrzeby filtr można dostroić za pomocą następujących opcjonalnych parametrów:

częstotliwość ustawia środkową częstotliwość filtra, dzięki czemu może być używany do rozszerzania lub
zmniejszyć zakres częstotliwości, który ma być wzmocniony lub obcięty. Domyślna wartość to 100 Hz (dla
bas) lub 3 kHz (dla potrójny).

szerokość określa, jak strome jest przejście półki filtra. Dodatkowo
wspólne metody określania szerokości opisane powyżej, `slope' (domyślne lub jeśli
z dołączonym `s') może być użyty. Użyteczny zakres `slope' wynosi około 0.3, dla a
łagodne nachylenie do 1 (maksimum), w przypadku stromego zbocza; domyślna wartość to 0.5.

Filtry zostały szczegółowo opisane w [1].

Efekty te wspierają --wątek opcja globalna.

Zobacz też wyrównywacz dla szczytowego efektu wyrównania.

zagiąć [-f szybkości ramek(25)] [-o nadpróbka(16)] { opóźnienie,centów,czas trwania }
Zmienia wysokość tonu o określone wartości w określonym czasie. Każda dana trójka:
opóźnienie,centów,czas trwania określa jedno zagięcie. opóźnienie to ilość czasu po
początek strumienia audio lub koniec poprzedniego zakrętu, od którego zacząć
zginanie boiska; centów to liczba centów (100 centów = 1 półton), o jaką
zginać boisko i czas trwania czas, przez który będzie boisko


Algorytm pitch-bending wykorzystuje dyskretną transformatę Fouriera (DFT) w a
określoną liczbę klatek na sekundę i częstotliwość nadpróbkowania. ten -f oraz -o można użyć parametrów
aby dostosować te parametry, a tym samym kontrolować płynność zmian wysokości dźwięku.

Na przykład ton początkowy jest generowany, a następnie zginany trzykrotnie, dając cztery
w sumie różne notatki:
grać -n synth 2.5 sin 667 zysk 1 \
bend .35,180,.25 .15,740,.53 0,-520,.3
Zwróć uwagę, że przycinanie, które jest tworzone w tym przykładzie, jest celowe; usuwać
to, użyj zdobyć -5 zamiast zdobyć 1.

Zobacz też smoła.

bikwad b0 b1 b2 a0 a1 a2
Zastosuj biquad filtr IIR o podanych współczynnikach. Gdzie b* i a* to
odpowiednio współczynniki licznika i mianownika.

See http://en.wikipedia.org/wiki/Digital_biquad_filter (gdzie a0 = 1).

Ten efekt wspiera --wątek opcja globalna.

kanały KANAŁY
Wywołaj prosty algorytm, aby zmienić liczbę kanałów w sygnale audio na
podana liczba KANAŁY: miksowanie w przypadku zmniejszania liczby kanałów lub
powielanie w przypadku zwiększania liczby kanałów.

kanały efekt jest wywoływany automatycznie, jeśli SoX's -c opcja określa liczbę
kanałów, które różnią się od plików wejściowych. Alternatywnie, jeśli to
efekt jest podany wprost, to SoX's -c opcja nie musi być podana. Na przykład,
następujące dwa polecenia są równoważne:
sox wejście.wav -c 1 wyjście.wav bas -b 24
sox wejście.wav wyjście.wav bas -b 24 kanały 1
choć druga forma jest bardziej elastyczna, gdyż pozwala na uporządkowanie efektów
dowolnie.

Zobacz też remix dla efektu, który pozwala na dowolne miksowanie/wybieranie kanałów.

refren zyskiwać zyskać <opóźnienie próchnica prędkość głębokość -s|-t>
Dodaj efekt chóru do dźwięku. Może to sprawić, że pojedynczy wokal brzmi jak
chór, ale można go również zastosować do oprzyrządowania.

Chorus przypomina efekt echa z krótkim opóźnieniem, ale w przypadku echa opóźnienie
jest stała, z chórem, zmieniana za pomocą modulacji sinusoidalnej lub trójkątnej.
Głębokość modulacji określa zakres, przed którym odtwarzane jest modulowane opóźnienie lub
po opóźnieniu. Stąd opóźniony dźwięk będzie brzmiał wolniej lub szybciej, czyli
opóźniony dźwięk dostrojony do oryginalnego, jak w refrenie, w którym są niektóre wokale
lekko z kluczem. Więcej informacji na temat efektu chóru można znaleźć w [3].

Każdy czterokrotny parametr opóźnienia/rozpadu/prędkości/głębokości daje opóźnienie w milisekundach
oraz zanik (w stosunku do wzmocnienia) z prędkością modulacji w Hz przy użyciu głębokości in
milisekundy. Modulacja jest albo sinusoidalna (-s) lub trójkątny (-t). Osiągać-
out to głośność wyjścia.

Typowe opóźnienie wynosi około 40ms do 60ms; prędkość modulacji jest najlepsza w pobliżu 0.25 Hz
a głębokość modulacji około 2ms. Na przykład pojedyncze opóźnienie:
graj na gitarze1.wav chorus 0.7 0.9 55 0.4 0.25 2 -t
Dwa opóźnienia oryginalnych próbek:
graj na gitarze1.wav chorus 0.6 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 1.3 -s
Pełniej brzmiący refren (z trzema dodatkowymi opóźnieniami):
graj na gitarze1.wav chorus 0.5 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 2.3 -t 40 0.3 0.3 1.3 -s

towarzysz atak1,rozpad1{,atak2,rozpad2}
[miękkie kolano dB:]w dB1[,dB1]{,w dB2,dB2}
[zdobyć [głośność początkowa dB [opóźnienie]]]

Compand (kompresuj lub rozszerzaj) zakres dynamiczny dźwięku.

atakować oraz próchnica parametry (w sekundach) określają czas, przez który
chwilowy poziom sygnału wejściowego jest uśredniany w celu określenia jego głośności;
ataki odnoszą się do wzrostu głośności, a zaniki odnoszą się do spadków. Dla większości
sytuacji, czas ataku (odpowiedź na głośniejszą muzykę) powinien wynosić
krótszy niż czas zaniku, ponieważ ucho ludzkie jest bardziej wrażliwe na nagłe głośne
muzyka niż nagła łagodna muzyka. Gdzie więcej niż jedna para parametrów ataku/zaniku
są określone, każdy kanał wejściowy jest kompandowany oddzielnie i liczba par
musi zgadzać się z liczbą kanałów wejściowych. Typowe wartości to 0.3,0.8 towary drugiej jakości.

Drugim parametrem jest lista punktów na transmitancji kompandera
określona w dB w stosunku do maksymalnej możliwej amplitudy sygnału. Wejście
wartości muszą być w porządku ściśle rosnącym, ale funkcja przenoszenia nie
muszą się monotonnie rosnąć. Jeśli pominięto, wartość dB1 domyślnie
ta sama wartość co w dB1; poziomy poniżej w dB1 nie są kompandowane (ale mogą mieć zysk)
zastosowane do nich). Punkt 0,0 jest zakładane, ale może być nadpisane (przez 0,dBn).
Jeśli lista jest poprzedzona znakiem miękkie kolano dB wartość, a następnie punkty, w których sąsiednie
odcinki linii w funkcji transferu spełniają zostaną zaokrąglone o podaną kwotę.
Typowe wartości transmitancji to 6:-70,-60,-20.

Trzeci (opcjonalny) parametr to dodatkowe wzmocnienie w dB, które należy w ogóle zastosować
punktów na funkcji transferu i umożliwia łatwą regulację ogólnego wzmocnienia.

Czwarty (opcjonalny) parametr to początkowy poziom, jaki należy przyjąć dla każdego kanału
kiedy zaczyna się kompandowanie. Pozwala to użytkownikowi początkowo podać poziom nominalny,
aby np. nie przyłożyć bardzo dużego wzmocnienia do początkowych poziomów sygnału
zanim zacznie działać akcja towarzysząca: jest całkiem prawdopodobne, że w
w takim przypadku wyjście byłoby poważnie obcięte, podczas gdy wzmocnienie kompandera
prawidłowo się dopasowuje. Typowa wartość (dla dźwięku, który początkowo jest cichy) to
-90 dB.

Piąty (opcjonalny) parametr to opóźnienie w sekundach. Sygnał wejściowy jest analizowany
natychmiast, aby kontrolować kompander, ale jest opóźniony przed podaniem go do
regulator głośności. Określanie opóźnienia w przybliżeniu równego czasom ataku/zaniku
pozwala kompanderowi na efektywne działanie w trybie „przewidywania”, a nie
tryb reaktywny. Typowa wartość to 0.2 towary drugiej jakości.

* * *

Poniższy przykład może posłużyć do stworzenia utworu muzycznego z cichym i
głośne fragmenty odpowiednie do słuchania w hałaśliwym otoczeniu, takim jak ruch
pojazd:
sox asz.wav asz-car.wav kompand 0.3,1 6:-70,-60,-20 -5 -90 0.2
Funkcja przenoszenia („6:-70,...”) mówi, że bardzo ciche dźwięki (poniżej -70 dB) będą
pozostają bez zmian. Spowoduje to, że kompander nie będzie zwiększał głośności
„ciche” przejścia, takie jak między ruchami. Jednak dźwięki w zakresie -60dB do
0dB (maksymalna głośność) zostanie wzmocniona, tak aby zakres dynamiczny 60dB oryginału
muzyka zostanie skompresowana 3 do 1 do zakresu 20 dB, który jest wystarczająco szeroki, aby cieszyć się
muzyka, ale wystarczająco wąska, aby ominąć hałas drogowy. „6:” wybiera 6dB
miękkie kolano kompandowanie. Wzmocnienie wyjściowe -5 (dB) jest potrzebne, aby uniknąć przesterowania (
liczba jest niedokładna i została wyprowadzona eksperymentalnie). -90 (dB) dla
początkowa głośność będzie działać dobrze w przypadku klipu, który zaczyna się niemal ciszą, a
opóźnienie 0.2 (sekundy) powoduje, że kompander reaguje nieco bardziej
szybko do nagłych zmian głośności.

W następnym przykładzie kompand jest używany jako bramka szumów, gdy szum jest
niższy poziom niż sygnał:
odtwarzaj plik w pliku kompand .1,.2 -inf,-50.1,-inf,-50,-50 0 -90 .1
Oto kolejna bramka szumów, tym razem dla sytuacji, gdy poziom hałasu jest wyższy niż
sygnał (czyniąc go pod pewnymi względami podobnym do blokady szumów):
odtwarzaj plik kompand .1,.1 -45.1,-45,-inf,0,-inf 45 -90 .1
Ten efekt wspiera --wątek opcja globalna (dla funkcji transferu).

Zobacz też polecenie dla wielopasmowego efektu kompandowania.

kontrast [ilość-wzmocnienia(75)]
Porównywalny z kompresją, ten efekt modyfikuje sygnał audio, aby brzmiał
głośniejsze. ilość-wzmocnienia kontroluje ilość ulepszeń i jest liczbą
w zakresie 0-100. Zauważ, że ilość-wzmocnienia = 0 nadal daje znaczące
poprawa kontrastu.

Zobacz też towarzysz oraz polecenie efekty.

przesunięcie dc przesunięcie [Ogranicznik]
Zastosuj przesunięcie DC do dźwięku. Może to być przydatne do usunięcia przesunięcia DC (spowodowanego
być może przez problem sprzętowy w łańcuchu nagrań) z audio. Efekt
przesunięcia DC jest zmniejszony zapas, a tym samym głośność. ten stan or statystyki efekt może
być używane do określenia, czy sygnał ma przesunięcie DC.

Dany przesunięcie dc wartość to liczba zmiennoprzecinkowa z zakresu ±2 czyli
wskazuje wielkość przesunięcia dźwięku (która mieści się w zakresie ±1).

Opcjonalne Ogranicznik można również określić. Powinien mieć znacznie mniejszą wartość
niż 1 (np. 0.05 lub 0.02) i jest używany tylko na pikach, aby zapobiec obcinaniu.

* * *

Alternatywnym podejściem do usuwania przesunięcia DC (choć z krótkim opóźnieniem) jest:
użyć górnoprzepustowy efekt filtra przy częstotliwości powiedzmy 10Hz, jak pokazano na
następujący przykład:
sox -n dc.wav syntezator 5 sin %0 50
sox dc.wav fixed.wav górnoprzepustowy 10

głębia Zastosuj deemfazę Compact Disc (IEC 60908) (filtr półkowy z tłumieniem wysokich tonów).

Przy masteringu niektórych płyt CD wydanych na początku lat 1980. zastosowano pre-emfazę.
Wśród nich znalazło się wiele albumów z muzyką klasyczną, a także poszukiwane obecnie wydania
albumy The Beatles, Pink Floyd i innych. Pre-emfaza powinna zostać usunięta w
czas odtwarzania przez filtr deemfazy w urządzeniu odtwarzającym. Jednak nie wszystkie
nowoczesne odtwarzacze CD mają ten filtr, a bardzo niewiele napędów CD do komputerów PC go posiada; grając przed
wzmocniony dźwięk bez prawidłowego filtra deemfazy powoduje, że dźwięk, który
brzmi ostro i jest dalekie od tego, co zamierzyli jego twórcy.

Z głębia efekt, możliwe jest zastosowanie niezbędnej de-emfazy do dźwięku
który został wyodrębniony z wcześniej wyróżnionej płyty CD, a następnie albo nagraj de-
wzmocniony dźwięk na nową płytę CD (która będzie następnie odtwarzana poprawnie na dowolnym odtwarzaczu CD) lub
po prostu odtwarzaj prawidłowo pozbawione nacisku pliki audio na komputerze. Na przykład:
sox utwór1.wav utwór1-deemph.wav deemph
a następnie nagraj plik track1-deemph.wav na płytę CD lub
odtwórz utwór1-deemph.wav
lub po prostu
odtwórz utwór1.wav deemph
Filtr deemfazy jest zaimplementowany jako biquad; jego maksymalne odchylenie od
idealna odpowiedź to tylko 0.06dB (do 20kHz).

Ten efekt wspiera --wątek opcja globalna.

Zobacz też bas oraz potrójny efekty wyrównywania półek.

opóźnienie {długość}
Opóźnij jeden lub więcej kanałów audio. długość może określić czas lub, jeśli jest dodany z
„s”, liczba próbek. Nie określaj zarówno czasu, jak i opóźnień próbek w
to samo polecenie. Na przykład, opóźnienie 1.5 0 0.5 opóźnia pierwszy kanał o 1.5
sekund, trzeci kanał o 0.5 sekundy i opuszcza drugi kanał (i dowolny)
inne kanały, które mogą być obecne) bez opóźnienia. Następujące (jedno długie) polecenie
odtwarza dźwięk gongu:
play -n synth -j 3 grzech %3 grzech % -2 grzech % -5 grzech %-9 \
grzech %-14 grzech %-21 zanik godz. .01 2 1.5 opóźnienie \
1.3 1 .76 .54 .27 remiks - zanikanie h 0 2.7 2.5 norma -1
a to gra akord gitarowy:
play -n syntezator pl G2 pl B2 pl D3 pl G3 pl D4 pl G4 \
opóźnienie 0 .05 .1 .15 .2 .25 remiks - zanikanie 0 4 .1 norma -1

dither [-S|-s|-f filtrować] [-a] [-p precyzja]
Zastosuj dithering do dźwięku. Roztrząsanie celowo dodaje niewielką ilość szumu
do sygnału w celu zamaskowania słyszalnych efektów kwantyzacji, które mogą wystąpić, jeśli
wielkość próbki wyjściowej jest mniejsza niż 24 bity. Bez opcji ten efekt doda
trójkątny (TPDF) biały szum. Kształtowanie szumu (tylko dla niektórych częstotliwości próbkowania) może
być wybrany z -s, Z -f opcja, można wybrać konkretną
filtr kształtujący szum z poniższej listy: lipshitz, f-ważony, zmodyfikowany-e-
ważona, ulepszona e-ważona, gesemann, shibata, niska shibata, wysoka shibata. Notatka
że większość typów filtrów jest dostępna tylko z częstotliwością próbkowania 44100Hz. Filtr
typy wyróżniają się następującymi właściwościami: słyszalność hałasu, poziom
(niesłyszalne, ale w pewnych okolicznościach, skądinąd problematyczne) ukształtowana wysoka częstotliwość
hałas i szybkość przetwarzania.
See http://sox.sourceforge.net/SoX/NoiseShaping dla wykresów różnych szumów-
kształtowanie krzywych.

-S opcja wybiera nieco „nachylony” TPDF, nastawiony na wyższe częstotliwości.
Może być używany przy dowolnej częstotliwości próbkowania, ale poniżej ≈22k, zwykły TPDF jest prawdopodobnie lepszy,
a powyżej ≈ 37k, szum w kształcie jest prawdopodobnie lepszy.

-a opcja włącza tryb, w którym dithering (i kształtowanie szumu, jeśli ma to zastosowanie) są
włączane automatycznie tylko w razie potrzeby. Najbardziej prawdopodobnym zastosowaniem jest to, gdy
stosowanie pojawiania się lub zmniejszania do już pliku ditheringu, tak aby ponowne rozszyfrowanie
dotyczy tylko wyblakłych części. Jednak automatyczne dithering nie jest niezawodne, więc
zaniki należy dokładnie sprawdzić pod kątem modulacji szumów; jeśli tak się stanie,
następnie albo ponownie roztrząsaj cały plik, albo użyj trym, blaknąći połącz.

-p opcja umożliwia nadpisanie docelowej precyzji.

Jeśli opcja globalna SoX -R opcja nie jest podana, to liczba pseudolosowa
generator używany do generowania białego szumu zostanie `reseeded', tj. wygenerowany
hałas będzie się różnił między wywołaniami.

Po tym efekcie nie powinien następować żaden inny efekt, który wpływa na dźwięk.

Zobacz także sekcję `Dithering' powyżej.

próbkowanie w dół [czynnik(2)]
Próbkuj sygnał w dół przez współczynnik całkowity: tylko pierwszy z każdego czynnik
próbki są zachowywane, pozostałe są odrzucane.

Nie zastosowano filtra dziesiątkującego. Jeśli wejście nie ma odpowiednio ograniczonego pasma
sygnał pasma podstawowego, wystąpi aliasing. Może to być pożądane, np. w przypadku częstotliwości
tłumaczenie.

Aby uzyskać ogólny efekt resamplingu z wygładzaniem, zobacz stawka. Zobacz też nadpróbkowanie.

woskowina Ułatwia słuchanie dźwięku na słuchawkach. Dodaje `cues' do stereo 44.1 kHz (tj
audio CD) audio, dzięki czemu podczas słuchania na słuchawkach obraz stereo jest
przeniesiony z wnętrza głowy (standard dla słuchawek) na zewnątrz i przed
słuchacz (standard dla głośników).

przegapić zyskiwać zyskać <opóźnienie próchnica>
Dodaj echo do dźwięku. Echa są dźwiękiem odbitym i mogą występować naturalnie
wśród gór (a czasem dużych budynków) podczas rozmowy lub krzyku; cyfrowy
efekty echa naśladują to zachowanie i są często używane do wypełniania dźwięku
jednego instrumentu lub wokalu. Różnica czasu między oryginalnym sygnałem
a odbiciem jest „opóźnienie” (czas) i głośność odbitego sygnału
jest „rozpad”. Wiele ech może mieć różne opóźnienia i zaniki.

Każdy podany opóźnienie próchnica para podaje opóźnienie w milisekundach i zanik (względny
do zdobycia) tego echa. Gain-out to wielkość wyjścia. Na przykład: To
sprawi, że zabrzmi to tak, jakby było dwa razy więcej instrumentów niż w rzeczywistości
gra:
odtwórz lead.aiff echo 0.8 0.88 60 0.4
Jeśli opóźnienie jest bardzo krótkie, to brzmi jak (metaliczny) robot grający muzykę:
odtwórz lead.aiff echo 0.8 0.88 6 0.4
Dłuższe opóźnienie zabrzmi jak koncert plenerowy w górach:
odtwórz lead.aiff echo 0.8 0.9 1000 0.3
Jeszcze jedna góra i:
play lead.aiff echo 0.8 0.9 1000 0.3 1800 0.25

echa zyskiwać zyskać <opóźnienie próchnica>
Dodaj sekwencję ech do dźwięku. Każdy opóźnienie próchnica para daje opóźnienie w
milisekundy i zanik (względem wzmocnienia) tego echa. Zysk jest
wielkość produkcji.

Podobnie jak efekt echa, echa oznaczają „ECHO in Sequel”, czyli pierwsze echa
przyjmuje dane wejściowe, drugie dane wejściowe, a pierwsze echo, trzecie dane wejściowe i
pierwsze i drugie echa, ... i tak dalej. Należy zachować ostrożność przy użyciu wielu
echa; pojedyncze echo ma taki sam efekt jak pojedyncze echo.

Próbka zostanie odbita dwukrotnie w echach symetrycznych:
Odtwórz echa lead.aiff 0.8 0.7 700 0.25 700 0.3
Próbka zostanie dwukrotnie odbita w echach asymetrycznych:
Odtwórz echa lead.aiff 0.8 0.7 700 0.25 900 0.3
Próbka zabrzmi jak grana w garażu:
Odtwórz echa lead.aiff 0.8 0.7 40 0.25 63 0.3

wyrównywacz częstotliwość[k] szerokość[q|o|h|k] zdobyć
Zastosuj dwubiegunowy filtr korekcji szczytowej (EQ). Dzięki temu filtrowi sygnał-
poziom na i wokół wybranej częstotliwości można zwiększyć lub zmniejszyć, podczas gdy
(w przeciwieństwie do filtrów pasmowoprzepustowych i pasmowo-odrzutowych), które na wszystkich innych częstotliwościach są
bez zmian.

częstotliwość podaje centralną częstotliwość filtra w Hz, szerokość, szerokość pasma i
zdobyć wymagane wzmocnienie lub tłumienie w dB. Uważać na Strzyżenie podczas korzystania z
pozytywny zdobyć.

Aby uzyskać złożone krzywe wyrównywania, efekt ten może mieć kilka
razy, każdy z inną częstotliwością środkową.

Filtr został szczegółowo opisany w [1].

Ten efekt wspiera --wątek opcja globalna.

Zobacz też bas oraz potrójny do efektów wyrównania regałów.

blaknąć [rodzaj] zanikanie w długości [czas zatrzymania [długość zanikania]]
Zastosuj efekt zanikania na początku, na końcu lub na obu fragmentach dźwięku.

Opcjonalne rodzaj można określić, aby wybrać kształt krzywej zanikania: q dla
ćwierć fali sinusoidalnej, h za pół fali sinusoidalnej, t dla nachylenia liniowego („trójkątnego”),
l dla logarytmicznego i p dla odwróconej paraboli. Wartość domyślna to logarytmiczna.

Zanikanie zaczyna się od pierwszej próbki i zwiększa poziom sygnału od 0 do pełnego
głośność ponad zanikanie w długości sekundy. Określ 0 sekund, jeśli nie jest wymagane pojawianie się.

W przypadku ściemniania dźwięk zostanie obcięty o czas zatrzymania a poziom sygnału będzie
być zmniejszona od pełnej głośności do 0, zaczynając od długość zanikania sekundy przed
czas zatrzymania. Jeśli długość zanikania nie jest określony, domyślnie przyjmuje tę samą wartość co
zanikanie w długości. Zanikanie nie jest wykonywane, jeśli czas zatrzymania nie jest określony. Jeśli
długość pliku można określić na podstawie nagłówka pliku wejściowego i zmiany długości
efekty nie działają, więc 0 można określić dla czas zatrzymania wskazać
zwykły przypadek zanikania, który kończy się na końcu wejściowego strumienia audio.

Wszystkie czasy można określić jako okresy czasu lub liczbę próbek. Sprecyzować
okresy czasu mają format gg:mm:ss.frac. Aby określić za pomocą liczby próbek,
określ liczbę próbek i dołącz literę `s' do liczby próbek (dla
przykład `8000').

Zobacz też splatać efekt.

jodła [plik coefs|Coefs]
Użyj silnika konwolucji FFT SoX z podanymi współczynnikami filtra FIR. Jeśli singiel
podawany jest argument, to jest to traktowane jako nazwa pliku zawierającego filtr
współczynniki (oddzielone spacjami; mogą zawierać komentarze `#'). Jeśli podane
nazwa pliku to `-', lub jeśli nie podano argumentu, to współczynniki są odczytywane z
"standardowe wejście" (stdin); w przeciwnym razie współczynniki mogą być podane na polecenie
linia. Przykłady:
sox wlot wyjściowy jodła 0.0195 -0.082 0.234 0.891 -0.145 0.043
sox infile outfile jodła coefs.txt
z coefs.txt zawierającym
# Filtr HP
# częst.=10000
1.2311233052619888e-01
-4.4777096106211783e-01
5.1031563346705155e-01
-6.6502926320995331e-02
...

Ten efekt wspiera --wątek opcja globalna.

Flansza, [opóźnienie głębokość deszcz szerokość prędkość kształt faza interp]
Zastosuj do dźwięku efekt wyginania. Patrz [3], aby uzyskać szczegółowy opis
wywijanie.

Wszystkie parametry są opcjonalne (od prawej do lewej).

łodzie Domyślnie OPIS
opóźnienie 0 - 30 0 Bazowe opóźnienie w milisekundach.
głębokość 0 - 10 2 Dodano opóźnienie przemiatania w milisekundach.
deszcz -95 - 95 0 Procent regeneracji (opóźniony
sygnał zwrotny).
szerokość 0 - 100 71 Procent zmieszanego opóźnionego sygnału
z oryginałem.
prędkość 0.1 - 10 0.5 przemiatania na sekundę (Hz).
kształt grzech Kształt fali przetoczonej: sinus|trójkąt.
faza 0 - 100 25 Procentowe przesunięcie fazowe fali przemiatania
dla wielokanałowych (np. stereo)
kołnierz; 0 = 100 = ta sama faza włączona
każdy kanał.
interp lin Cyfrowa interpolacja linii opóźniającej:
liniowy|kwadratowy.

zdobyć [-e|-B|-b|-r] [-n] [-l|-h] [zysk-dB]
Zastosuj wzmocnienie lub tłumienie sygnału audio lub, w niektórych przypadkach, niektórych
swoich kanałów. Zwróć uwagę, że użycie dowolnego z -e, -B, -b, -rlub -n wymaga tymczasowego
miejsce na pliki do przechowywania dźwięku do przetworzenia, więc może być nieodpowiednie do użytku z
dźwięk „strumieniowy”.

Bez innych opcji, zysk-dB służy do regulacji poziomu mocy sygnału przez
podana liczba dB: dodatnia wzmacnia (uwaga na przesterowanie), ujemna tłumienie.
W przypadku innych opcji, zysk-dB (logicznie) stosowane jest wzmocnienie lub tłumienie
po przetworzeniu ze względu na te opcje.

Biorąc pod uwagę -e opcja, poziomy kanałów audio pliku wielokanałowego są
`equalised', tj. wzmocnienie jest stosowane do wszystkich kanałów innych niż ten z najwyższym
poziom szczytowy, taki, że wszystkie kanały osiągają ten sam poziom szczytowy (ale bez również
dający -n, dźwięk nie jest „znormalizowany”).

-B (bilans) opcja jest podobna do -e, ale z -B, używany jest poziom RMS
zamiast poziomu szczytowego. -B może być używany do korygowania nierównowagi stereo spowodowanej:
niedoskonała wkładka gramofonu. Zauważ, że w przeciwieństwie do -e, -B może spowodować trochę
obrzynek.

-b jest podobne do -B ale ma zabezpieczenie przed przecięciem, tj. jeśli to konieczne, aby zapobiec
obcinanie podczas równoważenia, tłumienie jest stosowane do wszystkich kanałów. Należy jednak pamiętać,
że w połączeniu z -n, -B oraz -b są synonimami.

-r opcja jest używana w połączeniu z wcześniejszym wywołaniem zdobyć z -h
opcja - szczegóły poniżej.

-n opcja normalizuje dźwięk do 0dB FSD; jest często używany w połączeniu z
negatyw zysk-dB w efekcie dźwięk jest znormalizowany do określonego poziomu
poniżej 0dB. Na przykład,
sox infile outfile zysk -n
normalizuje się do 0dB, oraz
sox infile outfile zysk -n -3
normalizuje się do -3dB.

-l opcja wywołuje prosty ogranicznik, np.
sox infile outfile zysk -l 6
zastosuje 6dB wzmocnienia, ale nigdy nie będzie przycinać. Pamiętaj, że ograniczenie więcej niż kilka dB więcej
niż sporadycznie (w utworze audio) nie jest zalecane, ponieważ może powodować słyszalne
zniekształcenie. Zobacz towarzysz efekt dla bardziej wydajnego limitera.

-h Opcja służy do zastosowania wzmocnienia w celu zapewnienia miejsca na dalsze przetwarzanie.
Na przykład za pomocą
sox infile outfile wzmocnienie -h bas +6
Tłumienie 6dB zostanie zastosowane przed efektem wzmocnienia basów, zapewniając w ten sposób
że się nie przytnie. Oczywiście z basem wiadomo, ile zapasu będzie
być potrzebne, ale przy innych efektach (np. szybkość, wahania) nie zawsze jest to tak jasne.
Kolejna zaleta używania zdobyć -h zamiast wyraźnego osłabienia, jest to, że jeśli
zapas nie jest wykorzystywany przez kolejne efekty, można go odzyskać za pomocą zdobyć -r,
Na przykład:
sox infile outfile wzmocnienie -h bas +6 tempo 44100 wzmocnienie -r
Powyższy łańcuch efektów gwarantuje, że nigdy się nie przycina ani nie wzmacnia; tłumi, jeśli
konieczne, aby zapobiec obcinaniu, ale tylko w takim stopniu, w jakim jest to konieczne.

Formatowanie danych wyjściowych (dithering i redukcja głębi bitowej) również wymaga zapasu (co
nie można go „odzyskać”), np.
sox infile outfile wzmocnienie -h bas +6 tempo 44100 wzmocnienie -rh dither
Tutaj drugi zdobyć inwokacja, odzyskuje tyle miejsca, ile tylko może z
poprzednie efekty, ale zachowuje tyle miejsca, ile jest potrzebne do kolejnych
przetwarzanie. Globalna opcja SoX -G można dać do automatycznego wywołania zdobyć -h
oraz zdobyć -r.

Zobacz też norma oraz vol efekty.

górnoprzepustowy|dolnoprzepustowy [-1|-2] częstotliwość[k] [szerokość[q|o|h|k]]
Zastosuj filtr górnoprzepustowy lub dolnoprzepustowy z punktem 3dB częstotliwość. Filtr może być
albo jednobiegunowy (z -1) lub dwubiegunowy (domyślnie lub z -2). szerokość
dotyczy tylko filtrów dwubiegunowych; domyślna wartość to Q = 0.707 i daje a
Odpowiedź Butterwortha. Filtry toczą się przy 6dB na biegun na oktawę (20dB na
bieguna na dekadę). Filtry dwubiegunowe zostały szczegółowo opisane w [1].

Efekty te wspierają --wątek opcja globalna.

Zobacz też od dla filtrów z bardziej stromym zwijaniem.

Hilbert [-n zawory]
Zastosuj filtr Hilberta z odcinaniem nieparzystego sygnału, przesuwając sygnał w fazie o 90 stopni.

Jest to wykorzystywane w wielu schematach kodowania macierzowego oraz do generowania sygnałów analitycznych. ten
proces jest często zapisywany jako mnożenie przez i (lub j), jednostka urojona.

Filtr Hilberta z odczepianiem nieparzystym ma charakterystykę pasmowoprzepustową, tłumiąc
najniższe i najwyższe częstotliwości. Jego przepustowość można kontrolować za pomocą liczby
krany filtrujące, które można określić za pomocą -n. Domyślna liczba naciśnięć to
wybrany dla częstotliwości odcięcia około 75 Hz.

Ten efekt wspiera --wątek opcja globalna.

ladspa moduł [wtyczka] [argument...]
Zastosuj wtyczkę LADSPA [5] (Linux Audio Developer's Simple Plugin API). Pomimo
nazwa, LADSPA nie jest specyficzna dla Linuksa, a szeroka gama efektów jest dostępna jako
Wtyczki LADSPA, takie jak cmt [6] (Computer Music Toolkit) i Steve Harris
kolekcja wtyczek [7]. Pierwszym argumentem jest moduł wtyczki, drugim nazwa
wtyczki (moduł może zawierać więcej niż jedną wtyczkę) i dowolne inne argumenty
są dla portów kontrolnych wtyczki. Brakujące argumenty są dostarczane domyślnie
wartości, jeśli to możliwe. Tylko wtyczki z maksymalnie jednym wejściem audio i jednym wyjściem audio
port może być używany. Jeśli zostanie znaleziona, zmienna środowiskowa LADSPA_PATH zostanie użyta jako
ścieżka wyszukiwania wtyczek.

głośność [zdobyć [odniesienie]]
Kontrola głośności - podobna do zdobyć efekt, ale zapewnia wyrównanie dla
ludzki układ słuchowy. Widzieć http://en.wikipedia.org/wiki/Loudness dla szczegółowego
opis głośności. Wzmocnienie jest regulowane przez podane zdobyć parametr (zwykle
ujemny) a sygnał wyrównany zgodnie z ISO 226 z poziomem odniesienia
65dB, choć alternatywa odniesienie poziom może być podany, jeśli oryginalny dźwięk ma
został wyrównany na jakiś inny optymalny poziom. Domyślne wzmocnienie -10dB jest używane, jeśli a
zdobyć wartość nie jest podana.

Zobacz też zdobyć efekt.

dolnoprzepustowy [-1|-2] częstotliwość[k] [szerokość[q|o|h|k]]
Zastosuj filtr dolnoprzepustowy. Zobacz opis górnoprzepustowy efekt szczegółów.

polecenie "atak1,rozpad1{,atak2,rozpad2}
[miękkie kolano dB:]w dB1[,dB1]{,w dB2,dB2}
[zdobyć [głośność początkowa dB [opóźnienie]]]" {częstotliwość zwrotnicy[k] "atak1,..."}

Kompander wielopasmowy jest podobny do kompandera jednopasmowego, ale dźwięk jest
najpierw podzielony na pasma za pomocą filtrów zwrotnicy Linkwitz-Riley i osobno
określony kompander uruchomiony na każdym paśmie. Zobacz towarzysz wpływ na definicję
jego parametrów. Parametry Compand są podane w cudzysłowach i
częstotliwość podziału dla tego pasma jest określona przez częstotliwość zwrotnicy; te mogą się powtarzać
tworzyć wiele zespołów.

Na przykład poniższe (jedno długie) polecenie pokazuje, jak wygląda kompandowanie wielopasmowe
zwykle używane w radiu FM:
Odtwórz utwór1.wzmocnienie wav -3 sinc 8000-29 100 mcompand \
"0.005,0.1 -47,-40,-34,-34,-17,-33" 100 \
"0.003,0.05 -47,-40,-34,-34,-17,-33" 400 \
"0.000625,0.0125 -47,-40,-34,-34,-15,-33" 1600 \
"0.0001,0.025 -47,-40,-34,-34,-31,-31,-0,-30" 6400 \
"0,0.025 -38,-31,-28,-28,-0,-25" \
zysk 15 górnoprzepustowy 22 górnoprzepustowy 22 sinc -n 255 -b 16 -17500 \
zysk 9 dolnoprzepustowy -1 17801
Plik audio jest odtwarzany z symulowanym dźwiękiem radia FM (lub sygnałem audycji)
warunek, jeśli filtr dolnoprzepustowy na końcu zostanie pominięty). Zauważ, że rurociąg jest
skonfigurować z pre-emfazą 75us w stylu amerykańskim.

Zobacz też towarzysz dla jednopasmowego efektu kompandowania.

hałasprof [plik-profilu]
Oblicz profil dźwięku do wykorzystania w redukcji szumów. Zobacz opis
ukończenia zaszumiony efekt szczegółów.

zaszumiony [plik-profilu [ilość]]
Zmniejsz szum w sygnale audio poprzez profilowanie i filtrowanie. Ten efekt jest
umiarkowanie skuteczny w usuwaniu stałych szumów tła, takich jak syczenie lub buczenie.
Aby go użyć, najpierw uruchom SoX z hałasprof wpływ na sekcję dźwięku, która
idealnie zawierałoby ciszę, ale w rzeczywistości zawiera hałas - takie sekcje są
zwykle znajduje się na początku lub na końcu nagrania. hałasprof napisze
z profilu szumu, aby plik-profilu, lub na standardowe wyjście, jeśli nie plik-profilu lub jeśli `-' to
dany. Np
sox mowa.wav -n przycinanie 0 1.5 noiseprof profil-mowy.noise
Aby faktycznie usunąć szum, uruchom SoX ponownie, tym razem z zaszumiony efekt;
zaszumiony zmniejszy hałas zgodnie z profilem hałasu (który został wygenerowany przez
hałasprof), od plik-profilu, lub ze standardowego wejścia, jeśli nie plik-profilu lub jeśli podano `-'.
Na przykład
sox speech.wav clean.wav noisered speech.noise-profile 0.3
Ile szumów należy usunąć, określa ilość-a liczba od 0 do 1
z wartością domyślną 0.5. Większe liczby usuną więcej szumu, ale zwiększą
prawdopodobieństwo usunięcia pożądanych komponentów sygnału audio. Przed wymianą
oryginalne nagranie w wersji z redukcją szumów, eksperymentuj z innymi ilość
wartości, aby znaleźć optymalny dla twojego dźwięku; użyj słuchawek, aby sprawdzić, czy jesteś
zadowolony z wyników, zwracając szczególną uwagę na cichsze sekcje
dźwięku.

W większości systemów te dwa etapy - profilowanie i redukcję - można łączyć za pomocą
rura, np.
sox noisy.wav -n wykończenia 0 1 noiseprof | odtwórz noisy.wav noisered

norma [poziom dB]
Normalizuj dźwięk. norma to tylko alias dla zdobyć -n; zobacz zdobyć efekt dla
detale.

oops Efekt stereo poza fazą. Miksuje stereo do twin-mono, gdzie każdy kanał mono
zawiera różnicę między lewym i prawym kanałem stereo. To jest
czasami znany jako efekt „karaoke”, ponieważ często powoduje usunięcie większości
lub wszystkie wokale z nagrania. Jest to równoważne remix 1,2 1,2.

zajeździć [zdobyć(20) [kolor(20)]]
Zniekształcenia nieliniowe. ten kolor parametr kontroluje ilość parzystej harmonicznej
zawartość w przesterowanych danych wyjściowych.

ścieżka { długość[@position] }
Wypełnij dźwięk ciszą na początku, na końcu lub w określonych punktach
przez dźwięk. Obie długość oraz position może określić czas lub, jeśli jest dołączony
z `s', liczba próbek. długość to ilość ciszy do wstawienia i
position pozycję w wejściowym strumieniu audio, w której należy go wstawić. Jakikolwiek numer
długości i pozycji mogą być określone, pod warunkiem, że określona pozycja jest
nie mniej niż poprzedni. position jest opcjonalny dla pierwszego i ostatniego
podane długości i jeśli pominięto odpowiadają początkowi i końcowi
odpowiednio audio. Na przykład, ścieżka 1.5 1.5 dodaje 1.5 sekundy dopełnienia ciszy
na każdym końcu dźwięku, podczas gdy ścieżka 4000s @ 3:00 wstawia 4000 próbek ciszy 3
minut do dźwięku. Jeśli cisza jest potrzebna tylko na końcu dźwięku, określ
albo pozycję końcową, albo określ pad o zerowej długości na początku.

Zobacz też opóźnienie dla efektu, który może dodać ciszę na początku dźwięku
kanał po kanale.

fazer zyskiwać zyskać opóźnienie próchnica prędkość [-s|-t]
Dodaj efekt stopniowania do dźwięku. Patrz [3], aby uzyskać szczegółowy opis fazowania.

opóźnienie/zanik/prędkość podaje opóźnienie w milisekundach i zanik (w stosunku do wzmocnienia
in) z prędkością modulacji w Hz. Modulacja jest albo sinusoidalna (-s) -
preferowane dla wielu instrumentów lub trójkątne (-t) - daje pojedyncze instrumenty
ostrzejszy efekt fazowania. Zanik powinien być mniejszy niż 0.5, aby uniknąć sprzężenia zwrotnego, oraz
zwykle nie mniej niż 0.1. Gain-out to wielkość wyjścia.

Na przykład:
graj werbel.flac fazer 0.8 0.74 3 0.4 0.5 -t
Łagodniejszy:
graj werbel.flac fazer 0.9 0.85 4 0.23 1.3 -s
Popularny dźwięk:
graj werbel.flac fazer 0.89 0.85 1 0.24 2 -t
Bardziej surowe:
graj werbel.flac fazer 0.6 0.66 3 0.6 2 -t

smoła [-q] przesunięcie [segment [szukanie [zakładka]]]
Zmień wysokość dźwięku (ale nie tempo).

przesunięcie daje przesunięcie wysokości tonu jako dodatnie lub ujemne `centy' (tj. setne części a
półton). Zobacz tempo wpływ na opis innych parametrów.

Zobacz też zagiąć, prędkość, tempo efekty.

stawka [-q|-l|-m|-h|-v] [opcje nadpisania] OCENIAĆ[k]
Zmień częstotliwość próbkowania dźwięku (tj. Ponownie próbkuj dźwięk) na dowolną podaną OCENIAĆ (parzysty
niecałkowita, jeśli jest to obsługiwane przez format pliku wyjściowego) przy użyciu poziomu jakości
zdefiniowane w następujący sposób:

Jakość Zespół- Rej dB Typowy Zastosowanie
szerokość
-q szybkie n/d ≈30 @ odtwarzanie włączone
Fs/4 starożytny sprzęt
-l niski 80% 100 odtwarzania na starym
sprzęt komputerowy
-m średni 95% 100 odtwarzania dźwięku
-h wysoki 95% 125 16-bitowy mastering
(użyj z ditheringiem)
-v bardzo wysoki 95% 175 24-bitowy mastering

gdzie Przepustowość łącza to procent pasma częstotliwości dźwięku, który jest zachowywany
oraz Rej dB to poziom tłumienia hałasu. Rosnące poziomy resamplingu
jakość odbywa się kosztem coraz większej ilości czasu na przetwarzanie dźwięku. Gdyby
nie podano opcji jakości, używany poziom jakości to `wysoki' (ale zobacz `Granie i
Nagrywanie dźwięku” powyżej w odniesieniu do odtwarzania).

Algorytm „szybki” wykorzystuje interpolację sześcienną; wszyscy inni korzystają z ograniczenia pasma
interpolacja. Domyślnie wszystkie algorytmy mają 'liniową' odpowiedź fazową; dla
„średnia”, „wysoka” i „bardzo wysoka”, odpowiedź fazowa jest konfigurowalna (patrz poniżej).

stawka efekt jest wywoływany automatycznie, jeśli SoX's -r opcja określa stawkę, która
różni się od pliku wejściowego. Alternatywnie, jeśli ten efekt zostanie podany
wyraźnie, to SoX's -r opcja nie musi być podana. Na przykład następujące dwa
polecenia są równoważne:
sox wejście.wav -r 48k wyjście.wav bas -b 24
sox wejście.wav wyjście.wav bas -b 24 szybkość 48k
chociaż drugie polecenie jest bardziej elastyczne, ponieważ pozwala stawka opcje do podania,
i pozwala na dowolną kolejność efektów.

* * *

Ostrzeżenie: następuje szczegółowa technicznie dyskusja.

Opisany powyżej prosty wybór jakości zapewnia ustawienia, które spełniają wymagania
potrzeby ogromnej większości zadań związanych z resamplingiem. Czasami jednak może to być
pożądane do precyzyjnego dostrojenia odpowiedzi filtra resamplera; można to osiągnąć za pomocą
Zastąp Opcje, jak wyszczególniono w poniższej tabeli:

-TYSIĄC Odpowiedź fazowa = minimalna/pośrednia/liniowa
-s Filtr stromy (szerokość pasma = 99%)
-a Zezwalaj na aliasowanie/obrazowanie powyżej pasma przepustowego
-b 74-99.7 Dowolna szerokość pasma %
-p 0-100 Dowolna odpowiedź fazowa (0 = minimalna, 25 = pośrednia,
50 = liniowy, 100 = maksymalny)

Uwaga: opcji przesłonięcia nie można używać z algorytmami „szybkiej” lub „niskiej” jakości.

Wszystkie resamplery używają filtrów, które czasami mogą tworzyć „echo” (inaczej „dzwonienie”)
artefakty z sygnałami przejściowymi, takie jak te, które pojawiają się przy „pstryknięciu palca” lub
inne bardzo perkusyjne dźwięki. Takie artefakty są znacznie bardziej widoczne dla
ucho ludzkie, jeśli pojawiają się przed przejściowym („przedecho”), niż jeśli następują po
to ('post-echo'). Zauważ, że częstotliwość takich artefaktów jest związana z
mniejsza z oryginalnych i nowych częstotliwości próbkowania, ale jeśli to jest przynajmniej
44.1 kHz, wówczas artefakty będą leżeć poza zasięgiem ludzkiego słuchu.

Ustawienie odpowiedzi fazowej może być używane do kontrolowania dystrybucji dowolnych transjentów
echo między `pre' i `post': przy minimalnej fazie nie ma echa wstępnego oprócz
najdłuższe postecho; z fazą liniową, przed i po echu są w równych ilościach (in
terminy sygnalizacyjne, ale nie terminy dotyczące słyszalności); ustawienie fazy pośredniej próbuje:
znajdź najlepszy kompromis, wybierając niewielką długość (i poziom) echa wstępnego i a
średniej długości postecho.

Minimalna, pośrednia lub liniowa odpowiedź fazowa jest wybierana za pomocą -M, -Ilub -L
opcja; można utworzyć niestandardową odpowiedź fazową za pomocą -p opcja. Zauważ, że faza
odpowiedzi pomiędzy „liniowym” a „maksymalnym” (powyżej 50) rzadko są przydatne.

Ustawienie szerokości pasma resamplera określa, jaka część zawartości częstotliwości
oryginalny sygnał (z uwzględnieniem oryginalnej częstotliwości próbkowania podczas upsamplingu lub nowego)
częstotliwość próbkowania przy próbkowaniu w dół) jest zachowywana podczas konwersji. Termin „przepustka”
band” jest używany w odniesieniu do wszystkich częstotliwości aż do punktu szerokości pasma (np. dla
Częstotliwość próbkowania 44.1 kHz i szerokość pasma ponownego próbkowania 95%, pasmo przepustowe reprezentuje
częstotliwości od 0Hz (DC) do około 21kHz). Zwiększanie szerokości pasma resamplera
powoduje wolniejszą konwersję i może zwiększyć przejściowe artefakty echa (i vice)
odwrotnie).

-s Opcja 'stromy filtr' zmienia szerokość pasma resamplingu z domyślnego 95%
(na podstawie punktu 3dB), do 99%. ten -b opcja umożliwia ustawienie szerokości pasma na
dowolna wartość z zakresu 74-99.7%, ale należy pamiętać, że wartości szerokości pasma są większe niż 99%
nie są zalecane do normalnego użytkowania, ponieważ mogą powodować nadmierne echo przejściowe.

Jeśli -a podana jest opcja, wtedy aliasing/obrazowanie powyżej pasma przepustowego jest dozwolone.
Na przykład przy częstotliwości próbkowania 44.1 kHz i szerokości pasma ponownego próbkowania 95%, to
oznacza, że ​​zawartość częstotliwości powyżej 21 kHz może być zniekształcona; jednak, ponieważ to jest
powyżej pasma przepustowego (tj. powyżej najwyższej częstotliwości zainteresowania/słyszalności),
to może nie być problem. Korzyści z zezwolenia na tworzenie aliasów/obrazów są zmniejszone
czas przetwarzania i zredukowane (prawie o połowę) przejściowe artefakty echa. Zauważ, że
jeśli ta opcja jest podana, to minimalna szerokość pasma dozwolona z -b wzrasta do
% 85.

Przykłady:
sox input.wav -b 16 output.wav rate -s -a 44100 dithering -s
domyślne (wysokiej) jakości ponowne próbkowanie; przesłonięcia: stromy filtr, zezwól na aliasing; do
częstotliwość próbkowania 44.1 kHz; dithering w kształcie szumu do 16-bitowego pliku WAV.
sox wejście.wav -b 24 wyjście.aiff szybkość -v -I -b 90 48k
bardzo wysokiej jakości resampling; nadpisania: faza pośrednia, szerokość pasma 90%; do 48k
próbna stawka; przechowuj dane wyjściowe w 24-bitowym pliku AIFF.

* * *

smoła oraz prędkość efekty użyj stawka efekt u ich podstaw.

remix [-a|-m|-p]poza specyfikacją>
poza specyfikacją = w specyfikacji{,w specyfikacji} | 0
w specyfikacji = [w chan][-[w kanale2]][specyfikacja objętości]
specyfikacja objętości = p|i|v[Tom]

Wybierz i zmiksuj wejściowe kanały audio z wyjściowymi kanałami audio. Każde wyjście
kanał jest określony z kolei przez dany poza specyfikacją: lista wnoszących wkład
kanały i specyfikacje głośności.

Zwróć uwagę, że ten efekt działa na dźwięk kanały w ramach efektów SoX
łańcuch przetwarzania; nie należy go mylić z -m opcja globalna (gdzie
wielokrotność pliki są łączone przed wejściem do łańcucha efektów).

An poza specyfikacją zawiera rozdzielone przecinkami numery kanałów wejściowych i rozdzielane myślnikiem
zakresy numerów kanałów; alternatywnie, 0 można dać do stworzenia cichego wyjścia
kanał. Na przykład,
sox wejście.wav wyjście.wav remix 6 7 8 0
tworzy plik wyjściowy z czterema kanałami, gdzie kanały 1, 2 i 3 są kopiami
kanały 6, 7 i 8 w pliku wejściowym, a kanał 4 jest cichy. Natomiast
sox wejście.wav wyjście.wav remix 1-3,7 3
tworzy (nieco dziwaczny) stereofoniczny plik wyjściowy, w którym lewy kanał jest
w dół kanałów wejściowych 1, 2, 3 i 7, a prawy kanał jest kopią wejścia
kanał 3.

W przypadku określenia zakresu kanałów numery kanałów po lewej i prawej stronie
myślników są opcjonalne i domyślnie wynoszą 1 oraz liczbę kanałów wejściowych
odpowiednio. Zatem
sox wejście.wav wyjście.wav remiks -
wykonuje miksowanie wszystkich kanałów wejściowych do mono.

Domyślnie, gdy kanał wyjściowy jest mieszany z wielu (n) kanałów wejściowych, z których każdy
kanał wejściowy zostanie przeskalowany o współczynnik ¹/n. Można ustawić niestandardowe objętości mieszania
podążając za danym kanałem wejściowym lub zakresem kanałów wejściowych z specyfikacja objętości
(specyfikacja objętości). To jedna z liter p, ilub v, a następnie a
numer tomu, którego znaczenie zależy od danej litery i jest określone jako
następuje:

List objętość numer Komentarz
p regulacja mocy w dB 0 = bez zmian
Regulacja mocy w dB Jak `p', ale odwróć
audio
v mnożnik napięcia 1 = bez zmian, 0.5 ≈ 6dB
tłumienie, 2 ≈ 6dB
zysk, -1 = odwrotność

Jeżeli poza specyfikacją zawiera co najmniej jeden specyfikacja objętości wtedy domyślnie ¹/n skalowanie nie jest
stosowane do innych kanałów w tej samej specyfikacji (chociaż mogą być w innych
okular). Można jednak podać opcję -a (automatycznie), aby zachować automatyczną
skalowanie w tym przypadku. Na przykład,
sox input.wav output.wav remix 1,2 3,4v0.8
daje mnożniki poziomu kanału równe 0.5,0.5 1,0.8, podczas gdy
sox input.wav output.wav remix -a 1,2 3,4v0.8
daje mnożniki poziomu kanału równe 0.5,0.5 0.5,0.8.

Opcja -m (manual) wyłącza wszystkie automatyczne regulacje głośności, więc
sox wejście.wav wyjście.wav remix -m 1,2 3,4v0.8
daje mnożniki poziomu kanału równe 1,1 1,0.8.

Numer tomu jest opcjonalny i pominięcie go oznacza brak zmiany głośności;
jednak jedynym przypadkiem, w którym jest to przydatne, jest połączenie z i. Forum
na przykład, jeśli wejście.wav jest stereo, więc
sox wejście.wav wyjście.wav remiks 1,2i
jest mono odpowiednikiem oops efekt.

Jeśli -p podana jest opcja, wtedy dowolne automatyczne skalowanie ¹/n jest zastępowane przez ¹/√n
skalowanie („moc”); daje to głośniejszy miks, ale czasami może się przycinać.

* * *

Jedno użycie remix efektem jest podzielenie pliku audio na zestaw plików, każdy
zawierające jeden z kanałów składowych (w celu wykonania kolejnych
przetwarzanie na poszczególnych kanałach audio). Gdzie jest więcej niż kilka kanałów
zaangażowany, przydatny jest skrypt taki jak następujący (skrypt powłoki Bourne'a):
#!/ Bin / sh
chans=`soxi -c "$1"`
while [ $chans -ge 1 ]; robić
chans0=`printf %02i $chans` # 2 cyfry stąd do 99 chans
out=`echo "$1"|sed "s/\(.*\)\.\(.*\)/\1-$chans0.\2/"`
sox „$1” „$out” remiks $chans
chans=`wyr $chans - 1`
zrobić
Jeśli plik wejście.wav zawierających sześć kanałów audio, skrypt miałby:
wygeneruj sześć plików wyjściowych: wejście-01.wav, wejście-02.wav..., wejście-06.wav.

Zobacz też zamiana efekt.

powtarzać [liczyć (1)]
Powtórz cały dźwięk liczyć razy, lub raz, jeśli liczyć nie jest podany. Wymaga
tymczasowe miejsce na pliki do przechowywania dźwięku do powtórzenia. Pamiętaj, że powtarzasz raz
daje dwie kopie: oryginalny dźwięk i powtórzony dźwięk.

pogłos [-w|--tylko na mokro] [pogłos (50%) [tłumienie HF (% 50)
[w skali pomieszczenia (100%) [głębia stereo (% 100)
[wstępne opóźnienie (0 ms) [mokry zysk (0 dB)]]]]]]

Dodaj pogłos do dźwięku za pomocą algorytmu „freeverb”. Pogłos
efekt jest czasem pożądany w przypadku sal koncertowych, które są zbyt małe lub zawierają tak
wielu ludzi, że naturalny pogłos sali jest zmniejszony. Stosując mały
ilość pogłosu stereo w (suchym) sygnale mono zwykle sprawi, że będzie brzmiał mocniej
naturalny. Zobacz [3] szczegółowy opis pogłosu.

Zwróć uwagę, że ten efekt zwiększa zarówno głośność, jak i długość dźwięku, więc aby
zapobiec przycinaniu w tych domenach, typowym wywołaniem może być:
odtwórz dry.wav wzmocnienie -3 pad 0 3 pogłos
-w można podać opcję wyboru tylko sygnału „mokrego”, co pozwala na to
przetwarzane dalej, niezależnie od sygnału „suchego”. Np
play -m voice.wav "|sox voice.wav -p reverse reverb -w reverse"
dla odwróconego efektu pogłosu.

rewers
Całkowicie odwróć dźwięk. Wymaga tymczasowego miejsca na pliki do przechowywania dźwięku w
być odwrócone.

ria Zastosuj korekcję odtwarzania płyt winylowych RIAA. Częstotliwość próbkowania musi być jedną z: 44.1,
48, 88.2, 96 kHz.

Ten efekt wspiera --wątek opcja globalna.

cisza [-l] powyżej okresów [czas trwania próg[d|%]
[okresy poniżej czas trwania próg[d|%]]

Usuwa ciszę z początku, środka lub końca dźwięku. „Cisza” to
określony przez określony próg.

powyżej okresów wartość jest używana do wskazania, czy dźwięk powinien być przycięty w
początek dźwięku. Wartość zero wskazuje, że cisza nie powinna być odcinana
początek. Podczas określania wartości niezerowej powyżej okresów, przycina dźwięk do
znajduje brak ciszy. Zwykle podczas przycinania ciszy od początku dźwięku
powyżej okresów będzie 1, ale można go zwiększyć do wyższych wartości, aby przyciąć cały dźwięk
do określonej liczby okresów braku ciszy. Na przykład, jeśli masz dźwięk
plik z dwoma utworami, z których każda zawierała 2 sekundy ciszy przed piosenką, ty
może określić powyżej okresu 2, aby usunąć oba okresy ciszy i pierwszy
piosenka.

Kiedy powyżej okresów jest niezerowe, należy również podać a czas trwania oraz próg.
Czas trwania: wskazuje ilość czasu, przez który musi zostać wykryty brak ciszy
zatrzymuje przycinanie dźwięku. Zwiększając czas trwania, wybuch hałasu można traktować jako
cisza i przycięte.

próg służy do wskazania, jaką wartość próbki należy traktować jako ciszę. Do
dźwięk cyfrowy, wartość 0 może być w porządku, ale w przypadku dźwięku nagranego z analogowego możesz
chcesz zwiększyć wartość, aby uwzględnić hałas w tle.

Gdy opcjonalnie przycinasz ciszę od końca dźwięku, określasz a poniżej-
okresy liczyć. W tym przypadku, poniżej okresu oznacza usunięcie całego dźwięku po ciszy
zostanie wykryty. Zwykle będzie to wartość 1, ale można ją zwiększyć, aby pominąć
w okresach ciszy, które są pożądane. Na przykład, jeśli masz piosenkę z 2
sekundy ciszy w środku i 2 sekundy na końcu, można ustawić poniżej-
okres do wartości 2, aby pominąć ciszę w środku dźwięku.

Dla litu szacuje się okresy poniżej, czas trwania określa okres ciszy, który musi zaistnieć przed
dźwięk nie jest już kopiowany. Określając wyższy czas trwania, cisza, która jest
poszukiwane można pozostawić w audio. Na przykład, jeśli masz piosenkę z oczekiwanym
1 sekunda ciszy w środku i 2 sekundy ciszy na końcu, czas trwania
2 sekundy można wykorzystać do przeskoczenia środkowej ciszy.

Niestety, musisz znać długość ciszy na końcu audio
plik, aby niezawodnie przyciąć ciszę. Obejściem jest użycie cisza efekt w
połączenie z rewers efekt. Odwracając najpierw dźwięk, możesz użyć
powyżej okresów aby niezawodnie przyciąć cały dźwięk z tego, co wygląda jak z przodu
plik. Następnie odwróć plik ponownie, aby wrócić do normy.

Aby usunąć ciszę ze środka pliku, określ a okresy poniżej to jest
negatywny. Wartość ta jest następnie traktowana jako wartość dodatnia i służy również do:
wskazać, że efekt powinien ponownie rozpocząć przetwarzanie, jak określono w powyżej okresów,
dzięki czemu nadaje się do usuwania okresów ciszy w środku dźwięku.

Opcja -l wskazuje to okresy poniżej czas trwania należy pozostawić długość dźwięku
nienaruszone na początku każdego okresu ciszy. Na przykład, jeśli chcesz
usuń długie przerwy między słowami, ale nie chcesz całkowicie usuwać przerw.

okres liczby podane są w jednostkach próbek. Czas trwania: zliczenia mogą być w formacie
gg:mm:ss.frac lub dokładną liczbę próbek. próg liczby mogą mieć sufiks
w d aby wskazać wartość w decybelach, lub % aby wskazać procent
maksymalna wartość wartości próbki (0% określa czystą ciszę cyfrową).

Poniższy przykład pokazuje, jak można użyć tego efektu do rozpoczęcia nagrania, które:
nie zawiera opóźnienia na początku, które zwykle występuje między `naciśnięciem
przycisk nagrywania” i początek występu:
rec parametry filename inne-efekty cisza 1 5 2%

od [-a do|-b beta] [-p faza|-M|-I|-L] [-t tbw|-n zawory] [częstotliwość HP][-częstotliwośćLP [-t tbw|-n
opukanie]]
Zastosuj filtr dolnoprzepustowy, górnoprzepustowy, pasmowoprzepustowy lub pasmowy odrzucający sinc kaiser-winded
do sygnału. ten częstotliwość HP oraz częstotliwośćLP parametry podają częstotliwości 6dB
punkty filtra górnoprzepustowego i dolnoprzepustowego, które mogą być wywoływane indywidualnie, lub
razem. Jeśli podane są oba, to częstotliwość HP mniej niż częstotliwośćLP tworzy band-pass
filtr, częstotliwość HP większa niż częstotliwośćLP tworzy filtr pasmowy. Na przykład
modły
od 3k
sin -4k
od 3k-4k
od 4k-3k
utworzyć odpowiednio filtr górnoprzepustowy, dolnoprzepustowy, pasmowoprzepustowy i pasmowo-odrzutowy.

Domyślne tłumienie w paśmie stop 120dB można obejść za pomocą -a;
alternatywnie parametr kaiser-window `beta' można podać bezpośrednio za pomocą -b.

Domyślną szerokość pasma przejścia wynoszącą 5% całkowitego pasma można nadpisać za pomocą -t
(I tbw w Hertzach); alternatywnie ilość odczepów filtra można podać bezpośrednio
w -n.

Jeśli oba częstotliwość HP oraz częstotliwośćLP są podane, to a -t or -n opcja podana po lewej stronie
częstotliwości dotyczą obu częstotliwości; jedną z tych opcji dano
prawo od częstotliwości dotyczy tylko częstotliwośćLP.

-p, -M, -I, -L opcje kontrolują odpowiedź fazową filtra; zobacz stawka
efekt szczegółów.

Ten efekt wspiera --wątek opcja globalna.

spektrogram [Opcje]
Utwórz spektrogram dźwięku; dźwięk jest przekazywany bez modyfikacji przez SoX
łańcuch przetwarzania. Ten efekt jest opcjonalny - typ Sox --help i sprawdź listę
obsługiwane efekty, aby sprawdzić, czy został uwzględniony.

Spektrogram jest renderowany w pliku Portable Network Graphic (PNG) i pokazuje
czas na osi X, częstotliwość na osi Y i wielkość sygnału audio na osi Z
oś. Wartości na osi Z są reprezentowane przez kolor (lub opcjonalnie intensywność)
piksele w płaszczyźnie XY. Jeśli sygnał audio zawiera wiele kanałów, to
są one pokazane od góry do dołu, zaczynając od kanału 1 (który jest po lewej)
kanał dla dźwięku stereo).

Na przykład, jeśli `my.wav' jest plikiem stereo, to z
sox my.wav -n spektrogram
spektrogram całego pliku zostanie utworzony w pliku `spectrogram.png'.
Częściej jednak wymagana jest analiza mniejszej części dźwięku; np
w
sox my.wav -n remix 2 wykończenia 20 30 spektrogram
spektrogram pokazuje informacje tylko z drugiego (prawego) kanału oraz z
trzydzieści sekund dźwięku, zaczynając od dwudziestu sekund. Aby przeanalizować mały
część domeny częstotliwości, stawka można zastosować efekt, np.
sox my.wav -n rate 6k spektrogram
umożliwia szczegółową analizę częstotliwości do 3kHz (połowa częstotliwości próbkowania) tj
gdzie ludzki układ słuchowy jest najbardziej wrażliwy. Z
sox my.wav -n trim 0 10 spektrogram -x 600 -y 200 -z 100
podane opcje kontrolują wielkość osi X, Y i Z spektrogramu (w tym
przypadku, obszar spektrogramu utworzonego obrazu będzie miał rozmiar 600 na 200 pikseli
a zakres osi Z wyniesie 100 dB). Zwróć uwagę, że uzyskany obraz zawiera osie
legend itp. i tak będzie trochę większy niż określony rozmiar spektrogramu.
W tym przykładzie:
sox -n -n synth 6 tri 10k:14k spektrogram -z 100 -w kaiser
„okno” analizy o wysokim zakresie dynamiki jest wybrane, aby najlepiej wyświetlić
spektrogram przemiatanej fali trójkątnej. Aby uzyskać podobny przykład, dołącz następujące
do polecenia `chime' w opisie opóźnienie efekt (powyżej):
szybkość spektrogramu 2k -X 200 -Z -10 -w kaiser
Dostępne są również opcje sterowania wyglądem (ustawienie kolorów, jasność,
kontrast itp.) i nazwę pliku spektrogramu; np. z
sox my.wav -n spektrogram -m -l -o print.png
tworzony jest spektrogram odpowiedni do drukowania na „czarno-białej” drukarce.

Opcje:

-x num Zmień (maksymalną) szerokość (oś X) spektrogramu z domyślnej
wartość 800 pikseli do podanej liczby od 100 do 200000. Zobacz także -X
oraz -d.

-X num Piksele w osi X/sekundę; wartość domyślna jest obliczana automatycznie, aby pasowała do podanego lub
znany czas trwania dźwięku do rozmiaru osi X lub 100 w inny sposób. Jeśli podano w
łącznie z -d, ta opcja wpływa na szerokość spektrogramu;
w przeciwnym razie wpływa na czas trwania spektrogramu. num może być od 1
(niska rozdzielczość czasowa) do 5000 (wysoka rozdzielczość czasowa) i nie musi być
liczba całkowita. SoX może dokonać niewielkiej korekty podanej liczby dla
przyczyny kwantyzacji przetwarzania; jeśli tak, SoX zgłosi rzeczywistą liczbę
używane (widoczne, gdy opcja globalna SoX -V obowiązuje). Zobacz też -x oraz
-d.

-y num Ustawia rozmiar osi Y w pikselach (na kanał); to jest liczba
„binsy” częstotliwości używane w analizie Fouriera, która generuje spektrogram.
Uwaga: wytwarzanie spektrogramu może być powolne, jeśli liczba ta nie jest jedna
więcej niż potęga dwójki (np. 129). Domyślnie wybrany jest rozmiar osi Y
automatycznie (w zależności od liczby kanałów). Widzieć -Y dla alternatywy
sposób ustawiania wysokości spektrogramu.

-Y num Ustawia docelową całkowitą wysokość spektrogramu(ów). Domyślna wartość to
550 pikseli. Używając tej opcji (i domyślnie), SoX wybierze wysokość
dla poszczególnych kanałów spektrogramu o jeden więcej niż potęga dwójki, więc
rzeczywista wysokość całkowita może być niższa od podanej liczby. Jednak tam
to również minimalna wysokość na kanał, więc jeśli jest wiele kanałów,
liczba może zostać przekroczona. Widzieć -y dla alternatywnego sposobu ustawiania spektrogramu
wysokość.

-z num Zakres osi Z (kolor) w dB, domyślnie 120. Ustawia to zakres dynamiczny
spektrogram ma być -num dBFS do 0 dBFS. Ilość może wynosić od 20 do 180.
Zmniejszenie zakresu dynamicznego skutecznie zwiększa „kontrast”
wyświetlanie spektrogramu i odwrotnie.

-Z num Ustawia górną granicę osi Z w dBFS. Negatyw num faktycznie
zwiększa „jasność” wyświetlacza spektrogramu i na odwrót.

-q num Ustawia kwantyzację osi Z, tj. liczbę różnych kolorów (lub
intensywności), w których renderowane są wartości osi Z. Mała liczba (np. 4) spowoduje
dają efekt podobny do plakatu, ułatwiając rozróżnianie pasm wielkości
podobnym poziomie. Małe liczby zwykle skutkują również małymi plikami PNG. ten
podana liczba określa liczbę kolorów do użycia w zakresie osi Z;
dwa kolory są zarezerwowane do reprezentowania wartości spoza zakresu.

-w Nazwa
Okno: Hann (domyślnie), Hamming, Bartlett, Prostokątne lub Kaiser. ten
spektrogram jest tworzony przy użyciu dyskretnej transformacji Fouriera (DFT)
algorytm. Istotnym parametrem tego algorytmu jest wybór
„funkcja okna”. Domyślnie SoX używa okna Hann, które ma dobre wszystko-
okrągłe właściwości rozdzielczości częstotliwości i zakresu dynamiki. Na lepsze
rozdzielczość częstotliwości (ale niższy zakres dynamiki), wybierz okno Hamminga; dla
wyższy zakres dynamiki (ale gorsza rozdzielczość częstotliwości), wybierz Kaiser
okno. Dostępne są również okna Bartlett i prostokątne.

-W num Parametr regulacji okna. Można to wykorzystać do wprowadzenia niewielkich zmian w
kształt okna Kaiser. Liczba dodatnia (do dziesięciu) zwiększa jego
zakres dynamiczny, liczba ujemna zmniejsza go.

-s Zezwalaj na luźne nakładanie się okien DFT. W niektórych przypadkach może się to zwiększyć
ostrość obrazu i dają większą przyczepność do -x wartość, ale na
koszt niewielkiej utraty widma.

-m Tworzy spektrogram monochromatyczny (domyślnie kolor).

-h Wybiera bogatą paletę kolorów - mniej przyjemną wizualnie niż domyślna
paleta kolorów, ale może ułatwić rozróżnienie różnych poziomów.
Jeśli ta opcja jest używana w połączeniu z -mwynikiem będzie hybryda
paleta monochromatyczna/kolorowa.

-p num Permutuj kolory w palecie kolorów lub hybryd. ten num parametr, od
1 (domyślnie) do 6, wybiera permutację.

-l Tworzy spektrogram „przyjazny dla drukarki” z jasnym tłem (
domyślnie ma ciemne tło).

-a Pomiń wyświetlanie linii osi. Czasami przydaje się to w pomaganiu
rozpoznawać artefakty na krawędziach spektrogramu.

-r Surowy spektrogram: pomiń wyświetlanie osi i legend.

-A Wybiera alternatywny, stały zestaw kolorów. Jest to przewidziane tylko dla
kompatybilność ze spektrogramami wyprodukowanymi przez inny pakiet. Nie powinno
zwykle używany, ponieważ ma pewne problemy, nie tylko brak
różnicowanie na dole, które powoduje maskowanie niskiego poziomu
artefakty.

-t XNUMX
Ustaw tytuł obrazu - tekst do wyświetlenia nad spektrogramem.

-c XNUMX
Ustaw (lub wyczyść) komentarz do obrazu - tekst do wyświetlenia poniżej i po lewej stronie
spektrogram.

-o XNUMX
Nazwa pliku wyjściowego spektrogramu PNG, domyślnie `spectrogram.png'.

Zaawansowany Opcje:
Aby przetworzyć mniejszą część dźwięku bez wpływu na inne efekty lub
sygnał wyjściowy (w przeciwieństwie do sytuacji, gdy trym używany jest efekt), następujące opcje mogą:
być użytym.

-d czas trwania
Ta opcja ustawia rozdzielczość osi X tak, że dźwięk o podanym
czas trwania ([[HH:]MM:]SS) pasuje do wybranej (lub domyślnej) szerokości osi X. Do
przykład,
sox input.mp3 output.wav -n spektrogram -d 1:00 stats
tworzy spektrogram pokazujący pierwszą minutę dźwięku, podczas gdy
dotychczasowy statystyki efekt jest stosowany do całego sygnału audio.

Zobacz też -X dla alternatywnego sposobu ustawiania rozdzielczości w osi X.

-S czas
Rozpocznij spektrogram w wybranym punkcie strumienia audio. Na przykład
sox input.aiff output.wav spektrogram -S 1:00
tworzy spektrogram pokazujący wszystko oprócz pierwszej minuty dźwięku (
plik wyjściowy otrzymuje jednak cały strumień audio).

Aby uzyskać informacje o możliwości przetwarzania danych spektralnych w trybie off-line, zobacz stan
efekt.

prędkość czynnik[c]
Dostosuj prędkość dźwięku (razem wysokość i tempo). czynnik to albo stosunek
nowa prędkość do starej prędkości: większa niż 1 przyspiesza, mniej niż 1 zwalnia,
lub, jeśli dołączona jest litera `c', liczba centów (tj. setnych części a
półton), o jaką należy dostosować wysokość (i tempo): większe niż 0
wzrasta, mniej niż 0 maleje.

Technicznie rzecz biorąc, efekt prędkości zmienia tylko informacje o częstotliwości próbkowania, pozostawiając
próbki same w sobie nietknięte. ten stawka efekt jest wywoływany automatycznie w celu ponownego próbkowania
do wyjściowej częstotliwości próbkowania, używając domyślnej jakości/szybkości. Dla wyższej jakości lub
szybsze resampling, oprócz prędkość efekt, określ stawka efekt
z żądaną opcją jakości.

Zobacz też zagiąć, smoła, tempo efekty.

splatać [-h|-t|-q] { position[,nadmiar[,dryf]] }
Połącz ze sobą sekcje audio. Ten efekt zapewnia dwie rzeczy w porównaniu z prostym dźwiękiem
konkatenacja: na złączeniu stosowane jest (zwykle krótkie) przenikanie, a fala
porównanie podobieństwa ma na celu pomóc w określeniu najlepszego miejsca, w którym można dokonać
Przystąp.

Jedna z opcji -h, -tlub -q można podać, aby wybrać zanikającą kopertę jako pół-
fala cosinusowa (domyślna), trójkątna (inaczej liniowa) lub ćwierć-cosinusowa
odpowiednio.

Typ Audio Zgasnąć poziom Przejścia
t skorelowane stałe wzmocnienie nagłe
h skorelowane stałe wzmocnienie gładkie
q nieskorelowana stała moc gładka

Aby wykonać łączenie, najpierw użyj trym efekt, aby wybrać sekcje audio, które mają być
połączone razem. Podobnie jak w przypadku łączenia taśmy, koniec odcinka należy
naklejane należy przyciąć małą nadmiar (domyślnie 0.005 sekundy) dźwięku
po idealnym punkcie połączenia. Początek sekcji audio do połączenia
powinny być przycięte tym samym nadmiar (przed idealnym punktem połączenia), plus an
dodatkowy dryf (domyślnie 0.005 sekundy). Następnie należy wywołać SoX z dwoma
sekcje audio jako pliki wejściowe i splatać efekt podany z pozycją w
który wykonać spaw - jest to długość pierwszej sekcji audio (w tym
nadmiar).

Poniższy diagram wykorzystuje analogię do taśmy, aby zilustrować operację łączenia.
Efekt symuluje przecięcia ukośne i łączy dwa kawałki:

długość1 nadwyżka
------------><--->
_________ : : __________________
\ : : :\ `
\ : : : \ `
\: : : \ `
*: : * - - *
\ : : :\ `
\ : : : \ `
_______________\: : : \______`____
: : : :
<---> <----->
nadmiar swobody

gdzie * oznacza punkty łączenia.

Na przykład długa piosenka zaczyna się od dwóch zwrotek, które zaczynają się (jak określa np
używając grać polecenie z trym (początek) efekt) w godzinach 0:30.125 i
1:03.432. Następujące polecenia wycinają pierwszy werset:
sox zbyt długi.wav part1.wav wykończenia 0 30.130
(przekroczenie 5 ms, po rozpoczęciu pierwszej zwrotki)
sox too-long.wav part2.wav wykończenia 1:03.422
(5 ms nadmiaru plus 5 ms luzu, przed rozpoczęciem drugiej zwrotki)
sox część1.wav część2.wav just-right.wav splot 30.130
Na inny przykład polecenie SoX
play "|sox -n -p synth 1 sin %1" "|sox -n -p synth 1 sin %3"
generuje i odtwarza dwie nuty, ale na przejściu słychać nieprzyjemne kliknięcie; ten
kliknięcie można usunąć przez splatanie zamiast łączenia dźwięku, tj. przez
dołączanie splatać 1 do polecenia. (Kliknięcia na początku i końcu dźwięku
można usunąć przez poprzedzający efekt splotu z blaknąć q .01 2 .01).

Pod warunkiem, że twoja arytmetyka jest wystarczająco dobra, można wykonać wiele spawów za pomocą
pojedynczy splatać wezwanie. Na przykład:
#!/ Bin / sh
# Kopiowanie i wklejanie dźwięku
# plik wejściowy acpo kopiuj-rozpocznij kopiuj-zatrzymaj wklej-nad-początku plik wyjściowy
# Wszystkie czasy mierzone w próbkach.
rate=`soxi -r "$1"`
e=`expr $rate '*' 5 / 1000` # Korzystanie z domyślnej nadwyżki
l=$e # i luz.
sox "$1" kawałek.wav wykończenia `expr $2 - $e - $l`s \
`wyraż 3 $ - 2 $ + $ e + $ l + $ e`s
sox "$1" part1.wav wykończenia 0 `wyraż $4 + $e`s
sox "$1" part2.wav wykończenia `expr $4 + $3 - $2 - $e - $l`s
sox part1.wav piece.wav part2.wav Łączenie "$5" \
wyraż 4 USD + e \
`wyraż $4 + $e + 3 $ - $2 + $e + $l + $e`s
W powyższym skrypcie powłoki Bourne'a do `kopiowania i wklejania' dźwięku używane są dwa połączenia.

* * *

Możliwe jest również użycie tego efektu do wykonywania ogólnych przejść, np. do przyłączenia się
dwie piosenki. W tym przypadku, nadmiar będzie to zwykle liczba sekund, -q
zazwyczaj podana byłaby opcja (aby wybrać przenikanie o 'równej mocy') i dryf
powinna wynosić zero (co jest wartością domyślną, jeśli -q jest podawany). Na przykład, jeśli f1.wav i
f2.wav to pliki audio do crossfadingu, więc
sox f1.wav f2.wav out.wav splice -q $(soxi -D f1.wav),3
przenikanie plików, w których punkt równej głośności znajduje się 3 sekundy przed końcem
f1.wav, tj. całkowita długość przenikania wynosi 2 × 3 = 6 sekund (Uwaga:
Notacja $(...) jest powłoką POSIX).

stan [-s skala] [-rms] [-częst] [-v] [-d]
Wyświetlaj informacje statystyczne w dziedzinie czasu i częstotliwości dotyczące dźwięku. Audio
jest przekazywany w postaci niezmodyfikowanej przez łańcuch przetwarzania SoX.

Informacje są wyprowadzane do strumienia `standardowego błędu' (stderr) i są
obliczone, gdzie n to czas trwania dźwięku w próbkach, c jest liczbą
kanały audio, r to częstotliwość próbkowania dźwięku, oraz xk reprezentuje wartość PCM (w
zakres od -1 do +1 domyślnie) każdej kolejnej próbki dźwięku w następujący sposób:

próbki czytać n×c
Długość (sekundy) n÷r
Skalowane by Zobacz -s poniżej.
Maksymalny amplituda maks. (xk) Maksymalna wartość próbki
w dźwięku; zwykle
to będzie pozytywne
liczba.
Minimum amplituda min (xk) Minimalna wartość próbki
w dźwięku; zwykle
to będzie negatywny
liczba.
Linia środkowa amplituda ½ min (xk)+½maks.(xk)
Oznaczać norma ¹/nΣ│xk│ Średnia z
bezwzględna wartość każdego
próbka w dźwięku.
Oznaczać amplituda ¹/nΣxk Średnia każdego
próbka w dźwięku. Gdyby
ta liczba jest niezerowa,
to wskazuje
obecność DC
przesunięcie (które może być
usunięte za pomocą
przesunięcie dc efekt).
RMS amplituda √(¹/nΣ)xk²) Poziom DC
sygnał, który miałby
ta sama moc co
średnia moc dźwięku.
Maksymalny delta maks. (│xk-xk-1)
Minimum delta min (│xk-xk-1)
Oznaczać delta ¹/n-1Σ│xk-xk-1
RMS delta √(¹/n-1Σ(xk-xk-1)²)
Szorstki częstotliwość W Hz.
objętość Regulacja Parametr do vol
efekt, który sprawi, że
dźwięk tak głośny jak
możliwe bez
obrzynek. Uwaga: Zobacz
dyskusja na temat Strzyżenie
powyżej z powodów dlaczego
rzadko jest dobrym pomysłem
właściwie to zrobić.

Należy zauważyć, że pomiary delta nie mają zastosowania do dźwięku wielokanałowego.

-s opcja może służyć do skalowania danych wejściowych o zadany współczynnik. Domyślny
wartość skala to 2147483647 (tj. maksymalna wartość 32-bitowej liczby całkowitej ze znakiem).
Efekty wewnętrzne zawsze działają z podpisanymi długimi danymi PCM, więc wartość powinna
odnoszą się do tego faktu.

-rms opcja przekonwertuje wszystkie wyjściowe wartości średnie na `średnią kwadratową'
Format.

-v opcja wyświetla tylko wartość `Regulacja głośności'.

-częst opcja oblicza widmo mocy wejścia (4096 punktów DFT) zamiast
statystyki wymienione powyżej. Powinno to być używane tylko z dźwiękiem jednokanałowym
plik.

-d opcja wyświetla zrzut szesnastkowy 32-bitowego podpisanego dźwięku PCM w SoX
bufor wewnętrzny. Jest to używane głównie w celu wyśledzenia problemów endian, które
czasami występują w wieloplatformowych wersjach SoX.

Zobacz też statystyki efekt.

statystyki [-b Bity|-x Bity|-s skala] [-w czas okienny]
Wyświetlaj informacje statystyczne w dziedzinie czasu dotyczące kanałów audio; dźwięk jest
przeszedł niezmodyfikowany przez łańcuch przetwarzania SoX. Statystyki są obliczane i
wyświetlane dla każdego kanału audio i, w stosownych przypadkach, również ogólna liczba
dany.

Na przykład dla typowego, dobrze przygotowanego pliku muzycznego stereo:

Ogólnie lewy prawy
Przesunięcie DC 0.000803 -0.000391 0.000803
Poziom minimalny -0.750977 -0.750977 -0.653412
Maksymalny poziom 0.708801 0.708801 0.653534
Pk lew dB -2.49 -2.49 -3.69
RMS poziom dB -19.41 -19.13 -19.71
RMS Pk dB -13.82 -13.82 -14.38
RMS Tr dB -85.25 -85.25 -82.66
Współczynnik szczytu - 6.79 6.32
Współczynnik płaski 0.00 0.00 0.00
Ilość PK 2 2 2
Głębokość bitowa 16/16 16/16 16/16
Liczba próbek 7.72M
Długość s 174.973
Skala maks. 1.000000
Okna 0.050

DC offset, Min poziom, Max poziom są wyświetlane domyślnie w zakresie ±1. Jeśli
-b (bity) zostaną podane opcje, wtedy te trzy pomiary zostaną przeskalowane do a
liczba całkowita ze znakiem z podaną liczbą bitów; na przykład dla 16 bitów skala
byłoby od -32768 do +32767. ten -x opcja zachowuje się tak samo jak -b oprócz tego
wartości liczb całkowitych ze znakiem są wyświetlane w systemie szesnastkowym. ten -s opcja skaluje
trzy pomiary przez daną liczbę zmiennoprzecinkową.

Pk lew dB oraz RMS lew dB to standardowy poziom szczytowy i RMS mierzony w dBFS.
RMS Pk dB oraz RMS Tr dB to wartości szczytowe i minimalne dla poziomu RMS mierzonego przez a
krótkie okno (domyślnie 50ms).

Herb czynnik to standardowy stosunek wartości szczytowej do poziomu RMS (uwaga: nie w dB).

Mieszkanie czynnik jest miarą płaskości (tzn. kolejnych próbek o takich samych
wartość) sygnału na jego szczytowych poziomach (tj. albo Min poziomlub Max poziom).
Pk liczyć to liczba przypadków (nie liczba próbek), w których sygnał
osiągnął albo Min poziomlub Max poziom.

Prawa ręka Głębokość bitowa liczba jest standardową definicją głębi bitowej, tj. bitów
mniej znaczące niż podana liczba są ustalone na zero. Postać po lewej stronie to
liczba najbardziej znaczących bitów, które są ustalone na zero (lub jeden dla ujemnych)
liczby) odejmowane od cyfry po prawej stronie (liczba odejmowana jest bezpośrednio
związany z Pk lew dB).

W przypadku dźwięku wielokanałowego ogólna wartość dla każdego z powyższych pomiarów wynosi
podane i wyprowadzone z danych kanału w następujący sposób: DC offset: maksimum
ogrom; Max poziom, Pk lew dB, RMS Pk dB, Głębokość bitowa: maksymalna; Min poziom,
RMS Tr dB: minimalna; RMS lew dB, Mieszkanie czynnik, Pk liczyć: przeciętny; Herb czynnik: nie
odpowiedni.

Długość s to czas trwania dźwięku w sekundach, oraz Ilość próbki jest równy
częstotliwość próbkowania pomnożona przez Długość. Skala Max to skalowanie zastosowane do pierwszego?
trzy pomiary; w szczególności jest to maksymalna wartość, która może mieć zastosowanie do
Max poziom. okno s to długość okna użytego dla szczytu i doliny RMS
pomiary.

Zobacz też stan efekt.

zamiana Zamień kanały stereo. Zobacz też remix dla efektu, który pozwala na dowolny kanał
selekcja i zamawianie (oraz mieszanie).

rozciągać czynnik [okno blaknąć przesunięcie zblakły]
Zmień czas trwania dźwięku (ale nie jego wysokość). Ten efekt jest zasadniczo równoważny
do tempo efekt z (czynnik odwrócony i) szukanie ustawić na zero, więc ogólnie
jego wyniki są stosunkowo słabe; jest zachowywany, ponieważ czasami może być lepszy
tempo dla małych czynniks.

czynnik rozciągania: >1 wydłuż, <1 skróć czas. okno rozmiar jest w ms.
Wartość domyślna to 20ms. ten blaknąć opcja może być `lin'. przesunięcie stosunek, w [0 1]. Domyślny
zależy od współczynnika rozciągania. 1 skrócić, 0.8 wydłużyć. ten zblakły stosunek, w [0
0.5]. Wielkość domyślnego zanikania zależy od czynnik oraz przesunięcie.

Zobacz też tempo efekt.

synth [-j KEY] [-n] [len [poza [ph [p1 [p2 [p3]]]]]] {[rodzaj] [połączyć]
[[%]częst[k][:|+|/|-[%]częst.2[k]]] [poza [ph [p1 [p2 [p3]]]]]}
Ten efekt może być używany do generowania dźwięków o stałej lub przesuniętej częstotliwości za pomocą
różne kształty fal lub do generowania szumu szerokopasmowego o różnych „kolorach”. Wiele
efekty syntezatora można łączyć kaskadowo w celu wytworzenia bardziej złożonych przebiegów; na każdym etapie to
można wybrać, czy generowany przebieg będzie mieszany z, czy
modulowane na wyjściu z poprzedniego etapu. Dźwięk dla każdego kanału w a
wielokanałowy plik audio można zsyntetyzować niezależnie.

Chociaż ten efekt jest używany do generowania dźwięku, nadal należy podać plik wejściowy,
których charakterystyka zostanie wykorzystana do ustawienia długości syntetyzowanego dźwięku,
liczba kanałów i częstotliwość próbkowania; jednak ponieważ dźwięk pliku wejściowego jest
normalnie nie potrzebne, `pusty plik' (o specjalnej nazwie) -n) jest często podawany
zamiast tego (i długość określoną jako parametr do synth lub przez inny podany
efekt, który może mieć powiązaną długość).

Na przykład, poniższy kod tworzy 3-sekundowy, 48kHz plik audio zawierający
fala sinusoidalna przesunięta od 300 do 3300 Hz:
sox -n wyjście.wav syntezator 3 sinus 300-3300
a to daje wersję 8 kHz:
sox -r 8000 -n wyjście.wav syntezator 3 sinus 300-3300
Można zsyntetyzować wiele kanałów, określając zestaw pokazanych parametrów
między nawiasami klamrowymi wielokrotnie; następujące umieszcza przetoczony ton w lewo
kanał i dodaje "brązowy" szum po prawej:
sox -n wyjście.wav syntezator 3 sine 300-3300 brownnoise
Poniższy przykład pokazuje, jak dwa efekty syntezatora można połączyć kaskadowo, aby stworzyć więcej
przebieg złożony:
play -n syntezator 0.5 sine 200-500 syntezator 0.5 sine fmod 700-100
Częstotliwości można również podać w notacji „naukowej” lub przedrostkiem „%”
jako liczba półtonów w stosunku do „środkowego A” (440 Hz). Na przykład,
do nastrojenia niskiego struny „E” gitary można użyć następujących elementów:
play -n syntezator 4 pluck %-29
lub z pętlą (powłoka Bourne'a), cała gitara:
dla n w E2 A2 D3 G3 B3 E4; robić
play -n syntezator 4 szarp $n powtórz 2; Gotowe
Zobacz opóźnienie efekt (powyżej) i odniesienie do `przykładów skryptów SoX' (poniżej)
więcej synth przykłady.

NB Ten efekt generuje dźwięk przy maksymalnej głośności (0dBFS), co oznacza, że
jest duża szansa na przycięcie podczas późniejszego używania dźwięku, więc w wielu przypadkach
będziesz chciał śledzić ten efekt za pomocą zdobyć efekt, aby temu zapobiec
wydarzenie. (Zobacz też Strzyżenie powyżej). Zauważ, że domyślnie synth efekt
zawiera funkcjonalność zdobyć -h (Patrz zdobyć wpływ na szczegóły);
synth's -n można podać opcję wyłączenia tego zachowania.

Szczegółowy opis każdego synth parametr następujący:

len to długość dźwięku do zsyntetyzowania wyrażona jako czas lub liczba
próbki; 0=długość wejściowa, domyślnie=0.

Format określania długości w czasie to hh:mm:ss.frac. Format dla
określenie liczby próbek to liczba próbek z dołączoną literą `s'
to.

rodzaj jest jednym z sinus, kwadrat, trójkąt, piłokształtny, trapez, exp, [biały] szum,
tpdfszum różowyszum, brązowyszum, wyrwanie; domyślnie=sinus.

połączyć to tworzenie, miksowanie, amod (modulacja amplitudy), fmod (częstotliwość
modulacja); default=utwórz.

częst/częst.2 to częstotliwości na początku/końcu syntezy w Hz lub, jeśli
poprzedzone `%', półtony względem A (440 Hz); alternatywnie „naukowy”
notacja nutowa (np. E2) może być użyta. Domyślna częstotliwość to 440 Hz. Domyślnie,
strojenie używane z notacjami nutowymi to „równy temperament”; ten -j KEY opcja
wybiera `tylko intonację', gdzie KEY jest liczbą całkowitą półtonów w stosunku do
A (więc na przykład -9 lub 3 wybiera klawisz C) lub notatka w notacji naukowej.

If częst.2 jest podane, wtedy len musiał być również podany, a wygenerowany ton będzie
być przesuniętym pomiędzy podanymi częstotliwościami. Dwie podane częstotliwości muszą być
oddzielone jednym ze znaków `:', `+', `/' lub `-'. Ten znak jest używany
aby określić funkcję wobulacji w następujący sposób:

: Liniowy: ton zmieni się o ustaloną liczbę herców na sekundę.

+ Kwadrat: funkcja drugiego rzędu służy do zmiany tonu.

/ Wykładniczy: ton zmieni się o ustaloną liczbę półtonów na sekundę.

- Wykładniczy: jak `/', ale faza początkowa zawsze zero i schodkowa (mniejsza
płynne) zmiany częstotliwości.

Nie używany do hałasu.

poza jest odchyleniem (przesunięcie DC) sygnału w procentach; domyślnie=0.

ph jest przesunięciem fazowym w procentach 1 cyklu; domyślnie=0. Nie używany do hałasu.

p1 to procent każdego cyklu, który jest włączony (kwadrat) lub rośnie (trójkąt,
exp, trapez); default=50 (kwadrat, trójkąt, exp), default=10 (trapez), lub
podtrzymać (wyskubać); domyślnie=40.

p2 (trapez): procent w każdym cyklu, w którym zaczyna się „opadanie”;
domyślnie=50. exp: amplituda w wielokrotności 2dB; domyślnie=50 lub ton-1 (wyrywać);
domyślnie=20.

p3 (trapez): procent w każdym cyklu, w którym kończy się „opadanie”;
domyślnie=60 lub ton-2 (wyrywać); domyślnie=90.

tempo [-q] [-m|-s|-l] czynnik [segment [szukanie [zakładka]]]
Zmień prędkość odtwarzania dźwięku, ale nie jego wysokość. Ten efekt wykorzystuje WSOLA
algorytm. Dźwięk jest dzielony na segmenty, które są następnie przesuwane w czasie
domenę i nakładają się (przenikają) w punktach, w których ich przebiegi są najbardziej
podobnie jak wyznaczono przez pomiar „najmniejszych kwadratów”.

Domyślnie w celu znalezienia najlepszych nakładających się punktów używane są wyszukiwania liniowe. Jeśli
fakultatywny -q podany jest parametr, zamiast tego używane są wyszukiwania w drzewie. To sprawia, że
efekt działa szybciej, ale wynik może nie brzmieć tak dobrze. Jeśli jednak
musi poprawić szybkość przetwarzania, co generalnie zmniejsza jakość dźwięku
niż zmniejszenie wartości wyszukiwania lub nakładania się.

-m opcja służy do optymalizacji domyślnych wartości segmentu, wyszukiwania i nakładania się
przetwarzanie muzyki.

-s opcja służy do optymalizacji domyślnych wartości segmentu, wyszukiwania i nakładania się
przetwarzanie mowy.

-l opcja służy do optymalizacji domyślnych wartości segmentu, wyszukiwania i nakładania się
przetwarzanie „liniowe”, które powoduje bardziej zauważalne zniekształcenia, ale może być
przydatne, gdy współczynnik jest bliski 1.

Jeśli podano -m, -s lub -l, zostanie obliczona domyślna wartość segmentu
na podstawie współczynnika, podczas gdy domyślne wartości wyszukiwania i nakładania są oparte na segmencie. Każdy
podane wartości nadal zastępują te wartości domyślne.

czynnik podaje stosunek nowego tempa do starego tempa, więc np. 1.1 przyspiesza
tempo o 10%, a 0.9 spowalnia je o 10%.

Opcjonalne segment parametr wybiera wielkość segmentu algorytmu w
milisekundy. Jeśli nie określono innych flag, wartością domyślną jest 82 i jest
zazwyczaj nadaje się do wprowadzania niewielkich zmian w tempie muzyki. W przypadku większych zmian
(np. współczynnik 2), 41 ms może dać lepszy wynik. Flagi -m, -s i -l
spowoduje, że wartość domyślna segmentu zostanie automatycznie dostosowana na podstawie współczynnika. Do
przykład użycie -s (dla mowy) w tempie 1.25 obliczy domyślny segment
wartość 32.

Opcjonalne szukanie parametr podaje długość dźwięku w milisekundach, przez którą
algorytm wyszuka nakładające się punkty. Jeśli nie określono innych flag,
wartość domyślna to 14.68. Większe wartości zużywają więcej czasu przetwarzania i mogą, ale nie muszą
dają lepsze wyniki. Praktyczne maksimum to połowa wartości segmentu. Szukaj
można skrócić, aby skrócić czas przetwarzania, ryzykując pogorszenie jakości wydruku. ten
Flagi -m, -s i -l spowodują automatyczne dostosowanie domyślnego wyszukiwania
na podstawie segmentu.

Opcjonalne zakładka parametr podaje długość nakładania się segmentu w milisekundach.
Wartość domyślna to 12, ale flagi -m, -s lub -l automatycznie dostosowują nakładanie się na podstawie
rozmiar segmentu. Zwiększenie nakładania się wydłuża czas przetwarzania i może wzrosnąć
jakość. Praktycznym maksimum dla nakładania się jest wartość wyszukiwania, z nakładaniem się
zazwyczaj jest (przynajmniej) trochę mniejszy niż wyszukiwanie.

Zobacz też prędkość dla efektu, który razem zmienia tempo i wysokość dźwięku, smoła oraz zagiąć
dla efektów, które zmieniają tylko wysokość dźwięku, oraz rozciągać dla efektu zmieniającego tempo
przy użyciu innego algorytmu.

potrójny zdobyć [częstotliwość[k] [szerokość[s|h|k|o|q]]]
Zastosuj efekt kontroli tonów wysokich. Zobacz opis bas efekt dla
detale.

tremolo prędkość [głębokość]
Zastosuj do dźwięku efekt tremolo (modulacja amplitudy niskich częstotliwości). ten
częstotliwość tremolo w Hz wyraża prędkość, a głębokość w procentach o głębokość
(domyślnie 40).

trym {[=|-]position}
Wycina fragmenty dźwięku. Dowolna liczba positionmożna podać s; dźwięk nie jest
wysłane do wyjścia do pierwszego position został osiągnięty. Efekt następnie się zmienia
między kopiowaniem a odrzucaniem dźwięku w każdym position.

Jeśli position jest poprzedzony znakiem równości lub minus, jest interpretowany względem
odpowiednio na początku lub na końcu dźwięku. (Długość dźwięku musi wynosić
znane z tego, że działają lokalizacje względem końca). W przeciwnym razie jest to uważane za przesunięcie
od ostatniego position, lub od początku audio dla pierwszego parametru. Za pomocą
wartość 0 dla pierwszego position parametr umożliwia kopiowanie od początku
dźwięk.

Wszystkie parametry można określić za pomocą czasu lub dokładnej liczby
próbki. Format określania długości w czasie to hh:mm:ss.frac. Wartość
1:30.5 dla pierwszego parametru nie rozpocznie się przed upływem 1 minuty, trzydziestu i ½ sekundy
do dźwięku. Format określania liczby próbek to liczba próbek
z dołączoną do niego literą „s”. Wartość 8000s dla pierwszego parametru będzie
poczekaj, aż 8000 próbek zostanie odczytanych przed rozpoczęciem przetwarzania dźwięku.

Na przykład,
sox infile outfile wykończenia 0 10
skopiuje pierwsze dziesięć sekund, podczas gdy
odtwórz przycinanie w pliku 12:34 =15:00 -2:00
będzie odtwarzany od 12 minut 34 sekund dźwięku do 15 minut dźwięku
(tj. 2 minuty i 26 sekund), a następnie wznów grę dwie minuty przed
koniec dźwięku.

nadpróbkowanie [czynnik]
Upsampluj sygnał o współczynnik całkowity: czynnik-1 wstawiono próbki o zerowej wartości
między każdą parą próbek wejściowych. W rezultacie oryginalne widmo jest
replikowane do nowej przestrzeni częstotliwości (aliasing) i tłumione. Ten
tłumienie można skompensować dodając vol czynnik po jakimkolwiek dalszym
przetwarzanie. Efekt upsample jest zwykle używany w połączeniu z filtrowaniem
efekty.

Aby uzyskać ogólny efekt resamplingu z wygładzaniem, zobacz stawka. Zobacz też próbkowanie w dół.

jak [Opcje]
Wykrywacz aktywności głosowej. Próby wyciszenia ciszy i cichych dźwięków tła z
końcówek (dość wysokiej rozdzielczości tj. 16-bit, 44-48kHz) nagrań mowy.
Algorytm wykorzystuje obecnie prosty pomiar mocy cepstralnej do wykrywania głosu,
więc może dać się zwieść innym rzeczom, zwłaszcza muzyce. Efekt można przyciąć tylko od
przód audio, więc aby przyciąć od tyłu, rewers efekt musi
również być używany. Np
odtwarzaj mowę.wav norma vad
do wykończenia z przodu,
odtwarzaj mowę.wav norma odwrócona vad odwrotna
przyciąć od tyłu i
odtwarzaj mowę.wav norma vad odwrócona vad odwrotna
do przycięcia z obu końców. Użycie norma efekt zalecany, ale pamiętaj
to też nie rewers ani norma nadaje się do użytku ze strumieniowym dźwiękiem.

Opcje:
Wartości domyślne są pokazane w nawiasach.

-t num (7)
Poziom pomiaru używany do wyzwalania wykrywania aktywności. To może potrzebować
do zmiany w zależności od poziomu hałasu, poziomu sygnału i innych
charakterystyka wejściowego dźwięku.

-T num (0.25)
Stała czasowa (w sekundach) używana do ignorowania krótkich serii dźwięków.

-s num (1)
Ilość dźwięku (w sekundach) potrzebna do wyszukania cichszych/krótszych wybuchów
dźwięk do uwzględnienia przed wykrytym punktem wyzwalania.

-g num (0.25)
Dozwolona przerwa (w sekundach) między cichszymi/krótszymi seriami dźwięku do włączenia
przed wykrytym punktem wyzwalania.

-p num (0)
Ilość dźwięku (w sekundach) do zachowania przed punktem wyzwalania i
wszelkie znalezione cichsze/krótsze wybuchy.

Zaawansowany Opcje:
Pozwalają one na precyzyjne dostrojenie wewnętrznych parametrów algorytmu.

-b num Algorytm (wewnętrznie) wykorzystuje adaptacyjną estymację/redukcję szumu w kolejności
aby wykryć początek żądanego dźwięku. Ta opcja ustawia czas na
wstępne oszacowanie hałasu.

-N num Stała czasowa używana przez adaptacyjny estymator hałasu, gdy poziom hałasu
wzrasta.

-n num Stała czasowa używana przez adaptacyjny estymator hałasu, gdy poziom hałasu
zmniejsza się.

-r num Wielkość redukcji szumów do zastosowania w algorytmie detekcji (np. 0, 0.5,
...).

-f num Częstotliwość przetwarzania/pomiarów algorytmu.

-m num czas trwania pomiaru; domyślnie dwukrotny okres pomiarowy; tj. z
zakładka.

-M num Stała czasowa używana do wygładzania pomiarów spektralnych.

-h num Częstotliwość „ściany ceglanej” filtra górnoprzepustowego zastosowanego na wejściu do
algorytm detektora.

-l num Częstotliwość „ściany ceglanej” filtra dolnoprzepustowego zastosowanego na wejściu do
algorytm detektora.

-H num Częstotliwość „ściany ceglanej” podnośnika górnoprzepustowego użyta w algorytmie detektora.

-L num Częstotliwość „ściany ceglanej” podnośnika dolnoprzepustowego użyta w algorytmie detektora.

Zobacz też cisza efekt.

vol zdobyć [rodzaj [Ogranicznik]]
Zastosuj wzmocnienie lub tłumienie sygnału audio. w przeciwieństwie do -v opcja
(który służy do równoważenia wielu plików wejściowych, gdy wchodzą one do efektów SoX
łańcuch przetwarzania), vol jest efektem jak każdy inny, więc można go zastosować w dowolnym miejscu i
kilka razy, jeśli to konieczne, podczas łańcucha przetwarzania.

Kwota do zmiany głośności jest podana przez zdobyć co jest interpretowane według
dany rodzaj, w następujący sposób: jeśli rodzaj is amplituda (lub jest pominięty), wtedy zdobyć jest
stosunek amplitudy (tj. napięcia lub liniowej), jeśli power, a następnie moc (tj. moc lub
stosunek napięcia do kwadratu), a jeśli dB, a następnie zmiana mocy w dB.

Kiedy rodzaj is amplituda or power, A zdobyć 1 pozostawia głośność bez zmian, mniej niż
1 zmniejsza ją, a więcej niż 1 ją zwiększa; negatyw zdobyć odwraca dźwięk
sygnał oprócz regulacji jego głośności.

Kiedy rodzaj is dB, A zdobyć 0 pozostawia głośność bez zmian, mniej niż 0 ją zmniejsza,
a większa niż 0 zwiększa ją.

Zobacz [4], aby uzyskać szczegółowe omówienie napięcia elektrycznego (a więc sygnału audio)
i współczynniki mocy.

Uważać na Strzyżenie kiedy zwiększa się głośność.

zdobyć i rodzaj parametry można łączyć w razie potrzeby, np. vol 10dB.

Opcjonalne Ogranicznik wartość może być określona i powinna być wartością znacznie mniejszą niż
1 (np. 0.05 lub 0.02) i jest używany tylko na pikach, aby zapobiec obcinaniu. Nie
określenie tego parametru nie spowoduje użycia ogranicznika. W trybie pełnym to
Efekt wyświetli procent dźwięku, który należało ograniczyć.

Zobacz też zdobyć dla efektu zmiany głośności z różnymi możliwościami, oraz towarzysz
dla efektu kompresji/rozszerzenia/ograniczenia zakresu dynamiki.

Nieaktualna Dodawanie efektów
Zmieniono nazwy następujących efektów lub ich funkcjonalność została uwzględniona w innym
efekt; nadal działają w tej wersji SoX, ale mogą zostać usunięte w przyszłości.

mikser [ -l|-r|-f|-b|-1|-2|-3|-4|n{,n} ]
Zmniejsz liczbę kanałów audio, miksując lub wybierając kanały, lub zwiększ
liczba kanałów poprzez zduplikowanie kanałów. Uwaga: ten efekt działa na
audio kanały w łańcuchu przetwarzania efektów SoX; nie należy tego mylić
z -m opcja globalna (gdzie wielokrotność pliki są mieszane przed wejściem
łańcuch efektów).

Przy zmniejszeniu liczby kanałów można wykorzystać -l, -r, -f, -b, -1,
-2, -3, -4, opcje wyboru tylko lewego, prawego, przedniego, tylnego kanału lub
określony kanał dla wyjścia zamiast uśredniania kanałów. ten -l, -r
opcje wykonają uśrednianie w plikach czterokanałowych, więc wybierz dokładny kanał, aby
temu zapobiec.

mikser efekt można wywołać również za pomocą maksymalnie 16 liczb oddzielonych przecinkami,
które określają proporcję (0 = 0% i 1 = 100%) każdego kanału wejściowego, który ma
być miksowane do każdego kanału wyjściowego. W trybie dwukanałowym podane są 4 liczby: l →
l, l → r, r → l i r → r, odpowiednio. W trybie czterokanałowym pierwsze 4
liczby dają proporcje dla lewego przedniego kanału wyjściowego w następujący sposób: lf →
lf, rf → lf, lb → lf i rb → rf. Kolejne 4 dają wyjście prawy przód w
ta sama kolejność, potem lewy obrońca i prawy obrońca.

Możliwe jest również użycie 16 numerów do rozszerzenia lub zmniejszenia liczby kanałów;
po prostu wpisz 0 dla nieużywanych kanałów.

Wreszcie, dla pewnych można określić pewną zredukowaną kombinację liczb
kombinacje kanałów wejścia/wyjścia.

In Ch wyczerpane Ch Ilość Mapowania
2 1 2 l → l, r → l
2 2 1 wyreguluj balans
4 1 4 lf → l, rf → l, lb → l, rb → l
4 2 2 lf → l&rf → r, lb → l&rb → r
4 4 1 wyreguluj balans
4 4 2 balans przód, balans tył

Ten efekt został zastąpiony przez remix efekt, który obsługuje dowolną liczbę
Kanały.

DIAGNOSTYKA


Status wyjścia to 0 dla braku błędu, 1 jeśli jest problem z parametrami wiersza poleceń,
lub 2, jeśli podczas przetwarzania pliku wystąpi błąd.

Korzystaj z gry online, korzystając z usług onworks.net


Darmowe serwery i stacje robocze

Pobierz aplikacje Windows i Linux

Komendy systemu Linux

Ad




×
reklama
❤️Zrób zakupy, zarezerwuj lub kup tutaj — bezpłatnie, co pomaga utrzymać bezpłatne usługi.