이것은 Ubuntu Online, Fedora Online, Windows 온라인 에뮬레이터 또는 MAC OS 온라인 에뮬레이터와 같은 여러 무료 온라인 워크스테이션 중 하나를 사용하여 OnWorks 무료 호스팅 제공업체에서 실행할 수 있는 rec 명령입니다.
프로그램:
이름
SoX - Sound eXchange, 오디오 조작의 스위스 군용 칼
개요
sox [전역 옵션] [형식 옵션] 인파일1
[[형식 옵션] 인파일2] ... [형식 옵션] 아웃파일
[효과 [효과 옵션]] ...
놀이 [전역 옵션] [형식 옵션] 인파일1
[[형식 옵션] 인파일2] ... [형식 옵션]
[효과 [효과 옵션]] ...
녹화 [전역 옵션] [형식 옵션] 아웃파일
[효과 [효과 옵션]] ...
기술
개요
SoX는 가장 널리 사용되는 형식의 오디오 파일을 읽고 쓰고 선택적으로 효과를 적용할 수 있습니다.
그들에게. 여러 입력 소스를 결합하고 오디오를 합성할 수 있으며 많은 시스템에서
범용 오디오 플레이어 또는 다중 트랙 오디오 레코더 역할을 합니다. 또한 제한된
입력을 여러 출력 파일로 분할하는 기능.
모든 SoX 기능은 다음을 사용하여 사용할 수 있습니다. sox 명령. 연주를 단순화하고
SoX가 다음과 같이 호출되는 경우 오디오 녹음 놀이, 출력 파일은 자동으로
기본 사운드 장치 및 다음과 같이 호출되는 경우 녹화, 기본 사운드 장치가 입력으로 사용됩니다.
원천. 추가적으로, 속시(1) 명령은 오디오를 쿼리하는 편리한 방법을 제공합니다.
파일 헤더 정보.
SoX의 핵심은 libSoX라는 라이브러리입니다. SoX 확장 또는 사용에 관심이 있는 사람
다른 프로그램에서는 libSoX 매뉴얼 페이지를 참조해야 합니다. libsox(3).
SoX는 명령줄 오디오 처리 도구로, 특히 빠르고 간단한
편집 및 일괄 처리. 대화형 그래픽 오디오 편집기가 필요한 경우 다음을 사용하십시오.
대담(1).
* * *
전체 SoX 처리 체인은 다음과 같이 요약할 수 있습니다.
입력 → 결합기 → 효과 → 출력
그러나 SoX 명령줄에서 출력 및 효과의 위치는
방금 표시된 논리 흐름과 교환됩니다. 또한
to 파일은 각각의 파일 이름 앞에 배치되지만 효과의 경우는 그 반대입니다.
이것이 실제로 어떻게 작동하는지 보여주기 위해 다음은 SoX가 어떻게 작동할 수 있는지에 대한 몇 가지 예입니다.
사용 된. 단순한
삭스 리사이틀.au 리사이틀.wav
Sun AU 형식의 오디오 파일을 Microsoft WAV 파일로 변환하는 반면
sox recital.au -b 16 recital.wav 채널 1 속도 16k 페이드 3 표준
동일한 형식 변환을 수행하지만 네 가지 효과도 적용합니다(하나로 다운믹스
채널, 샘플 레이트 변경, 페이드 인, 노멀라이즈)를 수행하고 결과를 비트 심도에 저장합니다.
16.
sox -r 16k -e 서명된 -b 8 -c 1 voice-memo.raw voice-memo.wav
'원시'('헤더리스'라고도 함) 오디오를 자체 설명 파일 형식으로 변환합니다.
sox slow.aiff fixed.aiff 속도 1.027
오디오 속도를 조정하고,
삭스 short.wav long.wav long.wav
두 개의 오디오 파일을 연결하고
sox -m music.mp3 음성.wav 혼합.flac
두 개의 오디오 파일을 함께 믹스합니다.
"Moonbeams/Greatest/*.ogg" 베이스 재생 +3
베이스 부스팅 효과를 적용하면서 오디오 파일 모음을 재생하고,
play -n -c1 synth sin %-12 sin %-9 sin %-5 sin %-2 페이드 h 0.1 1 0.1
파이프 오르간 사운드로 합성된 'A 마이너 세븐스' 코드를 연주하고,
rec -c 2 radio.aiff 트림 0 30:00
XNUMX분의 스테레오 오디오를 녹음하고,
play -q take1.aiff & rec -M take1.aiff take1-dub.aiff
(POSIX 셸을 사용하고 하드웨어에서 지원하는 경우) 멀티 트랙에 새 트랙을 기록합니다.
녹음. 마침내,
rec -r 44100 -b 16 -s -p 침묵 1 0.50 0.1% 1 10:00 0.1% |
sox -p song.ogg 무음 1 0.50 0.1% 1 2.0 0.1% :
newfile : 다시 시작
LP/카세트와 같은 오디오 스트림을 녹음하고 에서 여러 오디오 파일로 분할
2초간 침묵으로 포인트. 또한 감지될 때까지 녹화를 시작하지 않습니다.
오디오가 재생 중이며 10분 동안 묵음이 표시되면 중지됩니다.
NB 위의 내용은 SoX의 기능에 대한 개요일 뿐입니다. 방법에 대한 자세한 설명
사용 모든 SoX 매개변수, 파일 형식 및 효과는 이 설명서의 아래에서 찾을 수 있습니다.
속포맷(7), 그리고 속시(1).
입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 형성 유형
SoX는 '자체 설명' 및 '원시' 오디오 파일과 함께 작동할 수 있습니다. '자체 설명' 형식
(예: WAV, FLAC, MP3)에는 신호 및 인코딩을 완전히 설명하는 헤더가 있습니다.
뒤에 오는 오디오 데이터의 속성. '원시' 또는 '헤더가 없는' 형식에는 다음이 포함되지 않습니다.
따라서 이러한 정보의 오디오 특성은 SoX에 설명되어야 합니다.
명령줄 또는 입력 파일의 명령줄에서 추론합니다.
다음 네 가지 특성은 다음과 같은 오디오 데이터 형식을 설명하는 데 사용됩니다.
SoX로 처리할 수 있습니다.
샘플 속도
초당 샘플 수('헤르츠' 또는 'Hz')의 샘플 속도입니다. 디지털 전화
전통적으로 8000Hz(8kHz)의 샘플 속도를 사용하지만 요즘에는
32kHz가 점점 보편화되고 있습니다. 오디오 컴팩트 디스크는 44100Hz(44.1kHz)를 사용합니다.
디지털 오디오 테이프와 많은 컴퓨터 시스템은 48kHz를 사용합니다. 전문 오디오 시스템
96kHz를 자주 사용합니다.
표본의 크기
각 샘플을 저장하는 데 사용되는 비트 수입니다. 오늘날 16비트가 일반적으로 사용됩니다.
8비트는 컴퓨터 오디오 초기에 인기가 있었습니다. 24비트가 사용됩니다.
전문 오디오 경기장. 다른 크기도 사용됩니다.
데이터 인코딩
각 오디오 샘플이 표현(또는 '인코딩')되는 방식입니다. 일부 인코딩
다른 바이트 순서 또는 비트 순서를 가진 변형이 있습니다. 일부는 압축
저장된 오디오 데이터가 공간을 덜 차지하도록 오디오 데이터(예: 디스크 공간 또는
전송 대역폭) 다른 형식 매개 변수 및 샘플 수보다
암시합니다. 일반적으로 사용되는 인코딩 유형에는 부동 소수점, μ-법칙, ADPCM,
부호 있는 정수 PCM, MP3 및 FLAC.
채널
파일에 포함된 오디오 채널의 수입니다. 하나('모노')와 둘
(`스테레오')가 널리 사용됩니다. '서라운드 사운드' 오디오에는 일반적으로 XNUMX개 이상이 포함됩니다.
채널.
'비트 전송률'이라는 용어는 인코딩된 오디오가 차지하는 스토리지의 양을 측정한 것입니다.
시간 단위로 신호를 보냅니다. 위의 모든 사항에 따라 달라질 수 있으며 일반적으로 다음과 같이 표시됩니다.
초당 킬로비트 수(kbps). A-law 전화 신호의 비트 전송률은 64입니다.
kbps. MP3로 인코딩된 스테레오 음악의 비트 전송률은 일반적으로 128-196kbps입니다. FLAC 인코딩
스테레오 음악의 비트 전송률은 일반적으로 550-760kbps입니다.
대부분의 자체 설명 형식은 텍스트 '주석'이 파일에 포함될 수 있도록 허용합니다.
예를 들어 음악, 제목, 저자 등에 대해 오디오를 설명하는 데 사용할 수 있습니다.
오디오 파일 주석의 중요한 용도 중 하나는 'Replay Gain' 정보를 전달하는 것입니다. SoX
Replay Gain 정보 적용을 지원하지만 생성하지는 않습니다. 기본적으로,
SoX는 입력 파일 주석을 주석을 지원하는 출력 파일에 복사하므로 출력 파일은
일부가 입력 파일에 있는 경우 재생 게인 정보를 포함합니다. 이 경우,
단순 형식 변환 이외의 모든 작업을 수행한 다음 출력 파일 재생
이득 정보는 정확하지 않을 수 있으므로 다음을 수행하는 도구를 사용하여 다시 계산해야 합니다.
(SoX 아님)을 지원합니다.
The 속시(1) 명령을 사용하여 오디오 파일 헤더의 정보를 표시할 수 있습니다.
결정하기 & 환경 The 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 형성
SoX가 형식을 결정하거나 설정하는 데 사용할 수 있는 몇 가지 메커니즘이 있습니다.
오디오 파일의 특성 상황에 따라 개별적으로
특성은 다른 메커니즘을 사용하여 결정되거나 설정될 수 있습니다.
입력 파일의 형식을 결정하기 위해 SoX는 우선 순위에 따라 다음과 같이 사용합니다.
주어진 또는 사용 가능한:
1. 명령줄 형식 옵션.
2. 파일 헤더의 내용.
3. 파일 이름 확장자.
출력 파일 형식을 설정하기 위해 SoX는 우선 순위에 따라 주어진 또는
사용할 수 :
1. 명령줄 형식 옵션.
2. 파일 이름 확장자.
3. 입력 파일 형식 특성 또는 출력에서 지원하는 가장 가까운 형식
파일 형식.
모든 파일에 대해 파일 형식을 결정할 수 없으면 SoX가 오류와 함께 종료됩니다. 명령-
문제를 해결하려면 줄 형식 옵션을 추가하거나 변경해야 할 수 있습니다.
재생 & 녹음 오디오
The 놀이 그리고 녹화 기본 재생 및 녹음이 다음과 같이 간단하도록 명령이 제공됩니다.
기존 파일을 재생합니다.wav
그리고
rec 새 파일.wav
이 두 명령은 기능적으로 다음과 같습니다.
sox 기존 파일.wav -d
그리고
sox -d 새 파일.wav
물론 추가 옵션과 효과(아래 설명 참조)를 명령에 추가할 수 있습니다.
어떤 형태로든.
* * *
일부 시스템은 ALSA 및 OSS와 같은 두 가지 유형 이상의 (SoX 호환) 오디오 드라이버를 제공합니다.
또는 SUNAU & AO. 시스템에는 하나 이상의 오디오 장치('사운드 카드'라고도 함)가 있을 수도 있습니다.
둘 이상의 오디오 드라이버가 SoX에 내장되어 있고 SoX에서 기본값을 선택한 경우
녹음 또는 재생이 원하는 것이 아닌 경우 오디오 드라이버 환경
변수를 사용하여 기본값을 재정의할 수 있습니다. 예를 들어(많은 시스템에서):
AUDIODRIVER=oss 설정
플레이 ...
The 오디오 데브 환경 변수를 사용하여 기본 오디오 장치를 재정의할 수 있습니다.
AUDIODEV=/dev/dsp2 설정
플레이 ...
속스 ... -t oss
or
AUDIODEV=hw:soundwave,1,2로 설정
플레이 ...
삭스 ... -t 알사
환경 변수를 설정하는 방법은 시스템마다 다릅니다.
구체적인 예는 아래의 `SOX_OPTS'를 참조하십시오.
오디오 출력 장치에서 지원하지 않는 샘플 레이트로 파일을 재생할 때,
SoX는 자동으로 율 필요한 샘플링 속도를 수행하는 효과
변환. 기존 하드웨어와의 호환성을 위해 기본 율 품질 수준이
'낮다'. 이것은 명시적으로 지정하여 변경할 수 있습니다. 율 다른 효과
품질 수준, 예
재생 ... 속도 -m
또는 --재생 속도 인수 옵션(아래 참조).
* * *
일부 시스템에서는 SoX를 사용하는 동안 오디오 재생 볼륨을 조정할 수 있습니다. 놀이. 어디에
지원되는 경우 재생 중에 'v' 및 'V' 키를 탭하면 됩니다.
적절한 녹음 레벨 설정을 돕기 위해 SoX에는 피크 레벨 미터가 포함되어 있습니다.
다음과 같이 호출됩니다(실제 녹음을 하기 전에).
Rec -n
녹음 레벨을 조정해야 합니다(SoX가 아닌 시스템에서 제공하는 믹서 프로그램 사용).
미터가 at 가장 때때로 전체 규모이며 결코 '빨간색'(
느낌표 표시). 또한보십시오 -S 아래.
정확성
오디오를 압축하는 많은 파일 형식은 오디오 신호 정보의 일부를 버리는 반면
그렇게하고있다. 이러한 형식으로 변환한 다음 다시 변환하면 다음이 생성되지 않습니다.
원본 오디오의 정확한 사본. 이것은 전화 통신에 사용되는 많은 형식의 경우입니다.
(예: A-law, GSM) 낮은 신호 대역폭이 높은 오디오 충실도보다 더 중요한 경우,
적절한 경우 휴대용 음악 플레이어(예: MP3, Vorbis)에 사용되는 다양한 형식
큰 압축비에서도 충실도를 유지할 수 있습니다.
실용적인 휴대용 플레이어.
오디오 신호 정보를 버리는 형식을 '손실'이라고 합니다. 그렇지 않은 형식
무손실'이라고 합니다. '품질'이라는 용어는 원본에 얼마나 가까운지를 측정하는 데 사용됩니다.
손실 형식을 사용할 때 오디오 신호를 재생할 수 있습니다.
SoX를 사용한 오디오 파일 변환은 가능한 경우 무손실입니다. 즉, 손실을 사용하지 않을 때
압축, 샘플링 속도 또는 채널 수를 줄이지 않을 때 및
대상 형식에 사용된 비트 수는 소스 형식보다 작지 않습니다. 예
8비트 PCM 형식에서 16비트 PCM 형식으로 변환하는 것은 무손실이지만
8비트 PCM 형식에서 (8비트) A-law는 그렇지 않습니다.
NB SoX는 수행하기 전에 모든 오디오 파일을 내부 비압축 형식으로 변환합니다.
모든 오디오 처리. 이는 손실 형식으로 저장된 파일을 조작하는 것을 의미합니다.
오디오 충실도가 더 떨어질 수 있습니다. 예를 들어
삭스 long.mp3 short.mp3 트림 10
SoX는 먼저 입력 MP3 파일의 압축을 푼 다음 적용합니다. 손질 효과, 그리고 마지막으로
오디오를 다시 압축하여 출력 MP3 파일을 생성합니다.
입력 파일이 생성될 때 발생한 것보다 높은 충실도. 따라서 만약
궁극적으로 원하는 것은 손실 압축 오디오이므로 모든 작업을 수행하는 것이 좋습니다.
무손실 파일 형식을 사용하여 오디오를 처리한 다음 다음에서만 손실 형식으로 변환합니다.
마지막 단계.
NB 단일 SoX 호출로 여러 효과를 적용하면 일반적으로 다음을 생성합니다.
여러 SoX 호출을 사용하여 생성된 결과보다 더 정확한 결과를 제공합니다.
디더링
디더링은 저장된 오디오의 동적 범위를 최대화하는 데 사용되는 기술입니다.
특정 비트 심도. 양자화에 의해 도입된 모든 왜곡은 다음을 추가하여 역상관됩니다.
신호에 약간의 백색 잡음. 대부분의 경우 SoX는
선택한 처리에는 디더링이 필요하며 다음과 같은 경우 출력 포맷 중에 추가합니다.
적당한.
특히 기본적으로 SoX는 출력 비트 심도가 다음과 같을 때 자동으로 TPDF 디더를 추가합니다.
24 미만이고 다음 중 하나에 해당합니다.
· 명령줄 옵션을 사용하여 비트 깊이 감소가 명시적으로 지정되었습니다.
· 출력 파일 형식은 입력 파일보다 낮은 비트 심도만 지원합니다.
체재
· 효과는 내부 처리 체인 내에서 유효 비트 깊이를 증가시켰습니다.
예를 들어 볼륨 조절 권 0.25 두 개의 추가 비트가 필요합니다.
결과를 무손실로 저장합니다(십진수 0.25는 이진수 0.01과 같기 때문에). 따라서 입력하면
파일 비트 깊이가 16이면 SoX의 내부 표현은 18비트를 사용합니다.
이 볼륨 변경을 처리하는 중입니다. 동일한 깊이에 출력을 저장하려면
입력에서 디더링은 추가 비트를 제거하는 데 사용됩니다.
사용 -V SoX가 자동으로 추가한 처리를 확인하는 옵션입니다. NS -D 옵션은
자동 디더링을 무시하기 위해 제공됩니다. 수동으로 디더링을 호출하려면(예:
노이즈 형성 곡선) 참조 떨림 효과.
클리핑
클리핑은 오디오 신호 레벨(또는 '볼륨')이 다음을 초과할 때 발생하는 왜곡입니다.
선택한 표현의 범위. 대부분의 경우 클리핑은 바람직하지 않으므로
(프로세싱 체인에서)
발생합니다.
SoX에서는 예상대로 클리핑이 발생할 수 있습니다. 권 or 이득 효과
오디오 볼륨을 높입니다. 클리핑은 다른 많은 효과와 함께 발생할 수도 있습니다.
한 형식을 다른 형식으로 변환하는 것은 물론 단순히 오디오를 재생할 때도 마찬가지입니다.
오디오 파일 재생에는 종종 리샘플링이 포함되며 아날로그 구성 요소에 의한 처리는
작은 DC 오프셋 및/또는 증폭을 도입하면 모두 왜곡이 발생할 수 있습니다.
오디오 신호 레벨이 처음에 클리핑 포인트에 너무 가까웠습니다.
이러한 이유로 오디오 파일의 신호 레벨에 약간의
'헤드룸', 즉 가능한 최대 수준 아래의 특정 수준을 초과하지 않습니다.
주어진 표현을 위해. 일부 표준 기관에서는 9dB의 헤드룸을 권장하며,
그러나 대부분의 경우 3dB(≈ 70% 선형)이면 충분합니다. 이 지혜는
현대 음악 제작에서 길을 잃다; 사실, 많은 CD, MP3 등은 이제 레벨에서 마스터됩니다.
위의 0dBFS 즉, 오디오가 전달된 대로 잘립니다.
SoX의 스탯 그리고 통계 효과는 오디오 파일의 신호 레벨을 결정하는 데 도움이 될 수 있습니다.
The 이득 or 권 효과를 사용하여 클리핑을 방지할 수 있습니다.
soxdull.wav bright.wav 게인 -6 고음 +6
고음 부스트가 잘리지 않도록 합니다.
처리 중 임의의 지점에서 클리핑이 발생하면 SoX는 경고 메시지를 표시합니다.
그 효과.
참조 -G 그리고 이득 그리고 표준 효과.
입력 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 결합
SoX의 입력 결합기는 다음을 사용하여 여러 파일을 결합하도록 구성할 수 있습니다(아래 옵션 참조).
다음 방법 중 하나: `concatenate', `sequence', `mix', `mix-power', `merge', 또는
곱하기'. 기본 방법은 '시퀀스'입니다. 놀이, 그리고 '연결' 녹화 그리고 sox.
'시퀀스' 이외의 모든 방법에 대해 여러 입력 파일은 동일한 샘플링을 가져야 합니다.
비율. 필요한 경우 별도의 SoX 호출을 사용하여 샘플링 속도를 조정할 수 있습니다.
결합하기 전에.
'연결' 결합 방법이 선택되면(일반적으로 이것이 기본적으로 사용됨)
입력 파일도 같은 수의 채널을 가져야 합니다. 각 입력의 오디오
출력 파일을 형성하기 위해 주어진 순서대로 연결됩니다.
'시퀀스' 결합 방법이 자동으로 선택됩니다. 놀이. 유사하다
각 입력 파일의 오디오가 출력 파일에 직렬로 전송된다는 점에서 '연결'합니다.
그러나 여기에서 출력 파일을 닫았다가 해당 전환에서 다시 열 수 있습니다.
입력 파일 사이. 이것은 다른 유형의 오디오를 보낼 때 필요한 것일 수 있습니다.
출력 장치로 전송되지만 출력이 일반 파일인 경우 일반적으로 유용하지 않습니다.
'mix' 또는 'mix-power' 결합 방법이 선택되면 둘 이상의 입력
파일이 제공되어야 하며 함께 혼합되어 출력 파일을 형성합니다. 개수
각 입력 파일의 채널이 같을 필요는 없지만 SoX는 다음과 같은 경우 경고를 발행합니다.
그렇지 않으며 출력 파일의 일부 채널에는 모든 입력 파일의 오디오가 포함되지 않습니다. NS
혼합 오디오 파일은 원본 입력 파일을 참조하지 않고 혼합을 해제할 수 없습니다.
'병합' 결합 방법이 선택되면 두 개 이상의 입력 파일이 제공되어야 하고
출력 파일을 형성하기 위해 함께 병합됩니다. 각 입력의 채널 수
파일이 같을 필요는 없습니다. 병합된 오디오 파일은 모든 채널의 모든 채널로 구성됩니다.
입력 파일. SoX를 여러 번 호출하여 병합 해제가 가능합니다. 리믹스
효과. 예를 들어 두 개의 모노 파일을 병합하여 하나의 스테레오 파일을 만들 수 있습니다. 첫번째
두 번째 모노 파일은 스테레오 파일의 왼쪽 및 오른쪽 채널이 됩니다.
'multiply' 결합 방법은 해당 채널의 샘플 값을 곱합니다.
(-1 ~ +1 간격의 숫자로 처리됨). 입력의 채널 수가
파일이 동일하지 않은 경우 누락된 채널은 모두 XNUMX을 포함하는 것으로 간주됩니다.
입력 파일을 결합할 때 SoX는 지정된 효과를 적용합니다(예:
권 볼륨 조정 효과) 오디오가 결합된 후. 그러나 종종
입력의 볼륨(즉, '균형')을 개별적으로 설정할 수 있어 유용합니다.
결합이 일어납니다.
모든 결합 방법에 대해 입력 파일 볼륨 조정은 다음을 사용하여 수동으로 수행할 수 있습니다. -v
하나 이상의 입력 파일에 대해 제공할 수 있는 옵션(아래)입니다. 만을 위해 주어진다면
일부 입력 파일은 볼륨 조정을 받지 않습니다. 일부에서는
상황에 따라 자동 볼륨 조정이 적용될 수 있습니다(아래 참조).
The -V 옵션(아래)을 사용하여 이전에 적용된 입력 파일 볼륨 조정을 표시할 수 있습니다.
선택됨(수동 또는 자동).
입력 파일을 혼합할 때 고려해야 할 몇 가지 특별한 고려 사항이 있습니다.
다른 방법과 달리 'mix' 결합은 클리핑을 유발할 가능성이 있습니다.
밸런싱이 수행되지 않은 경우 결합기. 이 경우 수동 볼륨 조절이 되지 않으면
주어진 경우 SoX는 자동으로 조정하여 클리핑이 발생하지 않도록 합니다.
¹/n의 인수로 각 입력 신호의 볼륨(진폭), 여기서 n은 입력 수
파일. 이로 인해 오디오가 너무 조용하거나 균형이 맞지 않으면 입력
파일 볼륨은 위에서 설명한 대로 수동으로 설정할 수 있습니다. 사용 표준 믹스에 대한 효과는
또 다른 대안.
혼합 오디오가 어떤 지점에서는 충분히 크지만 다른 지점에서는 너무 조용한 경우 동적 범위
이를 수정하려면 압축을 적용해야 합니다. 컴팬드 효과.
'혼합력' 결합 방법을 사용하면 혼합 부피는 다음과 거의 같습니다.
입력 신호 중 하나. 이것은 대신 ¹/√n 계수를 사용하여 균형을 유지함으로써 달성됩니다.
¹/n. 이 균형 요소가 클리핑이 발생하지 않는다는 것을 보장하지는 않지만,
클립의 수는 일반적으로 낮고 결과 왜곡은 일반적으로
눈에 띄지 않습니다.
산출 파일
SoX의 기본 동작은 하나 이상의 입력 파일을 가져와서 단일 파일에 쓰는 것입니다.
결과물 파일.
이 동작은 효과 내에서 의사 효과 `newfile'을 지정하여 변경할 수 있습니다.
목록. 그러면 SoX가 다중 출력 모드로 들어갑니다.
다중 출력 모드에서 `newfile' 이전에 효과가 발생하면 새 파일이 생성됩니다.
완료되었음을 나타냅니다. `newfile' 다음에 나열된 효과 체인이 시작되고
출력은 새 파일에 저장됩니다.
다중 출력 모드에서는 고유 번호가 모든 항목의 끝에 자동으로 추가됩니다.
파일 이름. 파일 이름에 확장자가 있으면 숫자가 파일 앞에 삽입됩니다.
확대. 이 동작은 파일 이름의 아무 곳에나 %n을(를) 배치하여 사용자 지정할 수 있습니다.
여기서 숫자를 대체해야 합니다. % 다음에 선택적 숫자를 넣을 수 있습니다.
숫자의 최소 고정 너비를 나타냅니다.
다중 출력 모드는 효과 체인을 멈추게 하는 효과가 아닌 한 그다지 유용하지 않습니다.
Early는 `newfile' 전에 지정됩니다. 효과 전에 파일 끝에 도달한 경우
체인 자체가 중지되면 비어 있으므로 새 파일이 생성되지 않습니다.
다음은 입력 파일의 처음 60초를 두 개의 30초로 나누는 예입니다.
두 번째 파일과 나머지는 무시합니다.
sox song.wav ringtone%1n.wav 트림 0 30 : 새 파일 : 트림 0 30
중지 삭스
일반적으로 SoX는 처리를 완료하고 모든 내용을 읽은 후 자동으로 종료됩니다.
입력 파일에서 사용 가능한 오디오 데이터.
원하는 경우 프로세스에 인터럽트 신호를 보내 더 일찍 종료할 수 있습니다.
(보통 Ctrl-C인 키보드 인터럽트 키를 누름). 이것은
SoX를 사용하여 녹음할 때와 같이 일부 상황에서는 자연스러운 요구 사항입니다. 메모
SoX를 사용하여 여러 파일을 재생할 때 Ctrl-C는 약간 다르게 작동합니다.
한 번 SoX가 다음 파일로 건너뛰게 합니다. 빠른 연속으로 두 번 누르면
SoX를 종료합니다.
처리를 조기에 중지하는 또 다른 옵션은 기간이 있는 효과를 사용하는 것입니다.
중지 지점을 결정하기 위한 샘플 수. 트림 효과가 그 예입니다. 한 번
모든 효과 체인이 중지되면 SoX도 중지됩니다.
파일 이름
파일 이름은 단순 파일 이름, 절대 또는 상대 경로 이름 또는 URL(입력 파일
오직). URL 지원에는 다음이 필요합니다. wget(1) 사용 가능합니다.
참고: SoX 효과 이름과 동일한 입력 또는 출력 파일 이름을 SoX에 지정하면
SoX는 이를 효과 사양으로 취급하므로 작동하지 않습니다. 이에 대한 유일한 해결 방법
이러한 파일 이름을 피하는 것입니다. 대부분의 오디오 파일 이름이
파일 이름이 '확장자'인 반면 효과 이름은 그렇지 않습니다.
이달의 스페셜 파일명
특정 상황에서는 다음과 같은 특수 파일 이름이 정상적인 파일 이름 대신 사용될 수 있습니다.
명령줄의 파일 이름:
- SoX는 특수 파일 이름 `-'를 사용하여 간단한 파이프라인 작업에 사용할 수 있습니다.
입력 파일 이름으로 사용되는 경우 SoX는 다음에서 오디오 데이터를 읽습니다.
`표준 입력'(stdin), 출력 파일 이름으로 사용되는 경우 SoX가 발생합니다.
오디오 데이터를 '표준 출력'(stdout)으로 보냅니다. 이것을 사용할 때 참고
출력 파일에 대한 옵션이며 때로는 입력 파일에 사용할 때
파일 형식(참조 -t 아래)도 제공해야 합니다.
"|프로그램 [옵션] ..."
이것은 주어진 프로그램의 파일 이름을 지정하기 위해 입력 파일 이름 대신 사용할 수 있습니다.
표준 출력(stdout)을 입력 파일로 사용합니다. 같지 않은 - (위), 이것은
하나의 SoX 명령에 대한 여러 입력에 사용됩니다. 예를 들어 `genw'가 모노를 생성하는 경우
WAV 형식의 신호를 표준 출력으로 보낸 다음 다음 명령은
생성된 두 신호의 스테레오 파일:
sox -M "|genw --imd -" "|genw --thd -" out.wav
헤더 없는(원시) 오디오의 경우 -t (및 아마도 다른 형식 옵션)
입력 명령 앞에 주어집니다.
"와일드카드 파일 이름"
파일 이름 'globbing'(와일드 카드 일치)이 SoX에서 수행되어야 함을 지정합니다.
쉘 대신. 이렇게 하면 단일 파일 옵션 세트를 다음에 적용할 수 있습니다.
파일 그룹. 예를 들어, 현재 디렉토리에 XNUMX개의 `vox'가 포함되어 있으면
파일, file1.vox, file2.vox 및 file3.vox, 다음
재생 --rate 6k *.vox
(대부분의 환경에서) `shell'에 의해 확장될 것입니다.
재생 --rate 6k file1.vox file2.vox file3.vox
첫 번째 vox 파일만 샘플 속도가 6k인 것으로 처리합니다. 와 함께
재생 --rate 6k "*.vox"
주어진 샘플 속도 옵션은 XNUMX개의 모든 vox 파일에 적용됩니다.
-p, --속스 파이프
이것은 출력 파일 이름 대신 사용하여 SoX 명령이
다른 SoX 명령에 대한 입력 파이프에서와 같이 사용해야 합니다. 예를 들어 다음 명령은 다음과 같습니다.
재생 "|sox -n -p 신디사이저 2" "|sox -n -p 신디사이저 2 트레몰로 10" 통계
각각 다른 효과를 가진 두 개의 '파일'을 연속으로 재생합니다.
-p 실제로 `의 별칭입니다.-t sox -'.
-d, --기본 장치
이것은 입력 또는 출력 파일 이름 대신 사용하여
기본 오디오 장치(SoX에 내장된 경우)가 사용됩니다. 이것은 유사하다
불러일으키다 녹화 or 놀이 (위에서 설명한 대로).
-n, --없는
이것은 입력 또는 출력 파일 이름 대신에 `null
파일'을 사용합니다. 여기서 'null file'은 SoX 고유의 파일을 나타냅니다.
메커니즘이며 유사한 이름을 가진 운영 체제 메커니즘과 관련이 없습니다.
null 파일을 사용하여 오디오를 입력하는 것은 일반 오디오 파일을 사용하는 것과 같습니다.
무한한 양의 침묵을 포함하므로 일반적으로 유용하지 않습니다.
유한한 시간 길이를 지정하는 효과와 함께 사용됩니다(예: 손질 or 신스).
null 파일을 사용하여 오디오를 출력하는 데 오디오 양은 오디오를 버리는 데 유용하며 유용합니다.
영향을 미치는 대신 오디오에 대한 정보를 생성하는 효과로 주로
그것은 (예를 들어 노이즈프로프 or 스탯).
null 파일과 관련된 샘플링 속도는 기본적으로 48kHz이지만
일반 파일, 원하는 경우 명령줄 형식 옵션을 사용하여 재정의할 수 있습니다.
(아래 참조).
지원 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 & 오디오 장치 유형
속포맷(7) 지원되는 파일 형식 및 오디오 장치의 목록 및 설명
드라이버.
옵션
글로벌 옵션
이 옵션은 첫 번째 효과 이전의 어느 지점에서나 명령줄에 지정할 수 있습니다.
이름입니다.
The SOX_OPTS 환경 변수를 사용하여 대체 기본값을 제공할 수 있습니다.
SoX의 글로벌 옵션. 예를 들어:
SOX_OPTS="--buffer 20000 --play-rate-arg -hs --temp /mnt/temp"
SOX_OPTS를 설정하면 잠재적으로 원치 않는 동작이 변경될 수 있습니다.
SoX를 호출하는 스크립트 또는 기타 프로그램. SOX_OPTS는 다음과 같은 용도로 가장 잘 사용될 수 있습니다.
주어진 예에서와 같이) SoX가 실행되고 있는 환경을 반영합니다. 활성화
다음과 같은 옵션 --노-클로버 기본적으로 쉘 별칭을 사용하면 더 잘 처리될 수 있습니다.
셸 별칭은 스크립트 등의 작업에 영향을 주지 않습니다.
스크립트가 SOX_OPTS의 영향을 받지 않도록 하는 한 가지 방법은 다음에서 SOX_OPTS를 지우는 것입니다.
스크립트의 시작이지만 이것은 물론 일부를 전달하는 SOX_OPTS의 이점을 잃습니다.
시스템 전체 기본 옵션. 다른 접근 방식은 명시적으로 다음을 사용하여 SoX를 호출하는 것입니다.
기본 옵션 값, 예
SOX_OPTS="-V --노-클로버"
...
sox -V2 --clobber $입력 $출력 ...
환경 변수를 설정하는 방법은 시스템마다 다릅니다. 여기 몇 가지가 있습니다
예 :
유닉스 배쉬:
export SOX_OPTS="-V --no-clobber"
유닉스 csh:
setenv SOX_OPTS "-V --no-clobber"
MS-DOS/MS-Windows:
SOX_OPTS=-V 설정 --no-clobber
MS-Windows GUI: 제어판을 통해 : 시스템 : 고급 : 환경 변수
Mac OS X GUI: Apple의 기술 Q&A QA1067 문서를 참조하십시오.
--완충기 바이트, --입력 버퍼 바이트
오디오 처리에 사용되는 버퍼의 크기를 바이트 단위로 설정합니다(기본값 8192).
--완충기 입력, 효과 및 출력 처리에 적용됩니다. --입력 버퍼 적용하다
입력 처리에만 해당 --완충기 둘 다 주어진 경우).
에 대한 큰 값에 유의하십시오. --완충기 SoX의 응답 속도가 느려집니다.
현재 입력 파일을 종료하거나 건너뛰도록 요청합니다.
--소지품
주어진 이름과 동일한 이름으로 기존 파일을 덮어쓰기 전에 묻지 않음
출력 파일의 경우. 이것이 기본 동작입니다.
--결합시키다 사슬 같이 잇다|병합|혼합|믹스 파워|곱하다|순서
입력 파일 결합 방법을 선택하십시오. 이들 중 일부의 경우 짧은 옵션은
사용할 수 : -m '믹스'를 선택하고, -M '병합'을 선택하고 -T 곱하기'를 선택합니다.
입력 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 결합 다른 결합에 대한 설명은 위
방법.
-D, --디더 없음
자동 디더링 비활성화 - 위의 '디더링'을 참조하십시오. 이것이 가능한 이유의 예
경우에 따라 파일이 16비트에서 24비트로 변환된 경우 유용합니다.
일부 처리를 수행할 의도가 있지만 실제로는 이후에 처리가 필요하지 않습니다.
모든 원본 16비트 파일이 손실된 다음 엄밀히 말하면 디더링이 없습니다.
파일을 다시 16비트로 변환하는 경우 필요합니다. 참조 통계 효과
파일 내 오디오의 실제 비트 깊이를 결정합니다.
--효과 파일 파일 이름
모든 효과와 해당 인수를 얻으려면 FILENAME을 사용하십시오. 파일은 다음과 같이 구문 분석됩니다.
값이 명령줄에 지정되었습니다. 대신 새 줄을 사용할 수 있습니다.
특별한 : 효과 체인을 분리하는 마커. 편의를 위해 이러한 마커는
파일의 끝은 일반적으로 무시됩니다. 빈 마지막을 지정하려면
효과 체인, 명시적 사용 : 파일의 마지막 줄에 단독으로. 이것
옵션을 사용하면 명령줄에 지정된 모든 효과가 무시됩니다.
-G, --경비원
자동으로 호출 이득 클리핑을 방지하는 효과. 예
sox -G infile -b 16 outfile 속도 44100 디더 -s
~의 속기
sox infile -b 16 outfile 게인 -h 속도 44100 게인 -rh 디더 -s
참조 -V, --표준, 그리고 이득 효과.
-h, --도움
버전 번호 및 사용 정보를 표시합니다.
--도움 효과 이름
지정된 효과에 대한 사용 정보를 표시합니다. 이름 모든 표시하는 데 사용할 수 있습니다
모든 효과에 사용.
--도움말 형식 이름
지정된 파일 형식에 대한 정보를 표시합니다. 이름 모든 표시하는 데 사용할 수 있습니다
모든 형식에 대한 정보.
--NS, --정보
첫 번째 매개변수로 주어진 경우에만 sox, 행동하다 속시(1).
-m|-M 에 해당 --결합시키다 혼합 그리고 --결합시키다 병합각각.
--마법
SoX가 선택적 `libmagic' 라이브러리로 빌드된 경우 이 옵션은
오디오 파일 유형을 감지하는 데 사용할 수 있도록 제공됩니다.
--다중 스레드 | --단일 스레드
기본적으로 SoX는 '단일 스레드'입니다. 만약 --다중 스레드 옵션이 주어진다
그러나 SoX는 대부분의 다중 채널 효과에 대한 오디오 채널을 처리합니다.
하이퍼 스레딩/멀티 코어 아키텍처에서 병렬. 이것은 처리를 감소시킬 수 있습니다
시간, 때로는 이 옵션을 다음과 함께 사용해야 할 수도 있습니다.
다중 스레드의 이점을 얻기 위해 기본값보다 큰 버퍼 크기
처리(예: 131072, 참조 --완충기 위).
--노-클로버
에 대해 제공된 것과 동일한 이름으로 기존 파일을 덮어쓰기 전에 확인
결과물 파일.
NB 의도하지 않게 파일을 덮어쓰는 것은 생각보다 쉽습니다.
예를 들어 실수로 입력한 경우
삭스 파일1 파일2 효과1 효과2 ...
당신이 정말로 의미했던 것은
재생 파일1 파일2 효과1 효과2 ...
그런 다음 이 옵션이 없으면 file2를 덮어씁니다. 따라서 이 옵션을 사용하는 것은
추천. SOX_OPTS(위), `쉘' 별칭, 스크립트 또는 배치 파일은
영구적으로 활성화하는 적절한 방법입니다.
--표준[=dB 레벨]
자동으로 호출 이득 클리핑을 방지하고 정상화하는 효과
오디오. 예
sox --norm infile -b 16 출력 파일 속도 44100 dither -s
~의 속기
sox infile -b 16 outfile 게인 -h 속도 44100 게인 -nh 디더 -s
선택적으로 오디오는 0dBFS 미만의 주어진 레벨(일반적으로)로 정규화될 수 있습니다.
sox --norm=-3 파일 출력 파일
참조 -V, -NS, 그리고 이득 효과.
--재생 속도 인수 ARG
'rate' 효과가 자동으로 호출될 때 사용할 품질 옵션을 선택합니다.
오디오를 재생하는 동안. 이 옵션은 일반적으로 SOX_OPTS 환경
변수(위 참조).
--구성 그누플롯|옥타브|오프
로 설정하지 않은 경우 오프 (기본값인 경우 --구성 제공되지 않음), 가능한 모드에서 실행
gnuplot 프로그램 또는 GNU Octave 프로그램과 함께 사용하여
많은 전송 기능 기반의 선택 및 구성으로
효과. 선택한 플로팅 프로그램을 지원하는 첫 번째 주어진 효과에 대해,
SoX는 효과의 전달 함수를 플롯하는 명령을 출력한 다음 종료합니다.
실제로 오디오를 처리하지 않고. 예
sox --plot 옥타브 입력 파일 -n 하이패스 1320 > highpass.plt
옥타브 하이패스.plt
-q, --노쇼 진행
SoX가 그렇게 하지 않을 때 자동 모드에서 실행하십시오. 이것은 반대의
-S 옵션을 선택합니다.
-R '반복 가능' 모드에서 실행합니다. 이 옵션이 제공되면 해당되는 경우 SoX는
출력 파일에 고정된 타임스탬프를 포함합니다(예: AIFF) 의사를 '시드'합니다.
난수 생성기(예: 떨림) 고정된 숫자로
동일한 입력과 동일한 매개변수를 사용하여 연속적으로 SoX를 호출하면
동일한 출력.
--재생 이득 선로|앨범|오프
입력 파일에 리플레이 게인 조정을 적용할지 여부를 선택합니다. 기본값
is 오프 을 통한 sox 그리고 녹화, 앨범 을 통한 놀이 여기서 (적어도) 처음 두 개의 입력 파일
동일한 아티스트 및 앨범 이름으로 태그가 지정되고 선로 을 통한 놀이 그렇지 않으면.
-S, --쇼 진행
입력 파일 형식/헤더 정보 표시 및 처리 진행 상황을 입력으로 표시
파일(들) 완료율, 경과 시간 및 남은 시간(알고 있는 경우, 에 표시됨)
대괄호) 및 출력 파일에 기록된 샘플 수입니다. 또한 표시된 것은
피크 레벨 미터 및 클리핑 발생 여부 표시. 피크 레벨 미터
최대 XNUMX개의 채널을 표시하고 다음과 같이 디지털 오디오에 대해 보정됩니다(오른쪽
채널 표시):
dB FSD 디스플레이 dB FSD 디스플레이
-25 - -11 ====
-23 = -9 ====-
-21 =- -7 =====
-19 == -5 =====-
-17 ==- -3 ======
-15 === -1 =====!
-13 ===-
헤드룸의 XNUMX초 피크 유지 값(dB)이 오른쪽에 표시됩니다.
이 값이 6dB 미만이면 미터입니다.
이 옵션은 SoX를 사용하여 오디오를 재생하거나 녹음할 때 기본적으로 활성화됩니다.
-T 에 해당 --결합시키다 곱하다.
--임시 디렉토리
지정된 파일에 임시 파일을 생성하도록 지정합니다. 디렉토리. 이
기본값에 권한이나 여유 공간 문제가 있는 경우 유용할 수 있습니다.
위치. 이 경우 `--임시 .'(현재 디렉토리를 사용하기 위해)는 종종
좋은 해결책.
--번역
SoX의 버전 번호를 표시하고 종료합니다.
-V[수평]
자세한 정보를 설정합니다. 이것은 자동 효과가 어떻게 나타나는지 확인하는 데 특히 유용합니다.
SoX에 의해 호출되었습니다.
SoX는 다음 세부 정보에 따라 콘솔(stderr)에 메시지를 표시합니다.
레벨 :
0 메시지가 전혀 표시되지 않습니다. 종료 상태를 사용하여 오류가 있는지 확인
발생했습니다.
1 오류 메시지만 표시됩니다. SoX가 완료될 수 없는 경우 생성됩니다.
요청한 명령.
2 경고 메시지도 표시됩니다. SoX가 완료될 수 있는 경우 생성됩니다.
요청된 명령이지만 요청된 명령과 정확히 일치하지 않음
매개변수 또는 클리핑이 발생하는 경우.
3 SoX의 처리 단계에 대한 설명도 표시됩니다. 볼 때 유용
SoX가 오디오를 처리하는 방법을 정확히 알 수 있습니다.
4 이상
SoX 디버깅에 도움이 되는 메시지도 표시됩니다.
기본적으로 자세한 표시 수준은 2(오류 및 경고 표시)로 설정됩니다. 각
의 발생 -V 옵션은 상세 수준을 1만큼 증가시킵니다. 또는
상세 수준은 바로 뒤에 지정하여 절대 숫자로 설정할 수 있습니다.
전에, -V, 예. -V0 0으로 설정합니다.
입력 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 옵션
이 옵션은 입력 파일에만 적용되며 입력 파일 이름 앞에만 올 수 있습니다.
명령 행.
--무시 길이
오디오 파일의 헤더에 지정된 (잘못된) 오디오 길이를 재정의합니다. 이 경우
옵션이 주어지면 SoX는 오디오의 끝에 도달할 때까지 오디오를 계속 읽습니다.
입력 파일.
-v, --용량 인자
여러 입력 파일을 결합할 때 사용하도록 의도된 이 옵션은
명령줄에서 뒤에 오는 파일의 볼륨 인자. 이
다른 입력 파일과 '밸런싱'할 수 있습니다. 이것은 선형
(진폭) 조정, 그래서 1보다 작은 숫자는 볼륨을 줄이고 숫자는
1보다 크면 증가합니다. 음수가 주어지면
볼륨을 조정하면 오디오 신호가 반전됩니다.
참조 항목 표준, 권및 이득 효과 및 참조 입력 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 균형 위.
입력 & 산출 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 형성 옵션
이 옵션은 이름 바로 앞에 오는 입력 또는 출력 파일에 적용됩니다.
명령줄이며 헤더가 없는 파일 형식으로 작업하거나 다음과 같은 경우에 주로 사용됩니다.
입력 파일의 형식과 다른 출력 파일 형식을 지정합니다.
-b BITS, --비트 BITS
각 인코딩된 비트 수(비트 깊이 또는 때로는 단어 길이)
견본. MP3 또는 GSM과 같은 복잡한 인코딩에는 적용되지 않습니다. 필요하지 않음
고정된 수의 비트를 갖는 인코딩, 예를 들어 A/μ-law, ADPCM.
입력 파일의 경우 이 옵션의 가장 일반적인 용도는 SoX에
`raw'(`headerless') 오디오 파일의 샘플당 비트 수. 예를 들어
sox -r 16k -e 서명된 -b 8 input.raw output.wav
특정 '원시' 파일을 자체 설명적인 'WAV' 파일로 변환합니다.
출력 파일의 경우 이 옵션을 사용할 수 있습니다(아마도 -e) 설정하려면
출력 인코딩 크기. 기본적으로(즉, 이 옵션이 지정되지 않은 경우) 출력은
인코딩 크기(출력 파일 유형에서 지원하는 경우)는 다음으로 설정됩니다.
입력 인코딩 크기. 예를 들어
sox 입력.cdda -b 24 출력.wav
원시 CD 디지털 오디오(16비트, 부호 있는 정수)를 24비트(부호 있는 정수)로 변환
'WAV' 파일입니다.
-1/-2/-3/-4/-8
인코딩된 각 샘플의 바이트 수입니다. 더 이상 사용되지 않는 별칭 -b 8, -b 16, -b
24, -b 32, -b 64 각각.
-c 채널, --채널 채널
오디오 파일의 오디오 채널 수입니다. 이것은 다음보다 큰 숫자일 수 있습니다.
제로.
입력 파일의 경우 이 옵션의 가장 일반적인 용도는 SoX에
'원시'('헤더리스') 오디오 파일의 채널 수. 때때로, 그것은
'헤더' 파일과 함께 이 옵션을 사용하면 유용합니다.
(아마도 잘못된) 헤더의 값 - 이것은 다음에서만 지원된다는 점에 유의하십시오.
특정 파일 형식. 예:
sox -r 48k -e float -b 32 -c 2 입력.원시 출력.wav
특정 '원시' 파일을 자체 설명적인 'WAV' 파일로 변환합니다.
재생 -c 1 music.wav
파일 데이터가 무엇인지에 관계없이 단일 채널에 속하는 것으로 해석합니다.
파일 헤더에 표시됩니다. 파일에 실제로 두 개의
채널의 경우 파일이 절반 속도로 재생됩니다.
출력 파일의 경우 이 옵션은
채널 (필요한 경우) 수를 변경하려면 효과를 호출해야 합니다.
오디오 신호의 채널을 주어진 숫자로 변경합니다. 예를 들어 다음 두
명령은 동일합니다.
sox input.wav -c 1 output.wav 베이스 -b 24
sox input.wav output.wav 베이스 -b 24채널 1
두 번째 형식은 효과를 주문할 수 있으므로 더 유연합니다.
임의로.
-e 부호화, --부호화 부호화
오디오 인코딩 유형입니다. 때로는 다음 이상을 지원하는 파일 형식에 필요합니다.
하나의 인코딩 유형. 예를 들어 raw, WAV 또는 AU를 사용하는 경우(예를 들어,
MP3 또는 FLAC). 사용 가능한 인코딩 유형은 다음과 같습니다.
부호 있는 정수
부호 있는('XNUMX의 보수') 정수로 저장된 PCM 데이터. 와 함께 일반적으로 사용되는
16 또는 24비트 인코딩 크기. 값 0은 최소 신호를 나타냅니다.
힘.
부호 없는 정수
부호 없는 정수로 저장된 PCM 데이터. 일반적으로 8비트 인코딩과 함께 사용
크기. 값 0은 최대 신호 전력을 나타냅니다.
부동 소수점
IEEE 753 단정밀도(32비트) 또는 배정밀도로 저장된 PCM 데이터
(64비트) 부동 소수점('실제') 숫자. 값 0은 최소값을 나타냅니다.
신호 전력.
법 당 8비트의 대수 인코딩을 위한 국제 전화 통신 표준
견본. 대략 13비트 PCM에 해당하는 정밀도를 가지며
때때로 역 비트 순서로 인코딩됩니다(참조 -X 선택권).
유 법, 무법
8비트당 로그 인코딩을 위한 북미 전화 표준
견본. 일명 μ 법칙. 대략 14비트 PCM에 해당하는 정밀도를 갖습니다.
때로는 역 비트 순서로 인코딩됩니다( -X 선택권).
오키-adpcm
OKI(일명 VOX, Dialogic 또는 Intel) 4비트 ADPCM; 정밀도가 있다
대략 12비트 PCM에 해당합니다. ADPCM은 오디오 압축의 한 형태입니다.
오디오 품질과 인코딩/디코딩 속도 사이에 좋은 절충안이 있습니다.
ima-adpcm
IMA(DVI라고도 함) 4비트 ADPCM; 대략 에 해당하는 정밀도를 가지고 있습니다.
13비트 PCM.
ms-adpcm
마이크로소프트 4비트 ADPCM; 대략 14비트 PCM에 해당하는 정밀도를 갖습니다.
gsm 풀레이트
GSM은 현재 전 세계 디지털 무선 통신의 대다수에 사용됩니다.
전화. 비트 전송률이 다른 여러 오디오 형식을 사용합니다.
및 관련 음성 품질. SoX는 GSM의 원래 13kbps를 지원합니다.
'전체 속도' 오디오 형식입니다. 일반적으로 GSM으로 작업하려면 CPU를 많이 사용합니다.
오디오.
모호하지 않은 경우 인코딩 이름을 축약할 수 있습니다. 예
'unsigned-integer'는 'un'으로 주어질 수 있지만 'u'는 아닙니다('u-law'와 모호함).
입력 파일의 경우 이 옵션의 가장 일반적인 용도는 SoX에
`raw'(`headerless') 오디오 파일의 인코딩(예제 참조 -b 그리고 -c
위).
출력 파일의 경우 이 옵션을 사용할 수 있습니다(아마도 -b) 설정하려면
출력 인코딩 유형 예
sox input.cdda -e float 출력1.wav
sox input.cdda -b 64 -e float 출력2.wav
원시 CD 디지털 오디오(16비트, 부호 있는 정수)를 부동 소수점 'WAV' 파일로 변환
(각각 단정밀도 및 배정밀도).
기본적으로(즉, 이 옵션이 지정되지 않은 경우) 출력 인코딩 유형은
(출력 파일 유형에서 지원하는 경우) 입력 인코딩으로 설정
유형.
-s/-u/-f/-A/-U/-o/-i/-a/-g
인코딩 유형 지정에 사용되지 않는 별칭 부호 있는 정수, 서명되지 않은
정수, 부동 소수점, 법, 무법, 오키-adpcm, ima-adpcm, ms-adpcm, gsm-가득-
율 각각(참조 -e 위).
--no-글로브
파일 이름 'globbing'(와일드 카드 일치)가 다음에서 수행되지 않아야 함을 지정합니다.
다음 파일 이름의 SoX. 예를 들어 현재 디렉토리에
두 개의 파일 `five-seconds.wav' 및 `five*.wav', 다음
재생 --no-glob "XNUMX*.wav"
단일 파일 `five*.wav'를 재생하는 데 사용할 수 있습니다.
-NS, --비율 율[k]
파일의 샘플 속도를 Hz(또는 `k'가 추가된 경우 kHz)로 제공합니다.
입력 파일의 경우 이 옵션의 가장 일반적인 용도는 SoX에
'원시'('헤더가 없는') 오디오 파일의 샘플 속도(예제 참조 -b 그리고 -c
위에). 때때로 '헤더' 파일과 함께 이 옵션을 사용하는 것이 유용할 수 있습니다.
헤더의 (아마도 잘못된) 값을 무시하려면
이것은 특정 파일 형식에서만 지원됩니다. 예를 들어 오디오가 녹음된 경우
48%와 같이 약간 재생된 소스의 샘플 레이트가 1.5k인 경우
너무 천천히, 그럼
sox -r 48720 입력.wav 출력.wav
파일 헤더만 변경하여 속도를 효과적으로 수정합니다.
속도 이 문제에 대한 보다 일반적인 솔루션에 대한 효과).
출력 파일의 경우 이 옵션은 율
(필요한 경우) 샘플 속도를 변경하려면 효과를 호출해야 합니다.
오디오 신호를 주어진 값으로 예를 들어 다음 두 명령은
동등한:
sox input.wav -r 48k output.wav 베이스 -b 24
sox input.wav output.wav 베이스 -b 24 속도 48k
두 번째 형식이 허용하는 한 더 유연하지만 율 주어지는 옵션, 그리고
효과를 임의로 정렬할 수 있습니다.
-t, --유형 파일 유형
오디오 파일의 유형을 제공합니다. 입력 및 출력 파일 모두에 대해 이 옵션은
일반적으로 SoX에 '헤더가 없는' 오디오 파일(예: raw, mp3) 유형을 알리는 데 사용됩니다.
여기서 실제/원하는 유형은 주어진 파일 이름 확장자에서 결정할 수 없습니다.
예 :
다른 명령 | sox -t mp3 - output.wav
sox input.wav -t 원시 output.bin
또한 입력 파일 이름 확장자가 암시하는 유형을 재정의하는 데 사용할 수도 있습니다.
그러나 헤더가 있는 유형으로 재정의하면 SoX는 적절한
그러한 헤더가 실제로 존재하지 않는 경우 오류 메시지.
속포맷(7) 지원되는 파일 형식 목록.
-L, --엔디안 작은
-B, --엔디안 큰
-x, --엔디안 교환
이 옵션은 오디오 데이터의 바이트 순서가 각각 다음과 같은지 여부를 지정합니다.
'리틀 엔디안', '빅 엔디안' 또는 SoX가 있는 시스템의 반대
사용 중입니다. 엔디안은 부동 소수점으로 인코딩된 데이터에만 적용됩니다.
16비트 이상의 부호 있는 또는 부호 없는 정수. 지정해야 하는 경우가 많습니다
헤더가 없는 파일에 대한 이러한 옵션 중 하나이며 때로는 (그렇지 않은 경우) 필요합니다.
자체 설명 파일. 주어진 엔디안 설정 옵션은 입력에 대해 무시될 수 있습니다.
헤더에 특정 엔디안 식별자가 포함된 파일 또는 출력 파일의 경우
그것은 실제로 오디오 장치입니다.
NB 다른 형식 특성과 달리 엔디안(바이트, 니블 및 비트
순서) 입력 파일의 출력 파일에 자동으로 사용되지 않습니다. 그래서,
예를 들어 다음이 little-endian 시스템에서 실행될 때:
sox -B audio.s16 trimmed.s16 트림 2
trimmed.s16은 little-endian으로 생성됩니다.
sox -B audio.s16 -B trimmed.s16 트림 2
출력 파일에서 빅 엔디안을 유지하는 데 사용해야 합니다.
The -V 옵션을 사용하여 선택한 주문을 확인할 수 있습니다.
-N, --역방향 니블
샘플의 니블 순서(즉, 바이트의 2/XNUMX)를 지정합니다.
뒤집어야 한다; 때때로 ADPCM 기반 형식에 유용합니다.
NB 섹션의 NB도 참조하십시오. -x 위.
-X, --역 비트
샘플의 비트 순서가 반대로 되어야 함을 지정합니다. 때로는 유용한
몇 가지(대부분 헤더가 없는) 형식을 사용합니다.
NB 섹션의 NB도 참조하십시오. -x 위.
산출 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에 형성 옵션
이 옵션은 출력 파일에만 적용되며 출력 파일 이름 앞에 올 수 있습니다.
명령줄.
--댓글 추가 TEXT
출력 파일 헤더에 주석을 추가합니다(해당되는 경우).
--논평 TEXT
출력 파일 헤더에 저장할 주석 텍스트를 지정합니다(해당되는 경우).
이 옵션(또는 --코멘트 파일)가 주어지지 않습니다.
출력 파일에 주석을 저장하지 않도록 지정하려면 다음을 사용하십시오. --논평 "" .
--코멘트 파일 파일 이름
출력 파일 헤더에 저장할 주석 텍스트가 포함된 파일 지정
(해당되는 경우).
-C, --압축 인자
출력 파일 형식을 가변적으로 압축하기 위한 압축 계수입니다. 이 경우
옵션이 제공되지 않으면 기본 압축 계수가 적용됩니다. 압축
factor는 압축 파일 형식에 따라 다르게 해석됩니다. 참조
이 옵션을 사용하는 파일 형식에 대한 설명 속포맷(7) 더 많은
정보.
효과
오디오 파일을 변환, 재생 및 녹음하는 것 외에도 SoX를 사용하여
오디오 '효과'의 수. 여러 효과는 다음에 지정하여 적용할 수 있습니다.
다른 하나는 SoX 명령줄 끝에 '효과 체인'을 형성합니다. 참고
실시간으로 여러 효과를 적용하려면(즉, 오디오를 재생할 때)
고성능 컴퓨터. 다른 응용 프로그램을 중지하면 성능 문제가 완화될 수 있습니다.
발생해야 합니다.
일부 SoX 효과는 주로 단일 기기 또는
'목소리'. 이를 용이하게 하기 위해, 리믹스 효과 및 글로벌 SoX 옵션 -M 를 사용할 수 있습니다
멀티 트랙 녹음에서 트랙을 분리했다가 다시 결합합니다.
배수 효과 쇠사슬
단일 효과 체인은 하나 이상의 효과로 구성됩니다. 입력 실행의 오디오
입력 파일의 끝에 도달하거나 효과가 나타날 때까지 체인을 통해
체인 종료를 요청합니다.
SoX는 입력 오디오에 대해 여러 효과 체인 실행을 지원합니다. 이 경우 하나의
체인은 오디오 처리가 완료되었음을 나타내며 오디오 데이터는 다음을 통해 전송됩니다.
효과 체인. 이것은 더 이상 효과 체인이 존재하지 않거나 입력이
파일 끝에 도달했습니다.
효과 체인은 다음을 배치하여 종료됩니다. : (콜론) 효과 후. 다음
효과는 새로운 효과 체인의 일부입니다.
체인을 멈추는 효과를 첫 번째 효과로 배치하는 것이 중요합니다.
체인. 이는 효과에 의해 버퍼링되는 샘플이 왼쪽에 있기 때문입니다.
종료 효과가 삭제됩니다. 폐기된 샘플의 양은 다음과 관련이 있습니다.
--완충기 옵션이며 샘플 속도에 비해 작게 유지되어야 합니다.
종료 효과가 먼저일 수 없습니다. 정지 효과에 대한 추가 정보를 찾을 수 있습니다.
인간을 중지 삭스 안내
여러 효과 체인을 사용하는 데 도움이 되는 몇 가지 유사 효과가 있습니다. 여기에는 다음이 포함됩니다.
새로운 파일 다음 효과로 이동하기 전에 새 출력 파일에 쓰기 시작합니다.
체인 및 다시 시작 첫 번째 효과 체인으로 다시 이동합니다. 의사 효과는 다음과 같아야 합니다.
체인의 첫 번째 효과로 지정되고 체인의 유일한 효과로 지정됩니다(
a : 지정 전후).
다음은 다중 효과 체인의 예입니다. 입력 파일을 다음으로 분할합니다.
30초 길이의 여러 파일. 각 출력 파일 이름에는 고유 번호가 있습니다.
문서에 기록된 이름 산출 파일 안내
sox infile.wav output.wav trim 0 30 : newfile : 다시 시작
공통의 표기법 Audiencegain과 파라미터
다음 설명에서 대괄호 [ ]는 다음과 같은 매개변수를 나타내는 데 사용됩니다.
선택 사항, 중괄호 { }는 선택적이고 반복 가능한 것을 나타내고 각도
대괄호 < >는 반복 가능하지만 선택 사항이 아닌 것을 나타냅니다. 해당되는 경우,
선택적 매개변수의 기본값은 괄호( )로 표시됩니다.
다음 매개변수는 여러 효과와 함께 사용되며 동일한 의미를 갖습니다.
센터[k]
주파수.
주파수[k]
Hz 단위의 주파수 또는 'k'가 추가된 경우 kHz입니다.
이득 dB의 전력 이득입니다. XNUMX은 이득을 주지 않습니다. XNUMX보다 작으면 감쇠를 제공합니다.
폭[h|k|o|q]
필터의 대역폭을 지정하는 데 사용됩니다. 다양한 방법으로
사용 가능한 너비를 지정하십시오(모든 효과에 대해 전부는 아니지만). 중 하나
다음과 같이 원하는 방법을 선택하기 위해 표시된 문자를 추가할 수 있습니다.
방법 노트
h Hz
k kHz의
o 옥타브
q Q 계수 참조 [2]
이 매개변수를 사용하는 각 효과에 대해 기본 방법(즉, 문자가 없는 경우
추가됨)은 효과의 첫 번째 줄에 첫 번째로 나열된 것입니다.
기술.
SoX가 선택적 효과를 지원하는지 확인하려면 다음을 입력하십시오. sox -h 아래에서 이름을 찾으십시오.
목록: '효과'.
지원 효과
참고: 효과의 분류된 목록은 함께 제공되는 'README' 파일에서 찾을 수 있습니다.
모두 통과 주파수[k] 폭[h|k|o|q]
중심 주파수(Hz)가 있는 XNUMX극 전체 통과 필터 적용 주파수및
필터 너비 폭. 모든 패스 필터는 오디오의 주파수를 위상으로 변경합니다.
진폭 관계로 주파수를 변경하지 않고 관계. 필터
[1]에 자세히 설명되어 있습니다.
이 효과는 --구성 글로벌 옵션.
밴드 [-n] 센터[k] [폭[h|k|o|q]]
대역 통과 필터를 적용합니다. 주파수 응답은 주변에서 대수적으로 떨어집니다.
센터 빈도. NS 폭 매개변수는 드롭의 기울기를 제공합니다. NS
주파수 센터 + 폭 그리고 센터 - 폭 원래의 절반이 될 것입니다
진폭. 밴드 기본적으로 피치 오디오, 즉 음성,
노래나 기악. NS -n (노이즈용) 옵션은 대체 모드를 사용합니다.
피치가 없는 오디오용(예: 타악기). 경고: -n 의 전력 이득을 소개합니다.
필터에서 약 11dB이므로 출력 클리핑에 주의하십시오. 밴드 에 노이즈를 도입
필터의 모양, 즉 정점에서 센터 주파수 및 정착
그것.
이 효과는 --구성 글로벌 옵션.
참조 싱크 더 가파른 숄더를 가진 대역통과 필터의 경우.
대역 통과|대역 거부 [-c] 주파수[k] 폭[h|k|o|q]
중심 주파수가 있는 XNUMX극 Butterworth 대역 통과 또는 대역 제거 필터 적용
주파수, 및 (3dB 포인트) 대역폭 폭. 그만큼 -c 옵션은 다음에만 적용됩니다.
대역 통과 기본값 대신 일정한 스커트 게인(피크 게인 = Q)을 선택합니다.
일정한 0dB 피크 게인. 필터는 옥타브당 6dB(디케이드당 20dB)에서 롤오프됩니다.
[1]에 자세히 설명되어 있습니다.
이러한 효과는 다음을 지원합니다. --구성 글로벌 옵션.
참조 싱크 더 가파른 숄더를 가진 대역통과 필터의 경우.
대역 거부 주파수[k] 폭[h|k|o|q]
대역 제거 필터를 적용합니다. 에 대한 설명을 참조하십시오. 대역 통과 에 대한 효과
세부.
베이스|삼배 이득 [주파수[k] [폭[s|h|k|o|q]]]
다음을 사용하여 오디오의 저음(저음) 또는 고음(고음) 주파수를 높이거나 줄입니다.
표준 하이파이와 유사한 응답을 제공하는 XNUMX극 쉘빙 필터
톤 컨트롤. 이것은 쉘빙 이퀄라이제이션(EQ)이라고도 합니다.
이득 0Hz에서 이득을 제공합니다( 베이스), 또는 ~22kHz 중 더 낮은 값과
나이퀴스트 주파수( 삼배). 유용한 범위는 약 -20입니다(대형
컷)에서 +20(큰 부스트의 경우). 주의 클리핑 긍정적으로 사용할 때 이득.
원하는 경우 다음 선택적 매개변수를 사용하여 필터를 미세 조정할 수 있습니다.
주파수 필터의 중심 주파수를 설정하므로 확장하거나
증폭하거나 차단할 주파수 범위를 줄이십시오. 기본값은 100Hz입니다(
베이스) 또는 3kHz( 삼배).
폭 필터의 선반 전환이 얼마나 가파른지를 결정합니다. 여기에 덧붙여
위에서 설명한 일반적인 너비 지정 방법, `slope'(기본값, 또는
`가 붙은s') 사용될 수있다. '기울기'의 유용한 범위는 약 0.3입니다.
완만한 경사, 가파른 경사의 경우 1(최대); 기본값은 0.5입니다.
필터는 [1]에 자세히 설명되어 있습니다.
이러한 효과는 다음을 지원합니다. --구성 글로벌 옵션.
참조 평형 장치 피킹 이퀄라이제이션 효과를 위해
굽히다 [-f 프레임 속도(25)] [-o 과잉 표본(16)] { 지연,센트,지속 }
지정된 시간에 지정된 양만큼 피치를 변경합니다. 각각의 주어진 트리플:
지연,센트,지속 하나의 굽힘을 지정합니다. 지연 이후의 시간입니다.
오디오 스트림의 시작 또는 시작할 이전 굽힘의 끝
피치 굽힘; 센트 센트 수(100센트 = 1 반음)
피치를 구부리고 지속 피치가 될 시간의 길이
있습니다.
피치 벤딩 알고리즘은 이산 푸리에 변환(DFT)을 사용합니다.
특정 프레임 속도 및 오버 샘플링 속도. NS -f 그리고 -o 매개변수를 사용할 수 있습니다.
이러한 매개변수를 조정하여 피치 변화의 부드러움을 제어합니다.
예를 들어, 초기 톤이 생성된 다음 세 번 구부러져 네 번 생성됩니다.
총 다른 메모:
플레이 -n 신디사이저 2.5 sin 667 게인 1
bend .35,180,.25 .15,740,.53 0,-520,.3
이 예제에서 생성된 클리핑은 의도적입니다. 제거
그것, 사용 이득 -5 대신에 이득 1.
참조 피치.
바이쿼드 b0 b1 b2 a0 a1 a2
주어진 계수로 바이쿼드 IIR 필터를 적용합니다. 여기서 b*와*는
분자 및 분모 계수.
http://en.wikipedia.org/wiki/Digital_biquad_filter (여기서 a0 = 1).
이 효과는 --구성 글로벌 옵션.
채널 채널
오디오 신호의 채널 수를 다음으로 변경하는 간단한 알고리즘을 호출합니다.
주어진 숫자 채널: 채널 수를 줄이면 믹싱하거나
채널 수를 늘리면 복제합니다.
The 채널 효과는 SoX의 경우 자동으로 호출됩니다. -c 옵션은 숫자를 지정합니다
입력 파일과 다른 채널의 수 또는 이 경우
효과가 명시적으로 주어지면 SoX의 -c 옵션을 제공할 필요가 없습니다. 예를 들어,
다음 두 명령은 동일합니다.
sox input.wav -c 1 output.wav 베이스 -b 24
sox input.wav output.wav 베이스 -b 24채널 1
두 번째 형식은 효과를 주문할 수 있으므로 더 유연합니다.
임의로.
참조 리믹스 채널을 임의로 믹스/선택할 수 있도록 하는 효과입니다.
합창 이득 이득 <지연 부식 속도 깊이 -s|-t>
오디오에 코러스 효과를 추가합니다. 이것은 다음과 같은 단일 보컬 사운드를 만들 수 있습니다.
합창뿐만 아니라 악기에도 적용할 수 있습니다.
코러스는 짧은 지연이 있는 에코 효과와 유사하지만 에코의 경우 지연이 있습니다.
일정하고 코러스와 함께 사인파 또는 삼각 변조를 사용하여 변경됩니다.
변조 깊이는 변조된 지연이 재생되기 전에 재생되는 범위를 정의합니다.
지연 후. 따라서 지연된 사운드는 더 느리거나 빠르게 들릴 것입니다.
일부 보컬이 있는 코러스와 같이 원래 사운드를 중심으로 조정된 지연된 사운드
약간 오프 키. 코러스 효과에 대한 자세한 내용은 [3]을 참조하십시오.
각 XNUMX-튜플 매개변수 지연/감쇠/속도/깊이는 밀리초 단위의 지연을 제공합니다.
및 깊이를 사용하여 Hz 단위의 변조 속도로 감쇠(게인인에 상대적)
밀리초. 변조는 정현파(-s) 또는 삼각형(-t). 얻다-
out은 출력의 볼륨입니다.
일반적인 지연은 약 40ms에서 60ms입니다. 변조 속도는 0.25Hz 근처에서 가장 좋습니다.
변조 깊이는 약 2ms입니다. 예를 들어, 단일 지연:
기타 연주1.wav 합창 0.7 0.9 55 0.4 0.25 2 -t
원본 샘플의 두 가지 지연:
기타 연주1.wav 합창 0.6 0.9 50 0.4 0.25 2 -t
60 0.32 0.4 1.3 -초
더 풍성하게 들리는 코러스(XNUMX개의 추가 지연 포함):
기타 연주1.wav 합창 0.5 0.9 50 0.4 0.25 2 -t
60 0.32 0.4 2.3 -t 40 0.3 0.3 1.3 -s
컴팬드 공격 1,부패1{,공격 2,부패2}
[부드러운 무릎 dB:]in-dB1[,아웃 dB1]{,in-dB2,아웃 dB2}
[이득 [초기 볼륨 dB [지연]]]
오디오의 동적 범위를 압축(압축 또는 확장)합니다.
The 공격 그리고 부식 매개변수(초)는 시간을 결정합니다.
입력 신호의 순간 레벨을 평균하여 볼륨을 결정합니다.
공격은 볼륨의 증가를 나타내고 감쇠는 감소를 나타냅니다. 대부분의 경우
상황에서 어택 타임(음악이 커지는 것에 대한 응답)은
사람의 귀는 갑작스런 큰 소리에 더 민감하기 때문에 감쇠 시간보다 짧습니다.
갑자기 부드러운 음악보다. 공격/감쇠 매개변수가 한 쌍 이상인 경우
지정되면 각 입력 채널은 개별적으로 압축되고 쌍의 수는
입력 채널 수와 일치해야 합니다. 일반적인 값은 0.3,0.8 초.
두 번째 매개변수는 컴팬더의 전달 함수에 있는 포인트 목록입니다.
가능한 최대 신호 진폭을 기준으로 dB로 지정됩니다. 입력
값은 엄격하게 증가하는 순서여야 하지만 전달 함수는 그렇지 않습니다.
단조롭게 상승해야합니다. 생략하면 값 아웃 dB1 기본값은
와 같은 값 in-dB1; 아래 수준 in-dB1 강제되지 않음(그러나 이득이 있을 수 있음
그들에게 적용). 요점 0,0 가정되지만 재정의될 수 있습니다( 0,아웃-dBn).
목록 앞에 a가 있는 경우 부드러운 무릎 dB 값을 입력한 다음 인접한 점
전달 함수가 만나는 선분은 주어진 양만큼 반올림됩니다.
전달 함수의 일반적인 값은 다음과 같습니다. 6:-70,-60,-20.
세 번째(선택 사항) 매개 변수는 전혀 적용할 추가 게인(dB)입니다.
전송 기능에 포인트를 지정하고 전체 게인을 쉽게 조정할 수 있습니다.
네 번째(선택 사항) 매개변수는 각 채널에 대해 가정할 초기 레벨입니다.
압축이 시작될 때. 이를 통해 사용자는 초기에 명목 수준을 제공할 수 있으며,
예를 들어 매우 큰 이득이 초기 신호 레벨에 적용되지 않도록
압류 행동이 작동하기 시작하기 전에:
이러한 이벤트가 발생하면 컴팬더 이득이 발생하는 동안 출력이 심하게 잘립니다.
적절하게 스스로 조정합니다. 일반적인 값(처음에는 조용한 오디오의 경우)은 다음과 같습니다.
-90 데시벨
다섯 번째(선택 사항) 매개변수는 지연 시간(초)입니다. 입력 신호가 분석됩니다
즉시 컴팬더를 제어하지만, 컴팬더에 공급되기 전에 지연됩니다.
볼륨 조절기. 공격/감쇠 시간과 거의 동일한 지연 지정
컴팬더가 '예측'이 아닌 '예측'으로 효과적으로 작동할 수 있도록 합니다.
반응 모드. 대표적인 값은 0.2 초.
* * *
다음 예는 조용하고 고요한 음악을 만드는 데 사용될 수 있습니다.
움직이는 것과 같은 시끄러운 환경에서 듣기에 적합한 시끄러운 구절
차량:
sox asz.wav asz-car.wav 컴판드 0.3,1 6:-70,-60,-20 -5 -90 0.2
전달 함수(`6:-70,...')는 매우 부드러운 소리(-70dB 미만)가
변경되지 않은 상태로 유지. 이것은 컴팬더가 볼륨을 높이는 것을 중지합니다.
움직임 사이와 같은 '조용한' 구절. 그러나 -60dB ~
0dB(최대 볼륨)은 원본의 60dB 다이나믹 레인지가 되도록 부스트됩니다.
음악을 즐길 수 있을 만큼 넓은 3dB 범위로 1:20 압축됩니다.
음악이지만 도로 소음을 피할 수있을만큼 좁습니다. '6:'은 6dB를 선택합니다.
부드러운 무릎 압박. 클리핑을 방지하려면 -5(dB) 출력 게인이 필요합니다(
숫자는 정확하지 않으며 실험에 의해 파생되었습니다. -90(dB)
초기 볼륨은 거의 무음으로 시작하는 클립에 대해 잘 작동하고
0.2(초)의 지연은 컴팬더가 조금 더 반응하도록 하는 효과가 있습니다.
급격한 볼륨 변화에 빠르게.
다음 예에서 compand는 노이즈가 다음과 같을 때 노이즈 게이트로 사용됩니다.
신호보다 낮은 레벨:
재생 파일 컴팬드 .1,.2 -inf,-50.1,-inf,-50,-50 0 -90 .1
여기 또 다른 노이즈 게이트가 있습니다. 이번에는 노이즈가 다음보다 높은 수준에 있을 때입니다.
신호(어떤 면에서는 스퀠치와 유사하게 만들기):
인파일 컴팬드 .1,.1 -45.1,-45,-inf,0,-inf 45 -90 .1 재생
이 효과는 --구성 전역 옵션(전달 함수용).
참조 mcompand 다중 대역 압축 효과를 위해.
대조 [강화량(75)]
압축과 비교할 수 있는 이 효과는 오디오 신호를 수정하여 소리가 나도록 합니다.
더 크게. 강화량 향상의 양을 제어하며 숫자입니다.
범위 0-100. 참고 강화량 = 0은 여전히 상당한
대비 향상.
참조 항목 컴팬드 그리고 mcompand 효과.
dcshift 변화 [리미터게인]
오디오에 DC 이동을 적용합니다. 이것은 DC 오프셋을 제거하는 데 유용할 수 있습니다.
아마도 녹음 체인의 하드웨어 문제로 인해) 오디오에서. 그 효과
DC 오프셋의 감소는 헤드룸과 그에 따른 볼륨을 감소시킵니다. NS 스탯 or 통계 효과 수
신호에 DC 오프셋이 있는지 확인하는 데 사용됩니다.
주어진 dcshift 값은 ±2 범위의 부동 소수점 숫자입니다.
오디오를 이동하는 양을 나타냅니다(±1 범위 내).
선택 사항 리미터게인 도 지정할 수 있습니다. 값이 훨씬 작아야 합니다.
1보다 크며(예: 0.05 또는 0.02) 클리핑을 방지하기 위해 피크에서만 사용됩니다.
* * *
짧은 지연이 있지만 DC 오프셋을 제거하는 다른 방법은 다음과 같습니다.
사용 하이 패스 10Hz의 주파수에서 필터 효과
다음 예:
sox -n dc.wav 신디사이저 5 죄 %0 50
sox dc.wav fixed.wav 하이패스 10
깊이 컴팩트 디스크(IEC 60908) 디엠퍼시스(고음 감쇠 쉘빙 필터)를 적용합니다.
1980년대 초에 발행된 일부 CD의 마스터링에 선점을 적용했습니다.
여기에는 많은 클래식 음악 앨범과 현재 인기 있는
비틀즈, 핑크 플로이드 등의 앨범. 사전 강조는 다음에서 제거되어야 합니다.
재생 장치의 디엠퍼시스 필터에 의한 재생 시간. 그러나 모든
최신 CD 플레이어에는 이 필터가 있으며 PC CD 드라이브에는 이 필터가 있는 경우가 거의 없습니다. 미리 재생
올바른 디엠퍼시스 필터 없이 강조된 오디오는
거칠게 들리고 제작자가 의도한 것과는 거리가 멉니다.
와 더불어 깊이 효과, 오디오에 필요한 디엠퍼시스를 적용하는 것이 가능합니다.
미리 강조된 CD에서 추출한 다음 디코드를 굽거나
새 CD에 강조된 오디오(모든 CD 플레이어에서 올바르게 재생됨) 또는
PC에서 올바르게 강조되지 않은 오디오 파일을 재생하기만 하면 됩니다. 예를 들어:
sox track1.wav track1-deemph.wav 딥
그런 다음 track1-deemph.wav를 CD에 굽거나
track1-deemph.wav 재생
또는 단순히
track1.wav 딥 재생
디엠퍼시스 필터는 바이쿼드로 구현됩니다. 최대 편차
이상적인 응답은 0.06dB(최대 20kHz)입니다.
이 효과는 --구성 글로벌 옵션.
참조 항목 베이스 그리고 삼배 선반 이퀄라이제이션 효과.
지연 {길이}
하나 이상의 오디오 채널을 지연시킵니다. 길이 시간을 지정할 수 있습니다.
'', 샘플의 수. 시간과 샘플 지연을 모두 지정하지 마십시오.
같은 명령. 예를 들어, 지연 1.5 0 0.5 첫 번째 채널을 1.5만큼 지연
초, 세 번째 채널은 0.5초, 두 번째 채널(및 모든
존재할 수 있는 다른 채널) 지연되지 않음. 다음(하나의 긴) 명령
차임 소리를 재생합니다:
재생 -n synth -j 3 죄 %3 죄 %-2 죄 %-5 죄 %-9
sin %-14 sin %-21 페이드 h .01 2 1.5 지연
1.3 1 .76 .54 .27 리믹스 - 페이드 h 0 2.7 2.5 표준 -1
기타 코드를 연주합니다.
플레이 -n 신스 pl G2 pl B2 pl D3 pl G3 pl D4 pl G4
지연 0 .05 .1 .15 .2 .25 리믹스 - 페이드 0 4 .1 표준 -1
떨림 [-S|-s|-f 필터링] [-a] [-p 정확]
오디오에 디더링을 적용합니다. 디더링은 의도적으로 소량의 노이즈를 추가합니다.
경우에 발생할 수 있는 가청 양자화 효과를 마스킹하기 위해 신호에
출력 샘플 크기가 24비트 미만입니다. 옵션이 없으면 이 효과가 추가됩니다.
삼각형(TPDF) 백색 잡음. 노이즈 셰이핑(특정 샘플 속도에만 해당)은
로 선택되다 -s. 와 더불어 -f 옵션에서 특정 항목을 선택할 수 있습니다.
다음 목록의 노이즈 형성 필터: Lipshitz, f-weighted, modify-e-
가중치, 개선 전자 가중치, gesemann, shibata, 낮은 시바타, 높은 시바타. 메모
대부분의 필터 유형은 44100Hz 샘플 레이트에서만 사용할 수 있습니다. 필터
유형은 다음과 같은 속성으로 구별됩니다: 소음의 가청도,
(들을 수 없지만 일부 상황에서는 문제가 있음) 모양의 고주파
소음 및 처리 속도.
http://sox.sourceforge.net/SoX/NoiseShaping 다른 노이즈의 그래프에 대해
곡선을 형성합니다.
The -S 옵션은 더 높은 주파수로 편향된 약간 '경사' TPDF를 선택합니다.
모든 샘플링 속도에서 사용할 수 있지만 ≈22k 미만에서는 일반 TPDF가 더 나을 수 있습니다.
≈ 37k 이상에서는 노이즈 모양이 더 나을 것입니다.
The -a 옵션은 디더링(해당되는 경우 노이즈 형성)이 있는 모드를 활성화합니다.
필요할 때만 자동으로 활성화됩니다. 가장 가능성이 높은 용도는 다음과 같습니다.
이미 디더링된 파일에 페이드 인 또는 아웃을 적용하여
색이 바랜 부분에만 적용됩니다. 그러나 자동 디더링은 완벽하지 않으므로
페이드는 노이즈 변조가 있는지 주의 깊게 확인해야 합니다. 이런 일이 발생하면
그런 다음 전체 파일을 다시 디더링하거나 손질, 페이드, 연결합니다.
The -p 옵션을 사용하면 대상 정밀도를 재정의할 수 있습니다.
SoX 글로벌 옵션인 경우 -R 옵션이 주어지지 않으면 의사 난수
백색 잡음을 생성하는 데 사용되는 생성기는 '리시드'됩니다.
노이즈는 호출마다 다릅니다.
이 효과 뒤에 오디오에 영향을 주는 다른 효과가 오면 안 됩니다.
위의 '디더링' 섹션도 참조하세요.
다운샘플링 [인자(2)]
신호를 정수 요소로 다운샘플링: 각 요소 중 첫 번째 요소만 인자
샘플은 유지되고 나머지는 폐기됩니다.
데시메이션 필터가 적용되지 않습니다. 입력이 적절하게 대역 제한되지 않은 경우
베이스밴드 신호, 앨리어싱이 발생합니다. 이것은 예를 들어 주파수에 대해 바람직할 수 있습니다.
번역.
앤티앨리어싱을 사용한 일반적인 리샘플링 효과는 다음을 참조하십시오. 율. 또한보십시오 업샘플링.
귀지 헤드폰으로 오디오를 더 쉽게 들을 수 있습니다. 44.1kHz 스테레오에 '큐'를 추가합니다(예:
오디오 CD 형식) 오디오는 헤드폰으로 들을 때 스테레오 이미지가
머리 안쪽(헤드폰의 표준)에서 바깥쪽으로 그리고 앞쪽으로 이동했습니다.
청취자(스피커의 표준).
에코 이득 이득 <지연 부식>
오디오에 에코를 추가합니다. 에코는 소리를 반사하며 자연스럽게 발생할 수 있습니다.
말을 하거나 소리를 지를 때 산(때로는 큰 건물) 사이에서; 디지털
에코 효과는 이 동작을 에뮬레이트하고 종종 사운드를 채우는 데 사용됩니다.
단일 악기 또는 보컬. 원래 신호 사이의 시간 차이
반사는 '지연'(시간)이고 반사된 신호의 크기는
'부패'입니다. 다중 에코는 다른 지연과 감쇠를 가질 수 있습니다.
각각 주어진 지연 부식 쌍은 밀리초 단위의 지연과 감쇠(상대
그 에코의 이득). Gain-out은 출력의 볼륨입니다. 예: 이
실제보다 두 배 많은 악기가 있는 것처럼 들릴 것입니다.
놀이:
리드 재생.aiff 에코 0.8 0.88 60 0.4
지연이 매우 짧으면 음악을 재생하는 (금속) 로봇처럼 들립니다.
리드 재생.aiff 에코 0.8 0.88 6 0.4
더 긴 지연은 산에서 열리는 야외 콘서트처럼 들릴 것입니다.
리드 재생.aiff 에코 0.8 0.9 1000 0.3
산 하나 더, 그리고:
리드 재생.aiff 에코 0.8 0.9 1000 0.3 1800 0.25
에코 이득 이득 <지연 부식>
오디오에 에코 시퀀스를 추가합니다. 각 지연 부식 쌍은 지연을 제공합니다
밀리초 및 해당 에코의 감쇠(게인인에 상대적). 이득 아웃은
출력 볼륨.
에코 효과와 마찬가지로 echo는 'ECHO in Sequel'을 나타내며 첫 번째 에코입니다.
입력을 취하고 두 번째는 입력과 첫 번째 에코, 세 번째는 입력 및
첫 번째와 두 번째 에코, ... 등등. 많이 사용하는데 주의가 필요하다
에코; 단일 에코는 단일 에코와 동일한 효과를 갖습니다.
샘플은 대칭 에코에서 두 번 바운스됩니다.
리드 재생.aiff 에코 0.8 0.7 700 0.25 700 0.3
샘플은 비대칭 에코에서 두 번 바운스됩니다.
리드 재생.aiff 에코 0.8 0.7 700 0.25 900 0.3
샘플은 차고에서 재생되는 것처럼 들립니다.
리드 재생.aiff 에코 0.8 0.7 40 0.25 63 0.3
평형 장치 주파수[k] 폭[q|o|h|k] 이득
XNUMX극 피킹 이퀄라이제이션(EQ) 필터를 적용합니다. 이 필터를 사용하면 신호-
선택한 주파수와 그 주변에서 레벨을 높이거나 낮출 수 있습니다.
(대역 통과 및 대역 거부 필터와 달리) 다른 모든 주파수에서
변하지 않은.
주파수 필터의 중심 주파수(Hz)를 제공합니다. 폭, 대역폭 및
이득 필요한 게인 또는 감쇠(dB). 주의 클리핑 사용할 때
긍정적인 이득.
복잡한 이퀄라이제이션 곡선을 생성하기 위해 이 효과는 여러 가지가 주어질 수 있습니다.
각각 다른 중심 주파수를 갖는 시간.
필터는 [1]에 자세히 설명되어 있습니다.
이 효과는 --구성 글로벌 옵션.
참조 베이스 그리고 삼배 이퀄라이제이션 효과를 방지합니다.
페이드 [유형] 페이드 인 길이 [정지 시간 [페이드 아웃 길이]]
오디오의 시작, 끝 또는 둘 다에 페이드 효과를 적용합니다.
선택 사항 유형 페이드 곡선의 모양을 선택하도록 지정할 수 있습니다. q 을 통한
사인파의 XNUMX/XNUMX, h 반 사인파의 경우, t 선형('삼각형') 기울기의 경우
l 로그의 경우, p 역포물선의 경우. 기본값은 로그입니다.
페이드 인은 첫 번째 샘플에서 시작하여 신호 레벨을 0에서 최대로 증가시킵니다.
볼륨 오버 페이드 인 길이 초. 페이드 인을 원하지 않으면 0초를 지정합니다.
페이드 아웃의 경우 오디오가 다음에서 잘립니다. 정지 시간 신호 레벨은
에서 시작하여 전체 볼륨에서 0으로 감소합니다. 페이드 아웃 길이 몇 초 전에
정지 시간. 면 페이드 아웃 길이 지정하지 않으면 기본적으로 다음과 같은 값으로 설정됩니다.
페이드 인 길이. 다음과 같은 경우 페이드 아웃이 수행되지 않습니다. 정지 시간 지정되지 않습니다. 만약
파일 길이는 입력 파일 헤더 및 길이 변경에서 결정할 수 있습니다.
효과가 유효하지 않은 경우 0 에 대해 지정할 수 있습니다. 정지 시간 표시하기 위해
입력 오디오 스트림의 끝에서 끝나는 페이드 아웃의 일반적인 경우입니다.
모든 시간은 기간 또는 샘플 수로 지정할 수 있습니다. 지정하려면
기간은 hh:mm:ss.frac 형식을 사용합니다. 샘플 수를 사용하여 지정하려면
샘플 수를 지정하고 샘플 수에 문자 `s'를 추가합니다(
예 '8000s').
참조 항목 접착 효과.
전나무 [coefs 파일|계수]
주어진 FIR 필터 계수와 함께 SoX의 FFT 컨볼루션 엔진을 사용하십시오. 싱글이라면
인수가 주어지면 이것은 필터를 포함하는 파일의 이름으로 처리됩니다.
계수(공백으로 구분됨, `#' 주석을 포함할 수 있음). 주어진 경우
파일 이름은 '-'이거나 인수가 지정되지 않은 경우 계수는 다음에서 읽습니다.
'표준 입력'(stdin); 그렇지 않으면 명령에 계수가 주어질 수 있습니다.
선. 예:
속스 인파일 아웃파일 전나무 0.0195 -0.082 0.234 0.891 -0.145 0.043
sox infile outfile 전나무 coefs.txt
coefs.txt 포함
# HP 필터
# 빈도=10000
1.2311233052619888-01
-4.4777096106211783e-01
5.1031563346705155-01
-6.6502926320995331e-02
...
이 효과는 --구성 글로벌 옵션.
플랜저 [지연 깊이 재생성 폭 속도 형성 상 인터프]
오디오에 플랜징 효과를 적용합니다. 에 대한 자세한 설명은 [3]을 참조하십시오.
플랜징.
모든 매개변수는 선택사항입니다(오른쪽에서 왼쪽으로).
범위 태만 기술설명
지연 0 - 30 0 밀리초 단위의 기본 지연.
깊이 0 - 10 2 밀리초 단위의 스위프 지연이 추가되었습니다.
재생성 -95 - 95 0 재생률(지연)
신호 피드백).
폭 0 - 100 71 지연된 신호 혼합 비율
원본으로.
속도 0.1 - 10 0.5 초당 스위프(Hz).
형성 죄 휩쓸린 물결 모양: 사인|삼각형.
상 0 - 100 25 스위프 웨이브 백분율 위상 변이
다중 채널용(예: 스테레오)
플랜지; 0 = 100 = 동일한 위상 켜짐
각 채널.
인터프 lin 디지털 지연 라인 보간:
선의|XNUMX 차.
이득 [-e|-B|-b|-r] [-n] [-l|-h] [이득-dB]
오디오 신호에 증폭 또는 감쇠를 적용하거나 경우에 따라 일부 신호에
그 채널의. 다음 중 하나를 사용하십시오. -e, -B, -b, -r및 -n 임시 필요
처리할 오디오를 저장하기 위한 파일 공간이므로
'스트리밍된' 오디오.
다른 옵션 없이, 이득-dB 신호 전력 레벨을 조정하는 데 사용됩니다.
주어진 dB 수: 양수는 증폭하고(클리핑 주의) 음수는 감쇠합니다.
다른 옵션을 사용하면 이득-dB 증폭 또는 감쇠가 (논리적으로) 적용됨
이러한 옵션으로 인해 처리 후.
주어진 -e 옵션에서 다중 채널 파일의 오디오 채널 레벨은
'equalised', 즉 게인이 가장 높은 채널 이외의 모든 채널에 적용됩니다.
모든 채널이 동일한 피크 레벨에 도달하도록 피크 레벨
주는 -n, 오디오가 '정규화'되지 않음).
The -B (balance) 옵션은 다음과 유사합니다. -e하지만,과 -NS, RMS 수준이 사용됩니다.
최고 수준 대신. -B 로 인한 스테레오 불균형을 수정하는 데 사용될 수 있습니다.
불완전한 레코드 턴테이블 카트리지. 참고로 달리 -e, -B 약간의 원인이 될 수 있습니다
깎는.
-b 와 유사하다 -B 그러나 클리핑 방지 기능이 있습니다. 즉,
균형을 맞추는 동안 클리핑이 발생하면 모든 채널에 감쇠가 적용됩니다. 참고로,
와 함께 -n, -B 그리고 -b 동의어입니다.
The -r 옵션은 이전 호출과 함께 사용됩니다. 이득 와 더불어 -h
옵션 - 자세한 내용은 아래를 참조하십시오.
The -n 옵션은 오디오를 0dB FSD로 정규화합니다. 와 함께 자주 사용된다.
부정적인 이득-dB 오디오가 주어진 레벨로 정규화되는 효과
0dB 이하. 예를 들어,
sox 인파일 아웃파일 게인 -n
0dB로 정규화하고,
sox 인파일 아웃파일 게인 -n -3
-3dB로 정규화됩니다.
The -l 옵션은 간단한 리미터를 호출합니다. 예를 들어
sox 인파일 아웃파일 게인 -l 6
6dB 게인을 적용하지만 클립하지 않습니다. 몇 dB 이상으로 제한한다는 점에 유의하십시오.
가끔(오디오 부분에서) 가청을 유발할 수 있으므로 권장하지 않습니다.
왜곡. 참조 컴팬드 더 유능한 리미터에 대한 효과.
The -h 옵션은 후속 처리를 위한 헤드룸을 제공하기 위해 게인을 적용하는 데 사용됩니다.
예를 들어
sox 인파일 아웃파일 게인 -h 베이스 +6
베이스 부스팅 효과 이전에 6dB의 감쇠가 적용되어 다음을 보장합니다.
클립되지 않습니다. 물론 베이스를 사용하면 헤드룸이 얼마나
필요하지만 다른 효과(예: 속도, 디더링)에서는 항상 명확하지 않습니다.
사용의 또 다른 이점 이득 -h 명시적인 감쇠가 아니라
헤드룸은 후속 효과에서 사용되지 않으며 다음으로 회수할 수 있습니다. 이득 -r,
예를 들면 다음과 같습니다
sox 인파일 아웃파일 게인 -h 베이스 +6 속도 44100 게인 -r
위의 효과 체인은 자르거나 증폭하지 않도록 보장합니다. 약화되면
클리핑을 방지하기 위해 필요하지만 그렇게 하는 데 필요한 만큼만.
출력 형식(디더링 및 비트 심도 감소)에도 헤드룸이 필요합니다.
'회수'할 수 없음), 예
sox 인파일 아웃파일 게인 -h 베이스 +6 속도 44100 게인 -rh 디더
여기서 두 번째 이득 호출에서 가능한 한 많은 헤드룸을 회수합니다.
앞의 효과는 있지만 후속 작업에 필요한 만큼의 여유 공간을 유지합니다.
처리. SoX 글로벌 옵션 -G 자동으로 호출하도록 지정할 수 있습니다. 이득 -h
그리고 이득 -r.
참조 항목 표준 그리고 권 효과.
하이 패스|저역 통과 [-1|-2] 주파수[k] [너비[q|o|h|k]]
3dB 포인트의 고역 통과 또는 저역 통과 필터 적용 주파수. 필터는
단극( -1) 또는 이중 극(기본값 또는 -2). 폭
이중 극 필터에만 적용됩니다. 기본값은 Q = 0.707이며 다음을 제공합니다.
버터워스 반응. 필터는 옥타브당 극당 6dB(당 20dB
1년당 극). 이중 극 필터는 [XNUMX]에 자세히 설명되어 있습니다.
이러한 효과는 다음을 지원합니다. --구성 글로벌 옵션.
참조 싱크 롤오프가 더 가파른 필터의 경우.
힐베르트 [-n 탭]
신호를 90도 위상 편이하여 홀수 탭 힐베르트 변환 필터를 적용합니다.
이것은 많은 매트릭스 코딩 방식과 분석 신호 생성에 사용됩니다. NS
프로세스는 종종 다음과 같은 곱셈으로 작성됩니다. i (또는 j), 허수 단위.
홀수 탭 힐베르트 변환 필터는 대역통과 특성을 가지며,
가장 낮은 주파수와 가장 높은 주파수. 대역폭은 다음 수로 제어할 수 있습니다.
다음으로 지정할 수 있는 필터 탭 -n. 기본적으로 탭 수는
약 75Hz의 차단 주파수에 대해 선택됩니다.
이 효과는 --구성 글로벌 옵션.
라드스파 모듈 [플러그인] [논의...]
LADSPA [5](Linux Audio Developer's Simple Plugin API) 플러그인을 적용합니다. 에도 불구하고
이름, LADSPA는 Linux 전용이 아니며 다음과 같이 다양한 효과를 사용할 수 있습니다.
cmt [6](Computer Music Toolkit) 및 Steve Harris's와 같은 LADSPA 플러그인
플러그인 모음 [7]. 첫 번째 인수는 플러그인 모듈이고 두 번째 인수는 이름입니다.
플러그인(모듈은 둘 이상의 플러그인을 포함할 수 있음) 및 기타 인수
플러그인의 제어 포트용입니다. 누락된 인수는 기본적으로 제공됩니다.
가능한 경우 값. 최대 하나의 오디오 입력과 하나의 오디오 출력이 있는 플러그인만
포트를 사용할 수 있습니다. 발견되면 환경 변수 LADSPA_PATH가 다음과 같이 사용됩니다.
플러그인 검색 경로.
음의 크기 [이득 [참고]]
음량 조절 - 유사 이득 효과는 있지만 균등화를 제공합니다.
인간의 청각 시스템. 보다 http://en.wikipedia.org/wiki/Loudness 상세한
음량에 대한 설명. 이득은 주어진 이득 매개변수(일반적으로
음) 및 ISO 226에 따라 이퀄라이징된 신호
대안이지만 65dB 참고 원본 오디오가 있는 경우 레벨이 주어질 수 있습니다.
다른 최적의 수준으로 이퀄라이징되었습니다. 다음과 같은 경우 -10dB의 기본 게인이 사용됩니다.
이득 값이 주어지지 않습니다.
참조 항목 이득 효과.
저역 통과 [-1|-2] 주파수[k] [너비[q|o|h|k]]
저역 통과 필터를 적용합니다. 에 대한 설명을 참조하십시오. 하이 패스 세부 사항에 대한 효과.
mcompand "공격 1,부패1{,공격 2,부패2}
[부드러운 무릎 dB:]in-dB1[,아웃 dB1]{,in-dB2,아웃 dB2}
[이득 [초기 볼륨 dB [지연]]]" {교차 주파수[k] "공격1,..."}
멀티밴드 컴팬더는 싱글밴드 컴팬더와 유사하지만 오디오는
먼저 Linkwitz-Riley 교차 필터를 사용하여 대역으로 분할하고 별도로
지정 가능한 컴팬더는 각 밴드에서 실행됩니다. 참조 컴팬드 정의에 대한 효과
그 매개변수의. Compand 매개변수는 큰따옴표와
해당 대역에 대한 교차 주파수는 다음과 같이 주어집니다. 교차 주파수; 이것들은 반복될 수 있다
여러 밴드를 생성합니다.
예를 들어, 다음(하나의 긴) 명령은 다중 대역 압축이 어떻게 수행되는지 보여줍니다.
일반적으로 FM 라디오에서 사용:
play track1.wav 이득 -3 sin 8000- 29 100 mcompand
"0.005,0.1 -47,-40,-34,-34,-17,-33" 100
"0.003,0.05 -47,-40,-34,-34,-17,-33" 400
"0.000625,0.0125 -47,-40,-34,-34,-15,-33" 1600
"0.0001,0.025 -47,-40,-34,-34,-31,-31,-0,-30" 6400
"0,0.025 -38,-31,-28,-28,-0,-25"
게인 15 하이패스 22 하이패스 22 sin -n 255 -b 16 -17500
이득 9 저역 통과 -1 17801
오디오 파일은 시뮬레이션된 FM 라디오 사운드(또는 방송 신호
끝에 있는 저역통과 필터를 건너뛴 경우 조건). 파이프라인은
미국 스타일의 75us 사전 강조로 설정합니다.
참조 컴팬드 단일 밴드 컴팬딩 효과를 위해
노이즈프로프 [프로필 파일]
노이즈 감소에 사용할 오디오 프로필을 계산합니다. 설명 보기
의 시끄러운 세부 사항에 대한 효과.
시끄러운 [프로필 파일 [양]]
프로파일링 및 필터링을 통해 오디오 신호의 노이즈를 줄입니다. 이 효과는
쉿 소리나 윙윙거리는 소리와 같은 일관된 배경 소음을 제거하는 데 적당히 효과적입니다.
그것을 사용하려면 먼저 SoX를 다음과 함께 실행하십시오. 노이즈프로프 오디오 섹션에 미치는 영향
이상적으로는 침묵을 포함하지만 실제로는 소음을 포함합니다. 이러한 섹션은
일반적으로 녹음의 시작이나 끝에서 발견됩니다. 노이즈프로프 쓸 것이다
노이즈 프로파일을 프로필 파일, 또는 그렇지 않은 경우 stdout으로 프로필 파일 또는 '-'가
주어진. 예
sox speech.wav -n 트림 0 1.5 noiseprof speech.noise-profile
실제로 노이즈를 제거하려면 SoX를 다시 실행하십시오. 이번에는 시끄러운 효과;
시끄러운 노이즈 프로파일에 따라 노이즈를 줄입니다.
노이즈프로프)에서 프로필 파일, 또는 그렇지 않은 경우 stdin에서 프로필 파일 또는 `-'가 주어지면.
예 :
sox speech.wav clean.wav noisered speech.noise-profile 0.3
제거해야 하는 노이즈의 양은 다음으로 지정됩니다. 양-a 0에서 1 사이의 숫자
기본값은 0.5입니다. 숫자가 높을수록 노이즈가 더 많이 제거되지만 더 많이 나타납니다.
오디오 신호의 원하는 구성 요소를 제거할 가능성. 교체하기 전에
노이즈 감소 버전으로 원본 녹음, 다양한 실험 양
오디오에 가장 적합한 값을 찾기 위한 값 헤드폰을 사용하여 자신이 있는지 확인하십시오.
결과에 만족하며 특히 조용한 부분에 주의를 기울입니다.
오디오.
대부분의 시스템에서 두 단계(프로파일링 및 축소)는 다음을 사용하여 결합할 수 있습니다.
파이프, 예
sox noise.wav -n 트림 0 1 noiseprof | 시끄러운 재생.wav noisered
표준 [dB 레벨]
오디오를 정규화합니다. 표준 그냥 별칭입니다 이득 -n; 참조 이득 에 대한 효과
세부.
죄송합니다 위상외 스테레오 효과. 스테레오를 트윈 모노로 믹스하여 각 모노 채널이
좌우 스테레오 채널의 차이를 포함합니다. 이것은
종종 '노래방' 효과로 알려져 있습니다.
또는 녹음의 모든 보컬. 그것은 동등하다 리믹스 1,2 1,2.
오버 드라이브 [이득(20) [색(20)]]
비선형 왜곡. NS 색 매개변수는 짝수 고조파의 양을 제어합니다.
과잉 구동 출력의 콘텐츠.
인주 { 길이[@위치] }
시작, 끝 또는 지정된 지점에서 오디오를 무음으로 채웁니다.
오디오를 통해. 둘 다 길이 그리고 위치 시간을 지정할 수 있습니다. 또는 추가된 경우
's', 많은 샘플. 길이 삽입할 무음의 양이며
위치 삽입할 입력 오디오 스트림의 위치입니다. 임의의 숫자
지정된 위치가 다음과 같은 경우 길이와 위치를 지정할 수 있습니다.
이전 것보다 적지 않습니다. 위치 첫 번째와 마지막에 대해 선택 사항입니다.
길이를 지정하고 생략하면 시작과 끝 부분에 해당합니다.
각각 오디오. 예를 들어, 인주 1.5 1.5 1.5초의 침묵 패딩 추가
오디오의 각 끝에서 인주 4000초@3:00 4000개의 침묵 샘플 삽입 3
오디오에 분. 오디오 끝에서만 무음이 필요한 경우
끝 위치를 지정하거나 시작 시 길이가 XNUMX인 패드를 지정합니다.
참조 지연 오디오 시작 부분에 침묵을 추가할 수 있는 효과
채널별 기준.
페이저 이득 이득 지연 부식 속도 [-s|-t]
오디오에 페이징 효과를 추가합니다. 위상에 대한 자세한 설명은 [3]을 참조하십시오.
지연/감쇠/속도는 지연을 밀리초 단위로 제공하고 감쇄(게인-
in) Hz 단위의 변조 속도로. 변조는 정현파(-s) -
여러 기기에 적합하거나 삼각형(-t) - 단일 악기 제공
더 선명한 페이징 효과. 피드백을 피하기 위해 감쇠는 0.5보다 작아야 합니다.
일반적으로 0.1 이상입니다. Gain-out은 출력의 볼륨입니다.
예 :
플레이 snare.flac 페이저 0.8 0.74 3 0.4 0.5 -t
더 부드러운:
플레이 snare.flac 페이저 0.9 0.85 4 0.23 1.3 -s
인기 있는 소리:
플레이 snare.flac 페이저 0.89 0.85 1 0.24 2 -t
더 심각한:
플레이 snare.flac 페이저 0.6 0.66 3 0.6 2 -t
피치 [-q] 변화 [분절 [수색 [중첩하다]]]
오디오 피치를 변경합니다(템포는 아님).
변화 음의 '센트'(즉, 100분의 XNUMX)로 피치 이동을 제공합니다.
반음). 참조 속도 다른 매개변수에 대한 설명에 대한 효과입니다.
참조 항목 굽히다, 속도및 속도 효과.
율 [-q|-l|-m|-h|-v] [재정의 옵션] 율[k]
오디오 샘플링 속도(즉, 오디오 재샘플링)를 주어진 값으로 변경합니다. 율 (조차
출력 파일 형식에서 지원하는 경우 정수가 아님) 품질 수준을 사용하여
다음과 같이 정의됩니다.
품질 밴드- Rej dB 일반적인
폭
-q 빠른 해당 없음 ≈30 @ 재생 켜기
Fs/4 고대 하드웨어
-l 낮은 80% 100 오래된 재생
하드웨어
-m 중간 95% 100 오디오 재생
-h 높음 95% 125 16비트 마스터링
(디더링과 함께 사용)
-v 매우 높음 95% 175 24비트 마스터링
어디에 대역폭 보존된 오디오 주파수 대역의 백분율입니다.
그리고 Rej dB 노이즈 제거 수준입니다. 리샘플링 수준 증가
품질은 오디오를 처리하는 데 걸리는 시간을 증가시키는 대가를 치르게 됩니다. 만약에
품질 옵션이 제공되지 않고 사용된 품질 수준은 '높음'입니다(그러나 '재생 및
재생에 관한 위의 오디오 녹음'을 참조하십시오.
'빠른' 알고리즘은 XNUMX차 보간법을 사용합니다. 다른 모든 사람들은 대역 제한을 사용합니다.
보간. 기본적으로 모든 알고리즘에는 '선형' 위상 응답이 있습니다. ~을위한
'중간', '높음' 및 '매우 높음', 위상 응답을 구성할 수 있습니다(아래 참조).
The 율 효과는 SoX의 경우 자동으로 호출됩니다. -r 옵션은 다음과 같은 비율을 지정합니다.
입력 파일과 다릅니다. 또는 이 효과가 주어지면
명시적으로 SoX의 -r 옵션을 제공할 필요가 없습니다. 예를 들어 다음 두
명령은 동일합니다.
sox input.wav -r 48k output.wav 베이스 -b 24
sox input.wav output.wav 베이스 -b 24 속도 48k
두 번째 명령이 허용하는 한 더 유연하지만 율 제공되는 옵션,
효과를 임의로 정렬할 수 있습니다.
* * *
경고: 기술적으로 자세한 논의는 다음과 같습니다.
위에서 설명한 간단한 품질 선택은 다음을 충족하는 설정을 제공합니다.
대부분의 리샘플링 작업의 요구 사항. 그러나 경우에 따라
리샘플러의 필터 응답을 미세 조정하는 것이 바람직합니다. 이것은 다음을 사용하여 달성할 수 있습니다.
보수 옵션, 다음 표에 자세히 설명되어 있습니다.
-밀 위상 응답 = 최소/중간/선형
-s 가파른 필터(대역폭 = 99%)
-a 통과 대역 위의 앨리어싱/이미징 허용
-b 74-99.7 모든 대역폭 %
-p 0-100 모든 위상 응답(0 = 최소, 25 = 중간,
50 = 선형, 100 = 최대)
NB 무시 옵션은 '빠른' 또는 '낮은' 품질 알고리즘과 함께 사용할 수 없습니다.
모든 리샘플러는 때때로 '에코'(일명 '링잉')를 생성할 수 있는 필터를 사용합니다.
'핑거 스냅' 또는
다른 매우 타악기 소리. 그러한 인공물은 훨씬 더 눈에 띄게됩니다.
과도기('사전 에코') 이전에 발생하는 경우보다 이후에 발생하는 경우 인간의 귀
그것('포스트 에코'). 그러한 인공물의 빈도는
원래 샘플링 속도와 새 샘플링 속도 중 더 작지만 이것이 적어도
44.1kHz이면 인공물은 인간의 가청 범위 밖에 있게 됩니다.
위상 응답 설정을 사용하여 과도 분포를 제어할 수 있습니다.
'pre'와 'post' 사이의 에코: 최소 단계에서는 사전 에코가 없지만
가장 긴 포스트 에코; 선형 위상에서 사전 및 사후 에코는 동일한 양(in
신호 용어(가청 용어 제외); 중간 단계 설정 시도
작은 길이(및 레벨)의 프리 에코와
중간 길이의 포스트 에코.
최소, 중간 또는 선형 위상 응답은 다음을 사용하여 선택됩니다. -M, -I및 -L
옵션; 사용자 정의 단계 응답은 다음을 사용하여 생성할 수 있습니다. -p 옵션. 그 단계를 참고하십시오
'linear'와 'maximum'(50보다 큼) 사이의 응답은 거의 유용하지 않습니다.
리샘플러의 대역폭 설정은
원래 신호(업샘플링할 때 원래 샘플 레이트를 작성하거나 새로운
다운 샘플링 시 샘플 속도)는 변환 중에 유지됩니다. '통과-
band'는 대역폭 지점까지의 모든 주파수를 나타내는 데 사용됩니다(예:
44.1kHz 샘플링 속도 및 95%의 리샘플링 대역폭, 통과 대역은 다음을 나타냅니다.
0Hz(DC)에서 약 21kHz까지의 주파수). 리샘플러의 대역폭 증가
결과적으로 변환 속도가 느려지고 일시적인 에코 인공물이 증가할 수 있습니다.
마찬가지로).
The -s '가파른 필터' 옵션은 리샘플링 대역폭을 기본 95%에서 변경합니다.
(3dB 포인트 기준), 99%. NS -b 옵션을 사용하면 대역폭을 다음으로 설정할 수 있습니다.
74-99.7 % 범위의 모든 값, 그러나 99%보다 큰 대역폭 값에 유의하십시오.
과도한 과도 에코를 유발할 수 있으므로 정상적인 사용에는 권장되지 않습니다.
경우 -a 옵션이 주어지면 통과 대역 위의 앨리어싱/이미징이 허용됩니다.
예를 들어 샘플링 속도가 44.1kHz이고 리샘플링 대역폭이 95%인 경우
21kHz 이상의 주파수 내용이 왜곡될 수 있음을 의미합니다. 그러나 이것은
통과 대역 이상(즉, 관심/가청의 가장 높은 주파수 이상),
이것은 문제가 아닐 수 있습니다. 앨리어싱/이미징 허용의 이점 감소
처리 시간 및 일시적 에코 인공물 감소(거의 절반). 참고
이 옵션이 주어지면 다음과 같이 허용되는 최소 대역폭 -b 로 증가
85 %
예 :
sox input.wav -b 16 output.wav rate -s -a 44100 디더 -s
기본(고) 품질 리샘플링; 재정의: 가파른 필터, 앨리어싱 허용; 에게
44.1kHz 샘플 속도; 노이즈 형태의 디더를 16비트 WAV 파일로 변환합니다.
sox 입력.wav -b 24 출력.aiff 비율 -v -I -b 90 48k
매우 높은 품질의 리샘플링; 재정의: 중간 위상, 대역폭 90%; 48k
샘플 레이트; 출력을 24비트 AIFF 파일에 저장합니다.
* * *
The 피치 그리고 속도 효과 사용 율 핵심에 영향을 미칩니다.
리믹스 [-a|-m|-p]사양을 벗어난>
사양을 벗어난 = 사양 내{,사양 내} | 0
사양 내 = [인찬][-[인찬2]] [볼륨 스펙]
볼륨 스펙 = p|i|v[음량]
입력 오디오 채널을 선택하여 출력 오디오 채널로 믹싱합니다. 각 출력
채널은 차례로 지정된 사양을 벗어난: 기여 입력 목록
채널 및 볼륨 사양.
이 효과는 오디오에서 작동합니다. 채널 SoX 효과 내에서
처리 체인; 와 혼동되어서는 안 된다. -m 전역 옵션(여기서
여러 파일 효과 체인에 들어가기 전에 혼합됩니다).
An 사양을 벗어난 쉼표로 구분된 입력 채널 번호와 하이픈으로 구분된 입력을 포함합니다.
채널 번호 범위; 대안으로, 0 자동 출력을 생성하기 위해 제공될 수 있습니다.
채널. 예를 들어,
sox input.wav output.wav 리믹스 6 7 8 0
1개의 채널이 있는 출력 파일을 생성합니다. 여기서 채널 2, 3, XNUMX은
채널 6, 7, 8은 입력 파일에 있고 채널 4는 무음입니다. 반면
sox input.wav output.wav 리믹스 1-3,7 3
왼쪽 채널이 믹스인 (다소 기이한) 스테레오 출력 파일을 생성합니다.
입력 채널 1, 2, 3 및 7의 아래로, 오른쪽 채널은 입력의 복사본입니다.
채널 3.
채널 범위가 지정된 경우 왼쪽 및 오른쪽에 있는 채널 번호
하이픈은 선택 사항이며 기본값은 1 및 입력 채널 수입니다.
각기. 따라서
sox input.wav output.wav 리믹스 -
모든 입력 채널을 모노로 믹스다운합니다.
기본적으로 출력 채널이 여러(n) 입력 채널에서 혼합되는 경우 각
입력 채널은 ¹/n의 비율로 조정됩니다. 사용자 정의 혼합 볼륨을 설정할 수 있습니다.
주어진 입력 채널 또는 입력 채널 범위를 따라 볼륨 스펙
(볼륨 사양). 이것은 편지 중 하나입니다. p, i및 v, 그 다음에
볼륨 번호, 그 의미는 주어진 문자에 따라 다르며 다음과 같이 정의됩니다.
다음과 같습니다 :
편지 음량 번호 노트
p 전력 조정 dB 0 = 변화 없음
나는 dB 단위로 전력을 'p'로 조정하지만,
오디오
v 전압 승수 1 = 변화 없음, 0.5 ≈ 6dB
감쇠, 2 ≈ 6dB
이득, -1 = 반전
경우 사양을 벗어난 적어도 하나를 포함 볼륨 스펙 기본적으로 ¹/n 스케일링은
동일한 out-spec의 다른 채널에 적용됩니다(다른 out-spec에 있을 수 있지만
명세서). 그러나 -a(자동) 옵션은 자동을 유지하기 위해 주어질 수 있습니다.
이 경우 스케일링. 예를 들어,
sox input.wav output.wav 리믹스 1,2 3,4v0.8
채널 레벨 승수가 0.5,0.5 1,0.8인 반면
sox input.wav output.wav 리믹스 -a 1,2 3,4v0.8
0.5,0.5 0.5,0.8의 채널 레벨 승수가 됩니다.
-m(수동) 옵션은 모든 자동 볼륨 조정을 비활성화하므로
sox input.wav output.wav 리믹스 -m 1,2 3,4v0.8
1,1 1,0.8의 채널 레벨 승수가 됩니다.
볼륨 번호는 선택 사항이며 생략하면 볼륨이 변경되지 않습니다.
그러나 이것이 유용한 유일한 경우는 i. 용
예를 들면 입력.wav 스테레오인 경우
sox input.wav output.wav 리믹스 1,2i
의 모노에 해당합니다. 죄송합니다 효과.
경우 -p 옵션이 주어지면 모든 자동 ¹/n 스케일링은 ¹/√n으로 대체됩니다.
('전력') 스케일링; 이것은 더 큰 믹스를 제공하지만 때때로 클립될 수 있습니다.
* * *
한 가지 용도 리믹스 효과는 오디오 파일을 파일 세트로 분할하는 것입니다.
구성 채널 중 하나를 포함합니다(다음을 수행하기 위해
개별 오디오 채널에서 처리). 채널이 몇 개 이상인 경우
관련된 경우 다음과 같은 스크립트(Bourne 셸 스크립트)가 유용합니다.
#!/ 빈 / SH
chans=`soxi -c "$1"`
동안 [ $chans -ge 1 ]; ~하다
chans0=`printf %02i $chans` # 2자리이므로 최대 99개까지 가능합니다.
out=`에코 "$1"|sed "s/\(.*\)\.\(.*\)/\1-$chans0.\2/"`
sox "$1" "$out" 리믹스 $chans
chans=`expr $chans - 1`
한
파일의 경우 입력.wav XNUMX개의 오디오 채널이 포함된 스크립트는
XNUMX개의 출력 파일을 생성합니다. 입력-01.wav, 입력-02.wav, ..., 입력-06.wav.
참조 항목 교환 효과.
반복 [계산 (1)]
전체 오디오 반복 계산 몇 번 또는 한 번 계산 주어지지 않습니다. 필요
반복할 오디오를 저장할 임시 파일 공간. XNUMX회 반복하니 참고하세요
원본 오디오와 반복 오디오의 두 가지 복사본을 생성합니다.
리버브 [-w|--습식 전용] [잔향 (50%) [HF 감쇠 (50의 %)
[방 규모 (100%) [스테레오 깊이 (100의 %)
[사전 지연 (0ms) [습식 이득 (0dB)]]]]]]
'freeverb' 알고리즘을 사용하여 오디오에 잔향을 추가합니다. 잔향
효과는 때때로 너무 작거나 포함된 콘서트 홀에 바람직합니다.
많은 사람들은 홀의 자연스러운 잔향이 감소합니다. 작은 적용
(드라이) 모노 신호에 대한 스테레오 리버브의 양은 일반적으로 더 많은 소리를 냅니다.
자연스러운. 잔향에 대한 자세한 설명은 [3]을 참조하십시오.
이 효과는 오디오의 볼륨과 길이를 모두 증가시켜
이러한 도메인에서 클리핑을 방지하기 위해 일반적인 호출은 다음과 같습니다.
dry.wav 게인 재생 -3 패드 0 3 리버브
The -w 옵션은 'wet' 신호만 선택하도록 주어질 수 있습니다.
'dry' 신호와 별도로 추가 처리됩니다. 예
play -m voice.wav "|sox voice.wav -p 리버스 리버브 -w 리버스"
리버브 리버브 효과를 위해.
역
오디오를 완전히 뒤집습니다. 오디오를 저장할 임시 파일 공간이 필요합니다.
역전되다.
리아 RIAA 비닐 재생 이퀄라이제이션을 적용합니다. 샘플링 속도는 다음 중 하나여야 합니다. 44.1,
48, 88.2, 96kHz.
이 효과는 --구성 글로벌 옵션.
침묵 [-l] 위 기간 [지속 임계값[d|%]
[기간 이하 지속 임계값[d|%]]
오디오의 시작, 중간 또는 끝에서 무음을 제거합니다. '침묵'은
지정된 임계값에 의해 결정됩니다.
The 위 기간 값은 오디오를 다음에서 트리밍해야 하는지 여부를 나타내는 데 사용됩니다
오디오의 시작. 값이 XNUMX이면 무음이 제거되어야 함을 나타냅니다.
시작. XNUMX이 아닌 값을 지정할 때 위 기간, 다음까지 오디오를 트리밍합니다.
그것은 침묵을 찾습니다. 일반적으로 오디오 시작 부분에서 무음을 트리밍할 때
위 기간 1이지만 모든 오디오를 다듬기 위해 더 높은 값으로 늘릴 수 있습니다.
특정 횟수의 무음 기간까지. 예를 들어 오디오가 있는 경우
노래 전에 각각 2초의 침묵이 포함된 XNUMX개의 노래가 있는 파일,
지정할 수 있습니다 위 기간 무음 기간과 첫 번째 기간을 모두 제거하려면 2의
노래.
인셀덤 공식 판매점인 위 기간 가 XNUMX이 아니면 다음도 지정해야 합니다. 지속 그리고 임계값.
런닝타임 그 전에 무음이 감지되어야 하는 시간의 양을 나타냅니다.
오디오 트리밍을 중지합니다. 지속 시간을 늘리면 노이즈 버스트가 다음과 같이 처리될 수 있습니다.
침묵하고 잘렸다.
임계값 묵음으로 처리해야 하는 샘플 값을 나타내는 데 사용됩니다. 을위한
디지털 오디오의 경우 값 0은 괜찮을 수 있지만 아날로그에서 녹음된 오디오의 경우
배경 소음을 고려하여 값을 늘리고 싶습니다.
선택적으로 오디오 끝에서 무음을 트리밍할 때 다음을 지정합니다. 이하-
미문 세다. 이 경우, 기간 이하 묵음 후에 모든 오디오를 제거하는 것을 의미합니다
감지됩니다. 일반적으로 이 값은 1이지만 건너뛰기 위해 늘릴 수 있습니다.
원하는 침묵의 기간 동안. 예를 들어 2가 포함된 노래가 있는 경우
중간에 2초 동안 침묵하고 끝에 XNUMX초 동안 다음과 같이 설정할 수 있습니다.
마침표를 2 값으로 설정하여 오디오 중간에 묵음을 건너뜁니다.
럭셔리 기간 이하, 지속 이전에 존재해야 하는 침묵 기간을 지정합니다.
오디오는 더 이상 복사되지 않습니다. 더 긴 지속 시간을 지정하면
원하는 오디오에 남길 수 있습니다. 예를 들어, 예상되는 노래가 있는 경우
중간에 1초 침묵, 마지막에 2초 침묵, 지속시간
2초 동안 중간 침묵을 건너뛸 수 있습니다.
불행히도 오디오가 끝날 때 침묵의 길이를 알아야 합니다.
파일을 사용하여 안정적으로 침묵을 제거합니다. 해결 방법은 침묵 효과
와의 조합 역 효과. 먼저 오디오를 반대로 하면 다음을 사용할 수 있습니다.
위 기간 전면처럼 보이는 모든 오디오를 안정적으로 트리밍하려면
파일. 그런 다음 파일을 다시 뒤집어 정상으로 돌아갑니다.
파일 중간에서 묵음을 제거하려면 다음을 지정하십시오. 기간 이하 그건
부정적인. 그런 다음 이 값은 양수 값으로 처리되며 다음에도 사용됩니다.
효과가 지정된 대로 처리를 다시 시작해야 함을 나타냅니다. 위 기간,
오디오 중간에 있는 묵음 시간을 제거하는 데 적합합니다.
옵션 -l 표시 기간 이하 지속 오디오 길이는 남겨야 합니다.
각 침묵 기간이 시작될 때 그대로 유지됩니다. 예를 들어
단어 사이의 긴 일시 중지를 제거하지만 일시 중지를 완전히 제거하고 싶지는 않습니다.
The 기간 개수는 샘플 단위입니다. 런닝타임 카운트는 다음과 같은 형식일 수 있습니다.
hh:mm:ss.frac 또는 정확한 샘플 수. 임계값 숫자가 붙을 수 있습니다
과 d 값이 데시벨임을 나타내거나 % 의 백분율을 나타내기 위해
샘플 값의 최대값(0% 순수한 디지털 침묵을 지정합니다).
다음 예는 이 효과를 사용하여 녹음을 시작하는 방법을 보여줍니다.
일반적으로 `누름 사이에 발생하는 시작 시 지연을 포함하지 않습니다.
녹음 버튼'과 공연 시작:
녹화 매개 변수 파일 이름 기타 효과 침묵 1 5 2%
싱크 [-a 에|-b 베타] [-p 상|-M|-I|-L] [-t TBW|-n 탭] [주파수 HP][-주파수LP [-t TBW|-n
탭]]
sinc kaiser-windowed low-pass, high-pass, band-pass 또는 band-reject 필터 적용
신호에. NS 주파수 HP 그리고 주파수LP 매개변수는 6dB의 주파수를 제공합니다.
개별적으로 호출될 수 있는 고역 및 저역 통과 필터의 포인트, 또는
함께. 둘 다 주어지면, 주파수 HP 이하 주파수LP 대역 통과를 생성
필터, 주파수 HP 보다 큰 주파수LP 대역 제거 필터를 생성합니다. 예를 들어,
호출
3k부터
싱크 -4k
3k-4k부터
4k-3k부터
각각 고역 통과, 저역 통과, 대역 통과 및 대역 제거 필터를 만듭니다.
120dB의 기본 정지 대역 감쇠는 다음으로 무시할 수 있습니다. -a;
대안으로 kaiser-window `beta' 매개변수는 다음과 같이 직접 주어질 수 있습니다. -b.
총 밴드의 5%인 기본 전환 대역폭은 다음으로 재정의할 수 있습니다. -t
(그리고 TBW 헤르츠 단위); 또는 필터 탭의 수를 직접 지정할 수 있습니다.
과 -n.
둘 다 주파수 HP 그리고 주파수LP 주어진 다음 -t or -n 왼쪽에 주어진 옵션
주파수는 두 주파수에 모두 적용됩니다. 이 옵션 중 하나는
주파수의 권리는 다음에만 적용됩니다. 주파수LP.
The -p, -M, -I및 -L 옵션은 필터의 위상 응답을 제어합니다. 보다 율
세부 사항에 대한 효과.
이 효과는 --구성 글로벌 옵션.
스펙트로 그램 [옵션]
오디오의 스펙트로그램을 만듭니다. 오디오는 SoX를 통해 수정되지 않고 전달됩니다.
처리 체인. 이 효과는 선택 사항입니다 - 유형 sox --도움 목록을 확인하고
지원되는 효과가 포함되었는지 확인합니다.
스펙트로그램은 PNG(Portable Network Graphic) 파일로 렌더링되며 다음을 보여줍니다.
X축의 시간, Y축의 주파수, Z축의 오디오 신호 크기
중심선. Z축 값은 다음의 색상(또는 선택적으로 강도)으로 표시됩니다.
XY 평면의 픽셀. 오디오 신호에 여러 채널이 포함된 경우
채널 1(왼쪽
스테레오 오디오용 채널).
예를 들어 'my.wav'가 스테레오 파일이면
sox my.wav -n 스펙트로그램
전체 파일의 스펙트로그램은 `spectrogram.png' 파일에 생성됩니다.
더 자주, 오디오의 더 작은 부분에 대한 분석이 필요합니다. 예
과
sox my.wav -n 리믹스 2 트림 20 30 스펙트로그램
스펙트로그램은 두 번째(오른쪽) 채널의 정보만 표시하고
XNUMX초부터 시작하는 XNUMX초의 오디오.
주파수 영역의 일부, 율 효과를 사용할 수 있습니다. 예를 들어
sox my.wav -n rate 6k 스펙트로그램
최대 3kHz(샘플링 속도의 절반)의 주파수에 대한 자세한 분석 가능
인간의 청각 시스템이 가장 민감한 곳. 와 함께
sox my.wav -n 트림 0 10 스펙트로그램 -x 600 -y 200 -z 100
주어진 옵션은 스펙트로그램의 X, Y 및 Z 축의 크기를 제어합니다(여기서
이 경우 생성된 이미지의 스펙트로그램 영역은 600 x 200픽셀 크기가 됩니다.
Z축 범위는 100dB입니다). 생성된 이미지에는 축이 포함되어 있습니다.
범례 등이 있으므로 지정된 스펙트로그램 크기보다 약간 더 큽니다.
이 예에서 :
sox -n -n synth 6 tri 10k:14k 스펙트로그램 -z 100 -w 카이저
동적 범위가 높은 분석 '창'이 선택되어 가장 잘 표시됩니다.
휩쓸린 삼각파의 스펙트로그램. 비슷한 예를 보려면 다음을 추가하십시오.
설명의 '차임' 명령에 지연 효과(위):
속도 2k 스펙트로그램 -X 200 -Z -10 -w 카이저
옵션을 사용하여 모양을 제어할 수도 있습니다(색상 설정, 밝기,
대비 등) 및 스펙트로그램의 파일 이름; 예를 들어
sox my.wav -n 스펙트로그램 -m -l -o print.png
스펙트로그램은 '흑백' 프린터에서 인쇄하기에 적합하도록 생성됩니다.
옵션 :
-x NUM 스펙트로그램의 (최대) 너비(X축)를 기본값에서 변경합니다.
800픽셀 값을 100에서 200000 사이의 지정된 숫자로 변환합니다. -X
그리고 -d.
-X NUM X축 픽셀/초; 기본값은 주어진 또는
알려진 오디오 지속 시간을 X축 크기로, 그렇지 않으면 100입니다. 에 주어진 경우
~과 연계되어 -d, 이 옵션은 스펙트로그램의 너비에 영향을 줍니다.
그렇지 않으면 스펙트로그램의 지속 시간에 영향을 줍니다. NUM 1부터 가능
(낮은 시간 분해능) ~ 5000(높은 시간 분해능)
정수. SoX는 주어진 숫자를 약간 조정할 수 있습니다.
처리 양자화 이유; 그렇다면 SoX는 실제 숫자를 보고할 것입니다.
사용됨(SoX 글로벌 옵션일 때 볼 수 있음 -V 시행 중). 또한보십시오 -x 그리고
-d.
-y NUM Y축 크기를 픽셀 단위로 설정합니다(채널당). 이것은 수
스펙트로그램을 생성하는 푸리에 분석에 사용되는 주파수 '빈'.
NB 이 숫자가 XNUMX이 아닌 경우 스펙트로그램을 생성하는 것이 느릴 수 있습니다.
129의 거듭제곱보다 큽니다(예: XNUMX). 기본적으로 Y축 크기가 선택됩니다.
자동(채널 수에 따라 다름). 보다 -Y 대안을 위해
스펙트로그램 높이를 설정하는 방법.
-Y NUM 스펙트로그램의 목표 총 높이를 설정합니다. 기본값은
550픽셀. 이 옵션을 사용하면(기본적으로) SoX는 높이를 선택합니다.
XNUMX의 거듭제곱보다 XNUMX이 큰 개별 스펙트로그램 채널의 경우
실제 총 높이는 주어진 숫자에 미치지 못할 수 있습니다. 그러나 거기에
채널당 최소 높이이기도 하므로 채널이 많을 경우
수를 초과할 수 있습니다. 보다 -y 스펙트로그램을 설정하는 다른 방법
신장.
-z NUM dB의 Z축(색상) 범위, 기본값은 120입니다. 이것은 다음의 동적 범위를 설정합니다.
스펙트로그램은 -NUM dBFS ~ 0dBFS. 에 범위는 20에서 180까지입니다.
다이내믹 레인지를 줄이면 '콘트라스트'가 효과적으로 증가합니다.
스펙트로그램 디스플레이 및 그 반대의 경우도 마찬가지입니다.
-Z NUM Z축의 상한을 dBFS 단위로 설정합니다. 부정적인 NUM 효과적으로
스펙트로그램 디스플레이의 '밝기'를 증가시키며 그 반대의 경우도 마찬가지입니다.
-q NUM Z축 양자화, 즉 다른 색상의 수를 설정합니다(또는
Z축 값을 렌더링할 강도). 작은 숫자(예: 4)는
'포스터'와 같은 효과를 주어 크기 밴드를 더 쉽게 식별할 수 있습니다.
비슷한 수준. 또한 작은 숫자는 일반적으로 작은 PNG 파일을 생성합니다. NS
주어진 숫자는 Z축 범위 내에서 사용할 색상 수를 지정합니다.
범위를 벗어난 값을 나타내기 위해 두 가지 색상이 예약되어 있습니다.
-w name
창: Hann(기본값), Hamming, Bartlett, Rectangular 또는 Kaiser. NS
스펙트로그램은 이산 푸리에 변환(DFT)을 사용하여 생성됩니다.
연산. 이 알고리즘의 중요한 매개변수는
'윈도우 기능'. 기본적으로 SoX는 모두 좋은 Hann 창을 사용합니다.
라운드 주파수 해상도 및 동적 범위 속성. 더 나은
주파수 분해능(그러나 더 낮은 동적 범위), 해밍 창을 선택하십시오. ~을위한
더 높은 동적 범위(그러나 더 낮은 주파수 분해능), 카이저 선택
창문. Bartlett 및 직사각형 창도 사용할 수 있습니다.
-W NUM 창 조정 매개변수. 이것은 약간의 조정을 하는 데 사용할 수 있습니다.
카이저 창 모양. 양수(최대 XNUMX)는
동적 범위, 음수는 감소합니다.
-s DFT 창의 느슨한 겹침을 허용합니다. 이는 경우에 따라 증가할 수 있습니다.
이미지 선명도를 높이고 -x 가치는 있지만
약간의 스펙트럼 손실 비용.
-m 단색 스펙트로그램을 만듭니다(기본값은 색상).
-h 기본 색상보다 시각적으로 덜 만족스러운 고색 팔레트를 선택합니다.
색상 팔레트를 사용하면 다른 수준을 쉽게 구분할 수 있습니다.
이 옵션을 다음과 함께 사용하는 경우 -m, 결과는 하이브리드가 될 것입니다
모노크롬/컬러 팔레트.
-p NUM 색상 또는 하이브리드 팔레트에서 색상을 변경합니다. NS NUM 매개변수, 부터
1(기본값) ~ 6, 순열을 선택합니다.
-l 밝은 배경으로 '프린터 친화적' 스펙트로그램을 만듭니다(
기본값은 어두운 배경입니다).
-a 축선의 표시를 억제합니다. 도움이 되는 경우가 있습니다.
스펙트로그램 가장자리에서 인공물을 식별합니다.
-r 원시 스펙트로그램: 축 및 범례 표시를 억제합니다.
-A 대체 고정 색상 세트를 선택합니다. 에 대해서만 제공됩니다.
다른 패키지에서 생성된 스펙트로그램과의 호환성. 그것은 안된다
일반적으로 몇 가지 문제가 있기 때문에 사용됩니다.
낮은 수준의 마스킹을 초래하는 하단에서의 차별화
인공물.
-t 본문
스펙트로그램 위에 표시할 이미지 제목 - 텍스트를 설정합니다.
-c 본문
이미지 주석 설정(또는 지우기) - 아래 및 왼쪽에 표시할 텍스트
스펙트로그램.
-o 본문
스펙트로그램 출력 PNG 파일의 이름, 기본값은 'spectrogram.png'입니다.
Advnaced 옵션 :
다른 효과나 효과에 영향을 주지 않고 오디오의 작은 부분을 처리하려면
출력 신호( 손질 효과가 사용됨), 다음 옵션은
사용하십시오.
-d 지속
이 옵션은 오디오가 주어진
지속 ([[HH:]MM:]SS)는 선택한(또는 기본) X축 너비에 맞춥니다. 을위한
예,
sox input.mp3 output.wav -n 스펙트로그램 -d 1:00 통계
오디오의 첫 XNUMX분을 보여주는 스펙트로그램을 생성하는 반면,
전에, 통계 효과는 전체 오디오 신호에 적용됩니다.
참조 -X X축 해상도를 설정하는 다른 방법.
-S 시간
오디오 스트림의 지정된 지점에서 스펙트로그램을 시작합니다. 예를 들어
sox input.aiff output.wav 스펙트로그램 -S 1:00
오디오의 첫 XNUMX분을 제외한 모든 것을 보여주는 스펙트로그램을 생성합니다(
그러나 출력 파일은 전체 오디오 스트림을 수신함).
스펙트럼 데이터의 오프라인 처리를 수행하는 기능에 대해서는 다음을 참조하십시오. 스탯
효과.
속도 인자[c]
오디오 속도를 조정합니다(피치와 템포를 함께). 인자 의 비율이거나
새 속도에서 이전 속도: 1보다 크면 빨라지고, 1보다 작으면 느려지고,
또는 문자 `c'가 추가되면 센트 수(즉, a의 100분의 XNUMX
반음) 피치(및 템포)를 조정해야 하는 기준: 0보다 큼
증가, 0 미만 감소.
기술적으로 속도 효과는 샘플 속도 정보만 변경하고
샘플 자체를 손대지 않았습니다. NS 율 리샘플링을 위해 효과가 자동으로 호출됩니다.
기본 품질/속도를 사용하여 출력 샘플 레이트로 변경합니다. 더 높은 품질을 위해 또는
고속 리샘플링, 속도 효과, 지정 율 효과
원하는 품질 옵션으로
참조 항목 굽히다, 피치및 속도 효과.
접착 [-h|-t|-q] { 위치[,초과[,여지]] }
오디오 섹션을 함께 연결합니다. 이 효과는 단순한 오디오에 두 가지를 제공합니다.
연결: (보통 짧은) 크로스 페이드가 조인에 적용되고 웨이브가
유사성 비교는 만들 수 있는 가장 좋은 위치를 결정하는 데 도움이 됩니다.
어울리다.
옵션 중 하나 -h, -t및 -q 페이드 엔벨로프를 절반으로 선택하도록 주어질 수 있습니다.
코사인파(기본값), 삼각형(일명 선형) 또는 XNUMX/XNUMX 코사인파
각각.
타입 오디오 자취를 감추다 수평 전학
t 상관 상수 이득 갑작스러운
h 상관 상수 이득 평활
q 비상관 정력 평활
접합을 수행하려면 먼저 손질 효과를 사용하여 오디오 섹션을 선택합니다.
함께 합류했습니다. 테이프 접합을 할 때와 같이, 할 단면의 끝은
접합된 부분은 작게 잘라야 합니다. 초과 (기본값 0.005초) 오디오
이상적인 합류 지점 이후. 연결할 오디오 섹션의 시작 부분
똑같이 다듬어야 한다 초과 (이상적인 결합 지점 앞), 플러스
추가 여지 (기본값 0.005초). 그런 다음 두 가지를 사용하여 SoX를 호출해야 합니다.
오디오 섹션을 입력 파일로 사용하고 접착 의 위치에 주어진 효과
연결을 수행할 대상 - 이것은 첫 번째 오디오 섹션의 길이입니다(
초과).
다음 다이어그램은 연결 작업을 설명하기 위해 테이프 비유를 사용합니다.
이 효과는 대각선 절단을 시뮬레이션하고 두 조각을 결합합니다.
길이1 초과
-----------><--->
_________ : : _________________
\ : : :\ `
\ : : : \`
\: : : \`
* : : * - - *
\ : : :\ `
\ : : : \`
_______________\: : : \__`____
: : : :
<---> <----->
과도한 여유
여기서 *는 결합 지점을 나타냅니다.
예를 들어, 긴 노래는 시작하는 두 구절로 시작합니다(예:
를 사용하여 놀이 명령 손질 (스타트) 효과) 시간 0:30.125 및
1:03.432. 다음 명령은 첫 번째 구절을 잘라냅니다.
sox too-long.wav part1.wav 트림 0 30.130
(5절 시작 후 XNUMXms 초과)
sox too-long.wav part2.wav 트림 1:03.422
(5ms 초과 + 5ms 여유, 두 번째 구절이 시작되기 전)
sox part1.wav part2.wav just-right.wav 스플라이스 30.130
다른 예로 SoX 명령
재생 "|sox -n -p 신디사이저 1 죄 %1" "|sox -n -p 신디사이저 1 죄 %3"
두 개의 음을 생성하고 재생하지만 전환 시 불쾌한 클릭이 있습니다. NS
오디오를 연결하는 대신 연결하여 클릭을 제거할 수 있습니다.
첨부 접착 1 명령에. (오디오의 시작과 끝에서 클릭
에 의해 제거될 수 있습니다 선행 스플라이스 효과 페이드 q . 01 2 . 01).
산술이 충분히 좋다면 다음을 사용하여 여러 스플라이스를 수행할 수 있습니다.
단일 접착 기도. 예를 들어:
#!/ 빈 / SH
# 오디오 복사 및 붙여넣기
# acpo infile 복사 시작 복사 중지 붙여넣기 시작 출력 파일 시작
# 모든 시간은 샘플로 측정되었습니다.
rate=`oxi -r "$1"`
e=`expr $rate '*' 5 / 1000` # 기본 초과분 사용
l=$e # 및 여유.
sox "$1" piece.wav 트림 `expr $2 - $e - $l`s
`expr $3 - $2 + $e + $l + $e`
sox "$1" part1.wav 트림 0 `expr $4 + $e`
sox "$1" part2.wav 트림 `expr $4 + $3 - $2 - $e - $l`
sox part1.wav piece.wav part2.wav "$5" 스플라이스
`expr $4 + $e`
`expr $4 + $e + $3 - $2 + $e + $l + $e`
위의 Bourne 쉘 스크립트에서 오디오를 '복사 및 붙여넣기'하는 데 두 개의 스플라이스가 사용됩니다.
* * *
이 효과를 사용하여 일반적인 크로스 페이드를 수행하는 것도 가능합니다.
두 곡. 이 경우, 초과 일반적으로 초 단위입니다. -q
옵션은 일반적으로 제공되며('동일한 전력' 크로스 페이드를 선택하기 위해) 여지
XNUMX이어야 합니다. -q 주어진다). 예를 들어 f1.wav 및
f2.wav는 크로스 페이드할 오디오 파일입니다.
sox f1.wav f2.wav out.wav 스플라이스 -q $(soxi -D f1.wav),3
동일한 음량의 지점이 종료 3초 전인 파일을 교차 페이드합니다.
f1.wav의, 즉 크로스 페이드의 총 길이는 2 × 3 = 6초입니다(참고:
$(...) 표기법은 POSIX 셸입니다).
스탯 [-s 규모] [-RMS] [-주파수] [-v] [-d]
오디오에 대한 시간 및 주파수 도메인 통계 정보를 표시합니다. 오디오
SoX 처리 체인을 통해 수정되지 않은 상태로 전달됩니다.
정보는 '표준 오류'(stderr) 스트림으로 출력되며 다음과 같습니다.
계산된 곳 n 샘플의 오디오 지속 시간, c 수입니다
오디오 채널, r 는 오디오 샘플 레이트이며, xk PCM 값을 나타냅니다(
다음과 같이 오디오의 각 연속 샘플의 범위 -1 ~ +1 기본):
견본 읽기 n×c
길이 (초) n÷r
스케일 by 아래 -를 참조하십시오.
최고 진폭 최대(xk) 최대 샘플 값
오디오에서; 대개
이것은 긍정적일 것이다
수.
최저한의 진폭 분(xk) 최소 샘플 값
오디오에서; 대개
이것은 부정적인 것입니다
수.
미드 라인 진폭 ½분(xk)+½최대(xk)
Mean 표준 ¹/nΣ│xk│ 평균
각각의 절대값
오디오의 샘플입니다.
Mean 진폭 ¹/nΣxk 각각의 평균
오디오의 샘플입니다. 만약에
이 수치는 XNUMX이 아닙니다.
그런 다음 나타냅니다
DC의 존재
오프셋(
를 사용하여 제거
dcshift 효과).
RMS 진폭 √(¹/nΣxk²) DC 수준
신호
와 같은 힘
오디오의 평균 전력.
최고 델타 최대(│xk-xk-1│)
최저한의 델타 분(│xk-xk-1│)
Mean 델타 ¹/n-1Σ│xk-xk-1│
RMS 델타 √(1/n-XNUMXΣ(xk-xk-1)²)
거칠게 주파수 Hz 단위.
음량 조정 에 대한 매개변수 권
만드는 효과
오디오만큼 큰 소리
없이 가능
깎는. 참고:
토론 클리핑
위의 이유에 대해
좋은 생각은 거의 없다
실제로 이것을 하기 위해.
델타 측정은 다중 채널 오디오에 적용할 수 없습니다.
The -s 옵션을 사용하여 주어진 요소로 입력 데이터를 확장할 수 있습니다. 기본값
의 가치 규모 2147483647(즉, 32비트 부호 있는 정수의 최대값)입니다.
내부 효과는 항상 서명된 긴 PCM 데이터와 함께 작동하므로 값은 다음과 같아야 합니다.
이 사실과 관련이 있습니다.
The -RMS 옵션은 모든 출력 평균 값을 '제곱 평균 제곱근'으로 변환합니다.
형식입니다.
The -v 옵션은 '볼륨 조정' 값만 표시합니다.
The -주파수 옵션은 대신 입력의 전력 스펙트럼(4096 포인트 DFT)을 계산합니다.
위에 나열된 통계. 단일 채널 오디오에만 사용해야 합니다.
파일.
The -d 이 옵션은 SoX의 32비트 서명된 PCM 데이터 오디오의 XNUMX진 덤프를 표시합니다.
내부 버퍼. 이것은 주로 다음과 같은 엔디안 문제를 추적하는 데 사용됩니다.
때때로 SoX의 플랫폼 간 버전에서 발생합니다.
참조 항목 통계 효과.
통계 [-b 비트|-x 비트|-s 규모] [-w 창 시간]
오디오 채널에 대한 시간 도메인 통계 정보를 표시합니다. 오디오는
SoX 처리 체인을 통해 수정되지 않은 상태로 전달됩니다. 통계가 계산되고
각 오디오 채널에 대해 표시되며 해당되는 경우 전체 수치도 표시됩니다.
주어진.
예를 들어 잘 마스터된 일반적인 스테레오 음악 파일의 경우:
전체 왼쪽 오른쪽
DC 오프셋 0.000803 -0.000391 0.000803
최소 수준 -0.750977 -0.750977 -0.653412
최대 레벨 0.708801 0.708801 0.653534
Pk 레벨 dB -2.49 -2.49 -3.69
RMS 레벨 dB -19.41 -19.13 -19.71
RMS 피크 dB -13.82 -13.82 -14.38
RMS TrdB -85.25 -85.25 -82.66
파고율 - 6.79 6.32
평면 계수 0.00 0.00 0.00
패키지 수 2 2 2
비트 깊이 16/16 16/16 16/16
샘플 수 7.72M
길이 s 174.973
스케일 최대 1.000000
윈도우 0.050
DC 오프셋, Min 수평및 Max 수평 기본적으로 ±1 범위에서 표시됩니다. 만약
-b (비트) 옵션이 주어지면 이 세 가지 측정값이 다음으로 조정됩니다.
주어진 비트 수의 부호 있는 정수. 예를 들어 16비트의 경우 스케일
-32768 ~ +32767입니다. NS -x 옵션은 다음과 같은 방식으로 작동합니다. -b 그 외에는
부호 있는 정수 값은 XNUMX진수로 표시됩니다. NS -s 옵션은
주어진 부동 소수점 숫자로 세 번 측정합니다.
Pk 레프 dB 그리고 RMS 레프 dB dBFS로 측정된 표준 피크 및 RMS 레벨입니다.
RMS Pk dB 그리고 RMS Tr dB 는 RMS 수준에 대한 최고 및 최저 값입니다.
짧은 창(기본값 50ms).
문장 인자 는 피크 대 RMS 레벨의 표준 비율입니다(참고: dB가 아님).
평면 인자 는 평탄도의 척도입니다(즉, 동일한
피크 레벨에서 신호의 값)(즉, Min 수평및 Max 수평).
Pk 계산 신호가 발생하는 경우의 수(샘플 수가 아님)입니다.
어느 쪽이든 달성 Min 수평및 Max 수평.
오른손 비트 심도 그림은 비트 깊이 즉 비트의 표준 정의입니다.
주어진 숫자보다 덜 중요한 것은 XNUMX으로 고정됩니다. 왼쪽 그림은
XNUMX(또는 음의 경우 XNUMX)으로 고정된 최상위 비트 수
숫자) 오른쪽 숫자에서 빼기(빼기된 숫자는 바로
관련 Pk 레프 dB).
다중 채널 오디오의 경우 위의 각 측정에 대한 전체 수치는 다음과 같습니다.
다음과 같이 채널 수치에서 제공 및 파생됩니다. DC 오프셋: 최대
크기; Max 수평, Pk 레프 dB, RMS Pk dB, 비트 심도: 최대; Min 수평,
RMS Tr dB: 최소; RMS 레프 dB, 평면 인자, Pk 계산: 평균; 문장 인자: 아닙니다
응용할 수 있는.
길이 s 는 오디오의 지속 시간(초)이며, 에 샘플 다음과 같다
샘플 속도 곱하기 길이. 규모 Max 첫 번째에 적용된 스케일링입니다.
세 가지 측정; 특히 적용할 수 있는 최대값입니다.
Max 수평. 창 s 최고 및 최저 RMS에 사용되는 창의 길이입니다.
측정.
참조 항목 스탯 효과.
교환 스테레오 채널을 바꿉니다. 또한보십시오 리믹스 임의의 채널을 허용하는 효과를 위해
선택 및 주문(및 혼합).
뻗다 인자 [창 페이드 변화 페이딩]
오디오 지속 시간을 변경합니다(음높이는 변경하지 않음). 이 효과는 대체로 동등합니다.
부터 속도 (인자 거꾸로) 수색 XNUMX으로 설정하므로 일반적으로
그 결과는 비교적 열악하다. 때때로 성능을 능가할 수 있으므로 유지됩니다.
속도 작은 용 인자s.
인자 스트레칭: >1 연장, <1 지속 시간 단축. 창 크기는 ms입니다.
기본값은 20ms입니다. NS 페이드 옵션은 'lin'일 수 있습니다. 변화 비율, [0 1]. 기본
스트레치 팩터에 따라 다릅니다. 1은 단축, 0.8은 연장. NS 페이딩 비율, [0]
0.5]. 페이드의 기본값은 다음에 따라 다릅니다. 인자 그리고 변화.
참조 항목 속도 효과.
신스 [-j KEY] [-n] [렌 [오프 [ph [p1 [p2 [p3]]]]]] {[유형] [결합]
[[%]주파수[k][:|+|/|-[%]주파수2[k]]] [오프 [ph [p1 [p2 [p3]]]]]}
이 효과는 고정 또는 스위프 주파수 오디오 톤을 생성하는 데 사용할 수 있습니다.
다양한 파형을 생성하거나 다양한 '색상'의 광대역 노이즈를 생성합니다. 다수의
신디사이저 효과를 계단식으로 연결하여 더 복잡한 파형을 생성할 수 있습니다. 각 단계에서
생성된 파형을 혼합할지 여부를 선택할 수 있습니다.
이전 단계의 출력으로 변조됩니다. 각 채널의 오디오
다중 채널 오디오 파일은 독립적으로 합성될 수 있습니다.
이 효과는 오디오를 생성하는 데 사용되지만 입력 파일은 여전히 제공되어야 합니다.
합성 오디오 길이를 설정하는 데 사용되는 특성,
채널 수 및 샘플링 속도; 그러나 입력 파일의 오디오는
일반적으로 필요하지 않은 `null 파일'(특수 이름 -n)가 자주 주어집니다.
대신(그리고 매개변수로 지정된 길이 신스 또는 다른 주어진
연관된 길이를 가질 수 있는 효과).
예를 들어 다음은 다음을 포함하는 3초, 48kHz 오디오 파일을 생성합니다.
300 ~ 3300Hz의 사인파 스위프:
sox -n output.wav 신디사이저 3 사인 300-3300
그러면 8kHz 버전이 생성됩니다.
sox -r 8000 -n output.wav 신디사이저 3 사인 300-3300
표시된 매개변수 세트를 지정하여 여러 채널을 합성할 수 있습니다.
중괄호 사이에 여러 번; 다음은 왼쪽에 스윕 톤을 넣습니다.
채널을 만들고 오른쪽에 '갈색' 노이즈를 추가합니다.
sox -n output.wav 신디사이저 3 사인 300-3300 브라운노이즈
다음 예는 두 가지 신디사이저 효과를 계단식으로 연결하여 더 많은 것을 만드는 방법을 보여줍니다.
복잡한 파형:
플레이 -n 신디사이저 0.5 사인 200-500 신디사이저 0.5 사인 fmod 700-100
빈도는 '과학적' 표기법으로 지정하거나 '%'를 접두사로 사용하여 지정할 수도 있습니다.
문자를 '중간 A'(440Hz)에 상대적인 반음 수로 표시합니다. 예를 들어,
다음은 기타의 낮은 'E' 스트링을 튜닝하는 데 사용할 수 있습니다.
플레이 -n 신디사이저 4 뽑기 %-29
또는 (Bourne shell) 루프를 사용하여 기타 전체:
E2 A2 D3 G3 B3 E4의 n에 대해; ~하다
play -n 신디사이저 4 뽑기 $n 반복 2; 완료
을 참조 지연 효과(위) 및 `SoX 스크립팅 예제'에 대한 참조(아래)
자세한 신스 예.
NB 이 효과는 최대 볼륨(0dBFS)에서 오디오를 생성합니다.
이후에 오디오를 사용할 때 클리핑 가능성이 높으므로 많은 경우
당신은 이 효과를 따르고 싶을 것입니다 이득 이를 방지하는 효과
사고. (또한보십시오 클리핑 위.) 기본적으로 신스 효과
의 기능을 통합합니다. 이득 -h (참조 이득 자세한 내용은 효과);
신스's -n 이 동작을 비활성화하는 옵션이 제공될 수 있습니다.
각각에 대한 자세한 설명 신스 매개변수는 다음과 같습니다.
렌 시간 또는 숫자로 표현되는 합성할 오디오의 길이입니다.
시료; 0=입력 길이, 기본값=0.
시간의 길이를 지정하는 형식은 hh:mm:ss.frac입니다. 형식
샘플 수를 지정하는 것은 문자 `'가 추가된 샘플 수입니다.
그것.
유형 사인, 사각, 삼각형, 톱니, 사다리꼴, exp, [백색]노이즈,
tpdfnoise 핑크노이즈, 브라운노이즈, 뽑기; 기본값 = 사인.
결합 create, mix, amod(진폭 변조), fmod(주파수
조정); 기본값 = 생성.
주파수/주파수2 Hz 단위의 합성 시작/종료 주파수 또는 다음과 같은 경우
앞에 '%'가 붙고 A(440Hz)를 기준으로 반음; 또는 '과학적'
참고 표기법(예: E2)을 사용할 수 있습니다. 기본 주파수는 440Hz입니다. 기본적으로,
음표와 함께 사용되는 튜닝은 '동음 평균율'입니다. NS -j KEY option
'저스트 억양'을 선택합니다. 여기서 KEY 에 상대적인 반음의 정수입니다.
A(예: -9 또는 3은 C의 키를 선택함) 또는 과학 표기법의 음표입니다.
If 주파수2 주어진 다음 렌 또한 제공되어야 하며 생성된 톤은
주어진 주파수 사이에서 스위프됩니다. 주어진 두 주파수는 다음과 같아야 합니다.
`:', `+', `/' 또는 `-' 문자 중 하나로 구분됩니다. 이 문자가 사용됩니다.
다음과 같이 스위프 기능을 지정하려면:
: 선형: 톤이 초당 고정된 수의 헤르츠만큼 변경됩니다.
+ Square: XNUMX차 함수는 톤을 변경하는 데 사용됩니다.
/ 지수: 톤은 초당 고정된 수의 반음만큼 변경됩니다.
- 지수: '/'이지만 초기 위상은 항상 XNUMX이고 계단식(더 작음
부드러운) 주파수 변경.
소음에는 사용하지 않습니다.
오프 신호의 바이어스(DC 오프셋)는 백분율로 표시됩니다. 기본값은 0입니다.
ph 는 1주기의 백분율로 표시된 위상 변이입니다. 기본값은 0입니다. 소음에는 사용하지 않습니다.
p1 '켜짐'(정사각형) 또는 '상승'(삼각형,
특급, 사다리꼴); 기본값=50(정사각형, 삼각형, exp), 기본값=10(사다리꼴) 또는
유지(뽑다); 기본값은 40입니다.
p2 (사다리꼴): '떨어짐'이 시작되는 각 주기의 백분율.
기본값은 50입니다. exp: 2dB의 배수의 진폭; 기본값=50 또는 톤-1(뽑기);
기본값은 20입니다.
p3 (사다리꼴): '하락'이 끝나는 각 주기의 백분율.
기본값=60 또는 톤-2(뽑기); 기본값은 90입니다.
속도 [-q] [-m|-s|-l] 인자 [분절 [수색 [중첩하다]]]
오디오 재생 속도는 변경하지만 피치는 변경하지 마십시오. 이 효과는 WSOLA를 사용합니다.
연산. 오디오는 세그먼트로 잘린 다음 시간에 따라 이동됩니다.
도메인 및 파형이 가장 많이 나타나는 지점에서 중첩(크로스 페이드)
'최소 제곱' 측정에 의해 결정된 것과 유사합니다.
기본적으로 선형 검색은 최상의 겹치는 점을 찾는 데 사용됩니다. 만약
optional -q 매개변수가 주어지면 트리 검색이 대신 사용됩니다. 이것은 만든다
효과가 더 빨리 작동하지만 결과가 좋지 않을 수 있습니다. 그러나 만약 당신이
처리 속도를 개선해야 하므로 일반적으로 음질이 덜 저하됩니다.
검색 또는 중복 값을 줄이는 것보다
The -m 옵션은 세그먼트, 검색 및 겹침의 기본값을 최적화하는 데 사용됩니다.
음악 처리.
The -s 옵션은 세그먼트, 검색 및 겹침의 기본값을 최적화하는 데 사용됩니다.
음성 처리.
The -l 옵션은 세그먼트, 검색 및 겹침의 기본값을 최적화하는 데 사용됩니다.
더 눈에 띄는 왜곡을 일으키는 경향이 있지만 '선형' 처리
factor가 1에 가까울 때 유용합니다.
-m, -s 또는 -l이 지정되면 세그먼트의 기본값이 계산됩니다.
요소를 기반으로 하는 반면 기본 검색 및 겹침 값은 세그먼트를 기반으로 합니다. 어느
제공한 값은 여전히 이러한 기본값을 재정의합니다.
인자 이전 템포에 대한 새 템포의 비율을 제공하므로 예를 들어 1.1은 속도를 높입니다.
템포는 10%, 0.9는 10% 느려집니다.
선택적 분절 매개변수는 알고리즘의 세그먼트 크기를 선택합니다.
밀리초. 다른 플래그가 지정되지 않은 경우 기본값은 82이며 다음과 같습니다.
일반적으로 음악의 템포를 약간 변경하는 데 적합합니다. 더 큰 변화의 경우
(예: 2의 인수), 41ms가 더 나은 결과를 줄 수 있습니다. -m, -s 및 -l 플래그
요소에 따라 세그먼트 기본값이 자동으로 조정됩니다. 을위한
1.25의 템포와 함께 -s(음성용)를 사용하는 예는 기본 세그먼트를 계산합니다.
32의 값
선택적 수색 매개변수는 오디오 길이를 밀리초 단위로 제공합니다.
알고리즘은 겹치는 점을 검색합니다. 다른 플래그가 지정되지 않은 경우
기본값은 14.68입니다. 값이 클수록 처리 시간이 더 오래 걸리고 그렇지 않을 수도 있습니다.
더 나은 결과를 생성합니다. 실제 최대값은 세그먼트 값의 절반입니다. 찾다
출력 품질을 저하시킬 위험이 있는 처리 시간을 줄이기 위해 줄일 수 있습니다. NS
-m, -s 및 -l 플래그를 사용하면 검색 기본값이 자동으로 조정됩니다.
세그먼트를 기반으로 합니다.
선택적 중첩하다 매개변수는 세그먼트 겹침 길이를 밀리초 단위로 제공합니다.
기본값은 12이지만 -m, -s 또는 -l 플래그는 다음을 기반으로 겹침을 자동으로 조정합니다.
세그먼트 크기. 겹침을 늘리면 처리 시간이 늘어나고 증가할 수 있습니다.
품질. 겹침에 대한 실제 최대값은 겹침이 있는 검색 값입니다.
일반적으로 (적어도) 검색보다 약간 작습니다.
참조 속도 템포와 피치를 함께 변경하는 효과의 경우 피치 그리고 굽히다
피치만 변경하는 효과의 경우 뻗다 템포를 변경하는 효과를 위해
다른 알고리즘을 사용합니다.
삼배 이득 [주파수[k] [폭[s|h|k|o|q]]]
고음 톤 조절 효과를 적용합니다. 에 대한 설명을 참조하십시오. 베이스 에 대한 효과
세부.
트레몰로 속도 [깊이]
오디오에 트레몰로(저주파수 진폭 변조) 효과를 적용합니다. NS
Hz의 트레몰로 주파수는 다음과 같이 지정됩니다. 속도, 그리고 깊이를 백분율로 나타낸 것입니다. 깊이
(기본값 40).
손질 {[=|-]위치}
오디오에서 일부를 잘라냅니다. 임의의 수 위치s가 주어질 수 있습니다. 오디오가 아닙니다
첫 번째 때까지 출력으로 전송 위치 도달했습니다. 그런 다음 효과가 번갈아 나타납니다.
각각의 오디오 복사와 폐기 사이 위치.
경우 위치 등호 또는 빼기 기호가 앞에 오면 다음을 기준으로 해석됩니다.
각각 오디오의 시작 또는 끝. (오디오 길이는
최종 상대 위치가 작동하는 것으로 알려져 있습니다.) 그렇지 않으면 오프셋으로 간주됩니다.
마지막부터 위치, 또는 첫 번째 매개변수의 오디오 시작 부분에서. 사용
첫 번째 값은 0 위치 매개변수는 시작 부분부터 복사를 허용합니다.
오디오.
모든 매개변수는 시간 또는 정확한 횟수를 사용하여 지정할 수 있습니다.
시료. 시간의 길이를 지정하는 형식은 hh:mm:ss.frac입니다. 값
첫 번째 매개변수의 경우 1:30.5는 1분 XNUMX초 XNUMX초까지 시작되지 않습니다.
오디오에. 샘플 수를 지정하는 형식은 샘플 수입니다.
''라는 문자가 추가되었습니다. 첫 번째 매개변수의 값은 8000초입니다.
오디오 처리를 시작하기 전에 8000개의 샘플을 읽을 때까지 기다리십시오.
예를 들어,
삭스 인파일 아웃파일 트림 0 10
처음 XNUMX초는 복사하지만
인파일 트림 재생 12:34 =15:00 -2:00
12분 34초부터 오디오까지 최대 15분까지 재생됩니다.
(즉, 2분 26초 길이), 다음 XNUMX분 전에 재생을 재개합니다.
오디오 끝.
업샘플링 [인자]
정수 인수로 신호를 업샘플링합니다. 인자-1개의 XNUMX값 샘플이 삽입됩니다.
입력 샘플의 각 쌍 사이. 결과적으로 원래 스펙트럼은
새로운 주파수 공간(앨리어싱)으로 복제되고 감쇠됩니다. 이것
을 추가하여 감쇠를 보상할 수 있습니다. 권 인자 더 이상
처리. 업샘플 효과는 일반적으로 필터링과 함께 사용됩니다.
효과.
앤티앨리어싱을 사용한 일반적인 리샘플링 효과는 다음을 참조하십시오. 율. 또한보십시오 다운샘플링.
으로 [옵션]
음성 활동 감지기. 무음과 조용한 배경 소리를 줄이려고 시도합니다.
(상당히 고해상도 즉 16비트, 44-48kHz) 음성 녹음의 끝.
알고리즘은 현재 음성을 감지하기 위해 간단한 cepstral power 측정을 사용합니다.
그래서 다른 것들, 특히 음악에 속을 수 있습니다. 효과는 다음에서만 트리밍할 수 있습니다.
오디오의 전면에 있으므로 후면에서 트리밍하려면 역 효과는 반드시
도 사용됩니다. 예
Speech.wav 표준 Vad 재생
앞쪽에서 다듬기,
Speech.wav 노멀 리버스 VAD 리버스 플레이
뒤에서 자르기 위해, 그리고
Speech.wav 노멀 VAD 리버스 VAD 리버스 플레이
양쪽 끝에서 자르기. 사용 표준 효과가 권장되지만 기억하십시오.
그것도 역 ...도 아니다 표준 스트리밍 오디오와 함께 사용하기에 적합합니다.
옵션 :
기본값은 괄호 안에 표시됩니다.
-t NUM (7)
활동 감지를 트리거하는 데 사용되는 측정 수준입니다. 이것은 필요할 수 있습니다
노이즈 레벨, 신호 레벨 및 기타
입력 오디오의 특성.
-T NUM (0.25)
짧은 소리의 버스트를 무시하는 데 사용되는 시간 상수(초)입니다.
-s NUM (1)
더 조용하고 짧은 버스트를 검색하기 위한 오디오의 양(초)
감지된 트리거 지점 이전에 포함할 오디오.
-g NUM (0.25)
포함할 더 조용하고 짧은 오디오 버스트 사이의 허용된 간격(초)
감지된 트리거 포인트 이전에
-p NUM (0)
트리거 포인트 이전에 보존할 오디오의 양(초) 및
더 조용하거나 짧은 버스트가 발견되었습니다.
Advnaced 옵션 :
이를 통해 알고리즘의 내부 매개변수를 미세 조정할 수 있습니다.
-b NUM 알고리즘(내부적으로)은 적응형 잡음 추정/감소를 순서대로 사용합니다.
원하는 오디오의 시작을 감지합니다. 이 옵션은 시간을 설정합니다.
초기 소음 추정.
-N NUM 잡음 레벨이 다음과 같은 경우 적응형 잡음 추정기가 사용하는 시간 상수
증가하고있다.
-n NUM 잡음 레벨이 다음과 같은 경우 적응형 잡음 추정기가 사용하는 시간 상수
감소하고 있습니다.
-r NUM 감지 알고리즘에 사용할 노이즈 감소량(예: 0, 0.5,
...).
-f NUM 알고리즘의 처리/측정 빈도입니다.
-m NUM 측정 기간; 기본적으로 측정 기간의 두 배입니다. 즉
중복.
-M NUM 스펙트럼 측정을 평활화하는 데 사용되는 시간 상수입니다.
-h NUM 입력에 적용된 고역 통과 필터의 '벽돌' 주파수
검출기 알고리즘.
-l NUM 입력에 적용된 저역 통과 필터의 '벽돌' 주파수
검출기 알고리즘.
-H NUM 검출기 알고리즘에 사용되는 고역 통과 리프터의 '벽돌' 주파수.
-L NUM 검출기 알고리즘에 사용된 저역 통과 리프터의 '벽돌' 주파수.
참조 항목 침묵 효과.
권 이득 [유형 [리미터게인]]
오디오 신호에 증폭 또는 감쇠를 적용합니다. 달리 -v option
(SoX 효과를 입력할 때 여러 입력 파일의 균형을 조정하는 데 사용됩니다.
처리 체인), 권 다른 어떤 것과 마찬가지로 효과이므로 어디에나 적용할 수 있으며,
필요한 경우 처리 체인 동안 여러 번.
볼륨을 변경하는 양은 다음과 같이 지정됩니다. 이득 에 따라 해석된다.
주어진 유형, 다음과 같이: 만약 유형 is 진폭 (또는 생략), 다음 이득 는 Teledyne LeCroy 오실로스코프 및 LSA-XNUMX 시리즈 임베디드 신호 분석기가
진폭(즉, 전압 또는 선형) 비율, 힘, 그 다음 전력(예: 와트 또는
전압 제곱) 비율, 그리고 만약 dB, dB 단위의 전력 변화.
인셀덤 공식 판매점인 유형 is 진폭 or 힘은 이득 1이면 볼륨이 변경되지 않고 다음보다 작습니다.
1은 감소하고 1보다 크면 증가합니다. 부정적인 이득 오디오를 반전
볼륨을 조정하는 것 외에도 신호.
인셀덤 공식 판매점인 유형 is dB은 이득 0이면 볼륨이 변경되지 않고 0보다 작으면 볼륨이 감소합니다.
0보다 크면 증가합니다.
전기(및 오디오 신호) 전압에 대한 자세한 설명은 [4]를 참조하십시오.
그리고 전력 비율.
조심하십시오 클리핑 볼륨을 높일 때.
The 이득 그리고 유형 원하는 경우 매개변수를 연결할 수 있습니다. 예: 권 10dB.
선택 사항 리미터게인 값을 지정할 수 있으며 다음보다 훨씬 작은 값이어야 합니다.
1(예: 0.05 또는 0.02)이며 클리핑을 방지하기 위해 피크에서만 사용됩니다. 아니다
이 매개변수를 지정하면 리미터가 사용되지 않습니다. 상세 모드에서는 이
효과는 제한해야 하는 오디오의 백분율을 표시합니다.
참조 이득 다양한 기능으로 볼륨을 변경하는 효과를 위해, 컴팬드
동적 범위 압축/확장/제한 효과를 위해.
추천하지 않습니다 효과
다음 효과의 이름이 변경되었거나 해당 기능이 다른 효과에 포함되었습니다.
효과; 이 버전의 SoX에서 계속 작동하지만 나중에 제거될 수 있습니다.
믹서 [ -l|-r|-f|-b|-1|-2|-3|-4|n{,n} ]
채널을 혼합하거나 선택하여 오디오 채널 수를 줄이거나 늘리십시오.
채널을 복제하여 채널 수. 참고: 이 효과는
오디오 채널 SoX 효과 처리 체인 내에서; 혼동되어서는 안된다
와 더불어 -m 전역 옵션(여러 파일 들어가기 전에 혼합되어 있습니다.
효과 체인).
채널 수를 줄이면 다음을 사용할 수 있습니다. -l, -r, -f, -b, -1,
-2, -3, -4, 왼쪽, 오른쪽, 전면, 후면 채널만 선택하는 옵션 또는
채널을 평균화하는 대신 출력에 대한 특정 채널. NS -l및 -r
옵션은 쿼드 채널 파일에서 평균화를 수행하므로 정확한 채널을 선택하여
이것을 방지하십시오.
The 믹서 효과는 쉼표로 구분된 최대 16개의 숫자로 호출할 수도 있습니다.
각 입력 채널의 비율(0 = 0% 및 1 = 100%)을 지정합니다.
각 출력 채널에 믹스됩니다. 4채널 모드에서는 XNUMX개의 숫자가 제공됩니다. l →
l, l → r, r → l, r → r. 4채널 모드에서 처음 XNUMX개
숫자는 다음과 같이 왼쪽 전면 출력 채널의 비율을 나타냅니다. lf →
lf, rf → lf, lb → lf, rb → rf. 다음 4는 오른쪽 전면 출력을 제공합니다.
같은 순서, 그 다음 레프트 백 및 라이트 백.
16개의 숫자를 사용하여 채널 수를 늘리거나 줄일 수도 있습니다.
사용하지 않는 채널에 대해 0을 지정하십시오.
마지막으로 특정 축소된 숫자 조합은 특정 항목에 대해 지정할 수 있습니다.
입력/출력 채널 조합.
In Ch 아웃 Ch 에 매핑
2 1 2 l → l, r → l
2 2 1 밸런스 조정
4 1 4 lf → l, rf → l, lb → l, rb → l
4 2 2 lf → l&rf → r, lb → l&rb → r
4 4 1 밸런스 조정
4 4 2 프론트 밸런스, 백 밸런스
이 효과는 다음으로 대체되었습니다. 리믹스 임의의 수를 처리하는 효과
채널.
진단
종료 상태는 오류가 없으면 0, 명령줄 매개변수에 문제가 있으면 1,
또는 파일 처리 중에 오류가 발생하면 2입니다.
onworks.net 서비스를 사용하여 온라인으로 rec 사용