rec - क्लाउड में ऑनलाइन

यह कमांड आरईसी है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


SoX - साउंड ईएक्सचेंज, ऑडियो हेरफेर का स्विस आर्मी चाकू

SYNOPSIS


सॉक्स [वैश्विक विकल्प] [प्रारूप-विकल्प] infile1
[[प्रारूप-विकल्प] infile2] ... [प्रारूप-विकल्प] आउटफाइल
[प्रभाव [प्रभाव-विकल्प]] ...

प्ले [वैश्विक विकल्प] [प्रारूप-विकल्प] infile1
[[प्रारूप-विकल्प] infile2] ... [प्रारूप-विकल्प]
[प्रभाव [प्रभाव-विकल्प]] ...

ग्रामीण विद्युतीकरण निगम [वैश्विक विकल्प] [प्रारूप-विकल्प] आउटफाइल
[प्रभाव [प्रभाव-विकल्प]] ...

वर्णन


परिचय
SoX अधिकांश लोकप्रिय प्रारूपों में ऑडियो फ़ाइलों को पढ़ता और लिखता है और वैकल्पिक रूप से प्रभाव लागू कर सकता है
उन्हें। यह कई इनपुट स्रोतों को जोड़ सकता है, ऑडियो को संश्लेषित कर सकता है, और, कई प्रणालियों पर,
एक सामान्य प्रयोजन ऑडियो प्लेयर या मल्टी-ट्रैक ऑडियो रिकॉर्डर के रूप में कार्य करें। यह भी सीमित है
इनपुट को कई आउटपुट फ़ाइलों में विभाजित करने की क्षमता।

सभी SoX कार्यक्षमताएँ केवल इसका उपयोग करके उपलब्ध हैं सॉक्स आज्ञा। खेल को सरल बनाने के लिए और
ऑडियो रिकॉर्ड करना, यदि SoX को इस रूप में लागू किया गया है प्ले, आउटपुट फ़ाइल स्वचालित रूप से सेट हो जाती है
डिफ़ॉल्ट ध्वनि उपकरण, और यदि के रूप में लागू किया जाता है ग्रामीण विद्युतीकरण निगम, डिफ़ॉल्ट ध्वनि उपकरण का उपयोग इनपुट के रूप में किया जाता है
स्रोत। इसके अतिरिक्त, सोक्सी(1) कमांड ऑडियो को क्वेरी करने का एक सुविधाजनक तरीका प्रदान करता है
फ़ाइल हेडर जानकारी.

SoX का केंद्र libSoX नामक लाइब्रेरी है। जो लोग SoX का विस्तार करने या उपयोग करने में रुचि रखते हैं
इसे अन्य प्रोग्रामों में libSoX मैनुअल पेज का संदर्भ लेना चाहिए: libsox(3).

SoX एक कमांड-लाइन ऑडियो प्रोसेसिंग टूल है, जो विशेष रूप से त्वरित, सरल बनाने के लिए उपयुक्त है
संपादन और बैच प्रोसेसिंग। यदि आपको एक इंटरैक्टिव, ग्राफ़िकल ऑडियो संपादक की आवश्यकता है, तो उपयोग करें
धृष्टता(1).

* * *

समग्र SoX प्रसंस्करण श्रृंखला को निम्नानुसार संक्षेपित किया जा सकता है:

इनपुट → कंबाइनर → प्रभाव → आउटपुट

हालाँकि, ध्यान दें कि SoX कमांड लाइन पर, आउटपुट और इफेक्ट्स की स्थिति
अभी दिखाए गए तार्किक प्रवाह के अनुसार अदला-बदली की जाती है। यह भी ध्यान दें कि जबकि विकल्प संबंधित हैं
फ़ाइलों को उनके संबंधित फ़ाइल नाम से पहले रखा जाता है, प्रभावों के लिए विपरीत सच है।
यह दिखाने के लिए कि यह व्यवहार में कैसे काम करता है, यहां उदाहरणों का एक चयन दिया गया है कि SoX कैसा हो सकता है
इस्तेमाल किया गया। सामान्य
sox recital.au recital.wav
जबकि, Sun AU प्रारूप में एक ऑडियो फ़ाइल को Microsoft WAV फ़ाइल में अनुवादित करता है
sox recital.au -b 16 recital.wav चैनल 1 दर 16k फ़ेड 3 मानदंड
समान प्रारूप में अनुवाद करता है, लेकिन चार प्रभाव भी लागू करता है (डाउन-मिक्स टू वन)।
चैनल, नमूना दर परिवर्तन, फ़ेड-इन, नॉमलाइज़), और परिणाम को थोड़ी गहराई पर संग्रहीत करता है
16.
सॉक्स -आर 16के -ई हस्ताक्षरित -बी 8 -सी 1 वॉयस-मेमो.रॉ वॉयस-मेमो.वेव
`कच्चे' (उर्फ `हेडरलेस') ऑडियो को स्व-वर्णन फ़ाइल प्रारूप में परिवर्तित करता है,
सॉक्स स्लो.एआईएफएफ फिक्स्ड.एआईएफएफ स्पीड 1.027
ऑडियो गति समायोजित करता है,
सॉक्स शॉर्ट.वेव लॉन्ग.वेव लॉन्ग.वेव
दो ऑडियो फ़ाइलों को जोड़ता है, और
सॉक्स -एम म्यूजिक.एमपी3 वॉयस.वेव मिक्स्ड.फ्लैक
दो ऑडियो फाइलों को एक साथ मिलाता है।
"द मूनबीम्स/ग्रेटेस्ट/*.ओजीजी" बास +3 बजाएँ
बेस बूस्टिंग प्रभाव लागू करते हुए ऑडियो फ़ाइलों का एक संग्रह चलाता है,
प्ले -एन -सी1 सिंथ सिन %-12 सिन %-9 सिन %-5 सिन %-2 फ़ेड एच 0.1 1 0.1
पाइप-ऑर्गन ध्वनि के साथ एक संश्लेषित 'एक लघु सातवीं' राग बजाता है,
आरईसी -सी 2 रेडियो.एआईएफएफ ट्रिम 0 30:00
आधे घंटे का स्टीरियो ऑडियो रिकॉर्ड करता है, और
प्ले -क्यू टेक1.एआईएफएफ और आरईसी -एम टेक1.एआईएफएफ टेक1-डब.एआईएफएफ
(POSIX शेल के साथ और जहां हार्डवेयर द्वारा समर्थित है) मल्टी-ट्रैक में एक नया ट्रैक रिकॉर्ड करता है
रिकॉर्डिंग. आखिरकार,
आरईसी -आर 44100 -बी 16 -एस -पी साइलेंस 1 0.50 0.1% 1 10:00 0.1% |
सॉक्स -पी गाना.ओजीजी साइलेंस 1 0.50 0.1% 1 2.0 0.1% :
नईफ़ाइल: पुनरारंभ करें
एलपी/कैसेट जैसे ऑडियो की एक धारा को रिकॉर्ड करता है और कई ऑडियो फाइलों में विभाजित हो जाता है
2 सेकंड के मौन के साथ अंक। साथ ही, यह तब तक रिकॉर्डिंग शुरू नहीं करता जब तक इसका पता नहीं चल जाता
ऑडियो चल रहा है और 10 मिनट के मौन के बाद बंद हो जाता है।

NB उपरोक्त SoX की क्षमताओं का एक सिंहावलोकन मात्र है; कैसे करें इसकी विस्तृत व्याख्या
उपयोग सब SoX पैरामीटर, फ़ाइल स्वरूप और प्रभाव इस मैनुअल में नीचे पाए जा सकते हैं
soxformat(7), और में सोक्सी(1).

पट्टिका प्रारूप प्रकार
SoX 'सेल्फ-डिस्क्राइबिंग' और 'रॉ' ऑडियो फाइलों के साथ काम कर सकता है। `स्व-वर्णन' प्रारूप
(जैसे WAV, FLAC, MP3) में एक हेडर होता है जो सिग्नल और एन्कोडिंग का पूरी तरह से वर्णन करता है
ऑडियो डेटा की विशेषताएँ जो इस प्रकार हैं। 'कच्चे' या 'हेडरलेस' प्रारूप शामिल नहीं हैं
यह जानकारी, इसलिए इनकी ऑडियो विशेषताओं को SoX पर वर्णित किया जाना चाहिए
कमांड लाइन या इनपुट फ़ाइल से अनुमान लगाया गया।

ऑडियो डेटा के प्रारूप का वर्णन करने के लिए निम्नलिखित चार विशेषताओं का उपयोग किया जाता है
इसे SoX के साथ संसाधित किया जा सकता है:

नमूना दर
प्रति सेकंड नमूनों में नमूना दर ('हर्ट्ज़' या 'हर्ट्ज')। डिजिटल टेलीफोनी
परंपरागत रूप से 8000 हर्ट्ज़ (8 किलोहर्ट्ज़) की नमूना दर का उपयोग किया जाता है, हालांकि इन दिनों, 16 और यहां तक ​​कि
32 kHz अधिक सामान्य होता जा रहा है। ऑडियो कॉम्पैक्ट डिस्क 44100 Hz (44.1 kHz) का उपयोग करते हैं।
डिजिटल ऑडियो टेप और कई कंप्यूटर सिस्टम 48 kHz का उपयोग करते हैं। व्यावसायिक ऑडियो सिस्टम
अक्सर 96 किलोहर्ट्ज़ का उपयोग करें।

नमूने का आकार
प्रत्येक नमूने को संग्रहीत करने के लिए उपयोग की जाने वाली बिट्स की संख्या। आजकल, 16-बिट का आमतौर पर उपयोग किया जाता है।
कंप्यूटर ऑडियो के शुरुआती दिनों में 8-बिट लोकप्रिय था। में 24-बिट का प्रयोग किया जाता है
पेशेवर ऑडियो क्षेत्र। अन्य आकारों का भी उपयोग किया जाता है।

डेटा एन्कोडिंग
जिस तरह से प्रत्येक ऑडियो नमूने का प्रतिनिधित्व किया जाता है (या 'एन्कोडेड')। कुछ एन्कोडिंग
अलग-अलग बाइट-ऑर्डरिंग या बिट-ऑर्डरिंग वाले वेरिएंट होते हैं। कुछ संपीड़ित करते हैं
ऑडियो डेटा ताकि संग्रहीत ऑडियो डेटा कम जगह ले (यानी डिस्क स्थान या)।
ट्रांसमिशन बैंडविड्थ) अन्य प्रारूप मापदंडों और नमूनों की संख्या की तुलना में
मतलब होगा. आम तौर पर उपयोग किए जाने वाले एन्कोडिंग प्रकारों में फ़्लोटिंग-पॉइंट, μ-लॉ, ADPCM, शामिल हैं।
हस्ताक्षरित-पूर्णांक PCM, MP3, और FLAC।

चैनलों
फ़ाइल में मौजूद ऑडियो चैनलों की संख्या. एक ('मोनो') और दो
(`स्टीरियो') का व्यापक रूप से उपयोग किया जाता है। 'सराउंड साउंड' ऑडियो में आम तौर पर छह या अधिक होते हैं
चैनल।

'बिट-रेट' शब्द एन्कोडेड ऑडियो द्वारा व्याप्त भंडारण की मात्रा का एक माप है
समय की एक इकाई पर संकेत. यह उपरोक्त सभी पर निर्भर हो सकता है और आमतौर पर इसे इस रूप में दर्शाया जाता है
प्रति सेकंड कई किलो-बिट्स (kbps)। ए-लॉ टेलीफोनी सिग्नल की बिट-रेट 64 है
केबीपीएस. एमपी3-एन्कोडेड स्टीरियो संगीत की बिट-दर आमतौर पर 128-196 केबीपीएस होती है। FLAC-एन्कोडेड
स्टीरियो संगीत की बिट-दर आमतौर पर 550-760 केबीपीएस होती है।

अधिकांश स्व-वर्णन प्रारूप भी पाठ्य 'टिप्पणियों' को फ़ाइल में एम्बेड करने की अनुमति देते हैं
इसका उपयोग किसी तरह से ऑडियो का वर्णन करने के लिए किया जा सकता है, उदाहरण के लिए संगीत, शीर्षक, लेखक, आदि के लिए।

ऑडियो फ़ाइल टिप्पणियों का एक महत्वपूर्ण उपयोग 'रीप्ले गेन' जानकारी देना है। सॉक्स
रीप्ले गेन जानकारी लागू करने का समर्थन करता है, लेकिन इसे उत्पन्न करने का नहीं। ध्यान दें कि डिफ़ॉल्ट रूप से,
SoX इनपुट फ़ाइल टिप्पणियों को टिप्पणियों का समर्थन करने वाली आउटपुट फ़ाइलों में कॉपी करता है, इसलिए आउटपुट फ़ाइलें हो सकती हैं
यदि इनपुट फ़ाइल में कुछ मौजूद था तो रीप्ले गेन जानकारी शामिल करें। इस मामले में, यदि
एक साधारण प्रारूप रूपांतरण के अलावा कुछ भी आउटपुट फ़ाइल रीप्ले के बाद किया गया था
प्राप्त जानकारी गलत होने की संभावना है और इसलिए इसे एक उपकरण का उपयोग करके पुनर्गणना की जानी चाहिए
इसका समर्थन करता है (SoX नहीं)।

RSI सोक्सी(1) कमांड का उपयोग ऑडियो फ़ाइल हेडर से जानकारी प्रदर्शित करने के लिए किया जा सकता है।

निर्धारण & की स्थापना RSI पट्टिका प्रारूप
प्रारूप निर्धारित करने या सेट करने के लिए SoX के उपयोग के लिए कई तंत्र उपलब्ध हैं
एक ऑडियो फ़ाइल की विशेषताएँ. परिस्थितियों के आधार पर, व्यक्तिगत
विशेषताओं को विभिन्न तंत्रों का उपयोग करके निर्धारित या सेट किया जा सकता है।

इनपुट फ़ाइल के प्रारूप को निर्धारित करने के लिए, SoX प्राथमिकता के क्रम में और जैसा उपयोग करेगा
दिया गया या उपलब्ध:

1. कमांड-लाइन प्रारूप विकल्प।

2. फ़ाइल हेडर की सामग्री.

3. फ़ाइल नाम एक्सटेंशन.

आउटपुट फ़ाइल स्वरूप सेट करने के लिए, SoX, प्राथमिकता के क्रम में और दिए गए अनुसार उपयोग करेगा
बिकाऊ:

1. कमांड-लाइन प्रारूप विकल्प।

2. फ़ाइल नाम एक्सटेंशन.

3. इनपुट फ़ाइल स्वरूप विशेषताएँ, या निकटतम जो आउटपुट द्वारा समर्थित है
फाइल का प्रकार।

सभी फ़ाइलों के लिए, यदि फ़ाइल प्रकार निर्धारित नहीं किया जा सकता है तो SoX एक त्रुटि के साथ बाहर निकल जाएगा। आज्ञा-
समस्या को हल करने के लिए लाइन प्रारूप विकल्पों को जोड़ने या बदलने की आवश्यकता हो सकती है।

बजाना & रिकॉर्डिंग ऑडियो
RSI प्ले और ग्रामीण विद्युतीकरण निगम कमांड प्रदान किए गए हैं ताकि बुनियादी प्लेइंग और रिकॉर्डिंग उतनी ही सरल हो
मौजूदा फ़ाइल.wav चलाएं
और
आरईसी नई-file.wav
ये दोनों कमांड कार्यात्मक रूप से समकक्ष हैं
sox मौजूदा फ़ाइल.wav -d
और
sox -d new-file.wav
बेशक, आगे के विकल्प और प्रभाव (जैसा कि नीचे बताया गया है) कमांड में जोड़े जा सकते हैं
किसी भी रूप में.

* * *

कुछ सिस्टम एक से अधिक प्रकार के (SoX-संगत) ऑडियो ड्राइवर प्रदान करते हैं, उदाहरण के लिए ALSA और OSS,
या सुनौ और ए.ओ. सिस्टम में एक से अधिक ऑडियो डिवाइस (उर्फ 'साउंड कार्ड') भी हो सकते हैं।
यदि SoX में एक से अधिक ऑडियो ड्राइवर अंतर्निहित हैं, और SoX द्वारा डिफ़ॉल्ट का चयन किया गया है
जब रिकॉर्डिंग या बजाना वांछित नहीं है, तो ऑडियोड्राइवर वातावरण
वैरिएबल का उपयोग डिफ़ॉल्ट को ओवरराइड करने के लिए किया जा सकता है। उदाहरण के लिए (कई प्रणालियों पर):
ऑडियोड्राइवर=ओएसएस सेट करें
खेल ...
RSI ऑडियोदेव पर्यावरण चर का उपयोग डिफ़ॉल्ट ऑडियो डिवाइस को ओवरराइड करने के लिए किया जा सकता है, उदाहरण के लिए
AUDIODEV=/dev/dsp2 सेट करें
खेल ...
सॉक्स ... -टी ओस्स
or
AUDIODEV=hw:साउंडवेव,1,2 सेट करें
खेल ...
सॉक्स ... -टी अलसा
ध्यान दें कि पर्यावरण चर सेट करने का तरीका अलग-अलग सिस्टम में अलग-अलग होता है - कुछ के लिए
विशिष्ट उदाहरण, नीचे `SOX_OPTS' देखें।

नमूना दर वाली फ़ाइल चलाते समय जो ऑडियो आउटपुट डिवाइस द्वारा समर्थित नहीं है,
SoX स्वचालित रूप से आह्वान करेगा दर आवश्यक नमूना दर निष्पादित करने के लिए प्रभाव
रूपांतरण. पुराने हार्डवेयर के साथ अनुकूलता के लिए, डिफ़ॉल्ट दर गुणवत्ता स्तर निर्धारित है
'कम'. इसे स्पष्ट रूप से निर्दिष्ट करके बदला जा सकता है दर एक अलग प्रभाव के साथ
गुणवत्ता स्तर, उदा
खेलें... दर-एम
या उपयोग कर --प्ले-रेट-आर्ग विकल्प (नीचे देखें)।

* * *

कुछ प्रणालियों पर, SoX उपयोग करते समय ऑडियो प्लेबैक वॉल्यूम को समायोजित करने की अनुमति देता है प्ले। कहा पे
समर्थित, यह प्लेबैक के दौरान `v' और `V' कुंजियों को टैप करके प्राप्त किया जाता है।

उपयुक्त रिकॉर्डिंग स्तर सेट करने में मदद के लिए, SoX में एक पीक-लेवल मीटर शामिल है जो कर सकता है
(वास्तविक रिकॉर्डिंग करने से पहले) निम्नानुसार लागू किया जाए:
रिक -एन
रिकॉर्डिंग स्तर को समायोजित किया जाना चाहिए (सिस्टम-प्रदत्त मिक्सर प्रोग्राम का उपयोग करके, SoX का नहीं)
ताकि मीटर हो at अधिकांश कभी न कभी पूर्ण पैमाने पर, और कभी भी 'लाल रंग में' नहीं (ए
विस्मयादिबोधक चिह्न दिखाया गया है)। यह सभी देखें -S नीचे.

शुद्धता
कई फ़ाइल प्रारूप जो ऑडियो को संपीड़ित करते हैं, कुछ ऑडियो सिग्नल जानकारी को त्याग देते हैं
ऐसा करने से। ऐसे प्रारूप में कनवर्ट करने और फिर वापस कनवर्ट करने से कोई परिणाम नहीं आएगा
मूल ऑडियो की सटीक प्रतिलिपि. टेलीफोनी में उपयोग किए जाने वाले कई प्रारूपों का यही मामला है
(जैसे ए-लॉ, जीएसएम) जहां कम सिग्नल बैंडविड्थ उच्च ऑडियो निष्ठा से अधिक महत्वपूर्ण है,
और पोर्टेबल म्यूजिक प्लेयर्स (जैसे एमपी3, वॉर्बिस) में उपयोग किए जाने वाले कई प्रारूपों के लिए जहां पर्याप्त हो
बनाने के लिए आवश्यक बड़े संपीड़न अनुपात के साथ भी निष्ठा बरकरार रखी जा सकती है
पोर्टेबल खिलाड़ी व्यावहारिक।

ऑडियो सिग्नल जानकारी को त्यागने वाले प्रारूप को 'हानिपूर्ण' कहा जाता है। जो प्रारूप नहीं हैं
'दोषरहित' कहा जाता है। 'गुणवत्ता' शब्द का उपयोग यह मापने के लिए किया जाता है कि मूल कितना निकट है
हानिपूर्ण प्रारूप का उपयोग करते समय ऑडियो सिग्नल को पुन: प्रस्तुत किया जा सकता है।

SoX के साथ ऑडियो फ़ाइल रूपांतरण हानिरहित है जब यह हो सकता है, अर्थात जब हानिपूर्ण का उपयोग नहीं किया जा रहा हो
संपीड़न, जब नमूनाकरण दर या चैनलों की संख्या को कम नहीं किया जा रहा हो, और जब
गंतव्य प्रारूप में प्रयुक्त बिट्स की संख्या स्रोत प्रारूप से कम नहीं है। उदाहरण के लिए
8-बिट पीसीएम प्रारूप से 16-बिट पीसीएम प्रारूप में कनवर्ट करना हानिरहित है लेकिन इससे कनवर्ट करना
(8-बिट) ए-लॉ के लिए 8-बिट पीसीएम प्रारूप नहीं है।

एनबी SoX प्रदर्शन से पहले सभी ऑडियो फ़ाइलों को आंतरिक असम्पीडित प्रारूप में परिवर्तित करता है
कोई भी ऑडियो प्रोसेसिंग। इसका मतलब है कि हानिपूर्ण प्रारूप में संग्रहीत फ़ाइल में हेरफेर करना
ऑडियो निष्ठा में और अधिक हानि हो सकती है। उदाहरण के लिए साथ
सॉक्स लॉन्ग.एमपी3 शॉर्ट.एमपी3 ट्रिम 10
SoX पहले इनपुट MP3 फ़ाइल को डीकंप्रेस करता है, फिर लागू करता है ट्रिम प्रभाव, और अंत में
ऑडियो को फिर से संपीड़ित करके आउटपुट एमपी3 फ़ाइल बनाता है - संभावित कमी के साथ
निष्ठा उससे ऊपर है जो इनपुट फ़ाइल बनाते समय उत्पन्न हुई थी। अत: यदि जो है
अंततः वांछित हानिपूर्ण रूप से संपीड़ित ऑडियो है, यह सब निष्पादित करने के लिए अत्यधिक अनुशंसित है
दोषरहित फ़ाइल स्वरूपों का उपयोग करके ऑडियो प्रसंस्करण और फिर केवल हानिपूर्ण प्रारूप में कनवर्ट करना
अंतिम चरण.

एनबी एकल SoX आह्वान के साथ कई प्रभाव लागू करने से, सामान्य तौर पर, उत्पादन होगा
एकाधिक SoX आमंत्रणों का उपयोग करके प्राप्त परिणामों की तुलना में अधिक सटीक परिणाम।

डिथरिंग
डिथरिंग एक ऐसी तकनीक है जिसका उपयोग संग्रहीत ऑडियो की गतिशील रेंज को अधिकतम करने के लिए किया जाता है
विशेष बिट-गहराई. परिमाणीकरण द्वारा उत्पन्न किसी भी विकृति को जोड़कर सजाया जाता है
सिग्नल पर थोड़ी मात्रा में सफेद शोर। ज्यादातर मामलों में, SoX यह निर्धारित कर सकता है कि क्या
चयनित प्रसंस्करण के लिए अलग-अलग आवश्यकता होती है और यदि आउटपुट स्वरूपण के दौरान इसे जोड़ा जाएगा
उचित।

विशेष रूप से, डिफ़ॉल्ट रूप से, आउटपुट बिट-डेप्थ होने पर SoX स्वचालित रूप से TPDF जोड़ता है
24 से कम और निम्नलिखित में से कोई भी सत्य है:

· कमांड-लाइन विकल्प का उपयोग करके बिट-गहराई में कमी को स्पष्ट रूप से निर्दिष्ट किया गया है

· आउटपुट फ़ाइल स्वरूप इनपुट फ़ाइल की तुलना में केवल कम बिट-गहराई का समर्थन करता है
प्रारूप

· एक प्रभाव ने आंतरिक प्रसंस्करण श्रृंखला के भीतर प्रभावी बिट-गहराई बढ़ा दी है

उदाहरण के लिए, वॉल्यूम समायोजित करना वॉल 0.25 जिसमें दो अतिरिक्त बिट्स की आवश्यकता होती है
इसके परिणामों को दोषरहित रूप से संग्रहीत करें (चूंकि 0.25 दशमलव 0.01 बाइनरी के बराबर है)। तो अगर इनपुट
फ़ाइल बिट-गहराई 16 है, तो SoX का आंतरिक प्रतिनिधित्व 18 बिट्स का उपयोग करेगा
इस वॉल्यूम परिवर्तन को संसाधित करना। आउटपुट को समान गहराई पर संग्रहीत करने के लिए
इनपुट, अतिरिक्त बिट्स को हटाने के लिए डिथरिंग का उपयोग किया जाता है।

उपयोग -V यह देखने का विकल्प कि SoX ने स्वचालित रूप से कौन सी प्रोसेसिंग जोड़ी है। -D विकल्प हो सकता है
स्वचालित डिथरिंग को ओवरराइड करने के लिए दिया गया। डिथरिंग को मैन्युअल रूप से शुरू करने के लिए (उदाहरण के लिए a का चयन करने के लिए)।
शोर-आकार देने वाला वक्र), देखें तड़पना प्रभाव।

कतरन
क्लिपिंग वह विकृति है जो तब होती है जब ऑडियो सिग्नल स्तर (या 'वॉल्यूम') से अधिक हो जाता है
चुने गए प्रतिनिधित्व की सीमा. अधिकांश मामलों में, कतरन अवांछनीय है और ऐसा होना भी चाहिए
उस बिंदु (प्रसंस्करण श्रृंखला में) से पहले के स्तर को समायोजित करके ठीक किया जाए
ऐसा होता है।

SoX में, जैसा कि आप उम्मीद कर सकते हैं, इसका उपयोग करते समय क्लिपिंग हो सकती है वॉल or लाभ को प्रभाव
ऑडियो वॉल्यूम बढ़ाएँ. कतरन कई अन्य प्रभावों के साथ भी हो सकती है, जब
एक प्रारूप को दूसरे प्रारूप में परिवर्तित करना, और यहां तक ​​कि केवल ऑडियो चलाते समय भी।

ऑडियो फ़ाइल चलाने में अक्सर पुन: नमूनाकरण शामिल होता है, और एनालॉग घटकों द्वारा प्रसंस्करण किया जा सकता है
एक छोटा डीसी ऑफसेट और/या प्रवर्धन लागू करें, जो सभी विकृति उत्पन्न कर सकते हैं
ऑडियो सिग्नल स्तर प्रारंभ में क्लिपिंग बिंदु के बहुत करीब था।

इन कारणों से, यह सुनिश्चित करना सामान्य है कि ऑडियो फ़ाइल के सिग्नल स्तर में कुछ है
`हेडरूम', यानी यह अधिकतम संभव स्तर से नीचे एक विशेष स्तर से अधिक नहीं है
दिए गए प्रतिनिधित्व के लिए. कुछ मानक निकाय 9dB हेडरूम तक की अनुशंसा करते हैं,
लेकिन ज्यादातर मामलों में, 3dB (≈ 70% रैखिक) पर्याप्त है। ध्यान दें कि यह ज्ञान प्रतीत होता है
आधुनिक संगीत निर्माण में खो गया; वास्तव में, कई सीडी, एमपी3 आदि अब स्तरों पर निपुण हो गए हैं
ऊपर 0dBFS यानी ऑडियो डिलीवर के रूप में क्लिप किया गया है।

SoX's स्टेट और आँकड़े प्रभाव किसी ऑडियो फ़ाइल में सिग्नल स्तर निर्धारित करने में सहायता कर सकते हैं।
RSI लाभ or वॉल प्रभाव का उपयोग क्लिपिंग को रोकने के लिए किया जा सकता है, उदाहरण के लिए
सॉक्स डल.वेव ब्राइट.वेव गेन -6 ट्रेबल +6
गारंटी देता है कि तिगुना बूस्ट क्लिप नहीं होगा।

यदि प्रसंस्करण के दौरान किसी भी बिंदु पर क्लिपिंग होती है, तो SoX एक चेतावनी संदेश प्रदर्शित करेगा
वह प्रभाव.

यह भी देखें -G और लाभ और आदर्श प्रभाव.

निवेश पट्टिका का मेल
SoX के इनपुट कंबाइनर को एकाधिक फ़ाइलों का उपयोग करके संयोजित करने के लिए कॉन्फ़िगर किया जा सकता है (नीचे विकल्प देखें)।
निम्नलिखित विधियों में से कोई भी: `संक्षिप्त', `अनुक्रम', `मिश्रण', `मिश्रण-शक्ति', `विलय', या
`गुणा'. इसके लिए डिफ़ॉल्ट विधि 'अनुक्रम' है प्ले, और `संबद्ध' के लिए ग्रामीण विद्युतीकरण निगम और सॉक्स.

'अनुक्रम' के अलावा अन्य सभी तरीकों के लिए, एकाधिक इनपुट फ़ाइलों में समान नमूनाकरण होना चाहिए
दर। यदि आवश्यक हो, तो नमूना दर समायोजन करने के लिए अलग SoX आमंत्रण का उपयोग किया जा सकता है
संयोजन से पहले.

यदि `कॉन्केटेनेट' संयोजन विधि का चयन किया जाता है (आमतौर पर, यह डिफ़ॉल्ट रूप से होगा)।
इनपुट फ़ाइलों में भी चैनलों की संख्या समान होनी चाहिए। प्रत्येक इनपुट से ऑडियो
आउटपुट फ़ाइल बनाने के लिए दिए गए क्रम में संयोजित किया जाएगा।

'अनुक्रम' संयोजन विधि स्वचालित रूप से चुनी जाती है प्ले. यह उसके जैसा है
`कॉन्टेनेट' जिसमें प्रत्येक इनपुट फ़ाइल से ऑडियो को आउटपुट फ़ाइल में क्रमिक रूप से भेजा जाता है।
हालाँकि, यहां आउटपुट फ़ाइल को संबंधित ट्रांज़िशन पर बंद और फिर से खोला जा सकता है
इनपुट फ़ाइलों के बीच. विभिन्न प्रकार के ऑडियो भेजते समय इसकी आवश्यकता हो सकती है
आउटपुट डिवाइस के लिए, लेकिन यह आमतौर पर तब उपयोगी नहीं होता जब आउटपुट एक सामान्य फ़ाइल हो।

यदि 'मिक्स' या 'मिक्स-पावर' संयोजन विधि का चयन किया जाता है तो दो या दो से अधिक इनपुट
फ़ाइलें दी जानी चाहिए और आउटपुट फ़ाइल बनाने के लिए उन्हें एक साथ मिलाया जाएगा। की संख्या
प्रत्येक इनपुट फ़ाइल में चैनल समान होने की आवश्यकता नहीं है, लेकिन यदि वे हैं तो SoX एक चेतावनी जारी करेगा
नहीं और आउटपुट फ़ाइल के कुछ चैनलों में प्रत्येक इनपुट फ़ाइल से ऑडियो शामिल नहीं होगा। ए
मिश्रित ऑडियो फ़ाइल को मूल इनपुट फ़ाइलों के संदर्भ के बिना अन-मिक्स नहीं किया जा सकता है।

यदि 'मर्ज' संयोजन विधि का चयन किया जाता है तो दो या अधिक इनपुट फ़ाइलें दी जानी चाहिए
आउटपुट फ़ाइल बनाने के लिए एक साथ विलय कर दिया जाएगा। प्रत्येक इनपुट में चैनलों की संख्या
फ़ाइल का समान होना आवश्यक नहीं है. एक मर्ज की गई ऑडियो फ़ाइल में सभी के सभी चैनल शामिल होते हैं
इनपुट फ़ाइलें. SoX के एकाधिक आमंत्रणों का उपयोग करके अन-विलय संभव है रीमिक्स
प्रभाव। उदाहरण के लिए, दो मोनो फ़ाइलों को एक स्टीरियो फ़ाइल बनाने के लिए मर्ज किया जा सकता है। पहला
और दूसरी मोनो फ़ाइलें स्टीरियो फ़ाइल के बाएँ और दाएँ चैनल बन जाएंगी।

'गुणा' संयोजन विधि संबंधित चैनलों के नमूना मूल्यों को गुणा करती है
(अंतराल -1 से +1 में संख्याओं के रूप में माना जाता है)। यदि इनपुट में चैनलों की संख्या
फ़ाइलें समान नहीं हैं, गुम चैनलों में सभी शून्य शामिल माने जाते हैं।

इनपुट फ़ाइलों को संयोजित करते समय, SoX कोई निर्दिष्ट प्रभाव लागू करता है (उदाहरण के लिए, सहित)।
वॉल ऑडियो संयोजित होने के बाद वॉल्यूम समायोजन प्रभाव)। हालाँकि, ऐसा अक्सर होता है
पहले व्यक्तिगत रूप से इनपुट की मात्रा (यानी 'संतुलन') सेट करने में सक्षम होने के लिए उपयोगी है
संयोजन होता है.

सभी संयोजन विधियों के लिए, इनपुट फ़ाइल वॉल्यूम समायोजन का उपयोग करके मैन्युअल रूप से किया जा सकता है -v
विकल्प (नीचे) जो एक या अधिक इनपुट फ़ाइलों के लिए दिया जा सकता है। यदि यह केवल के लिए दिया गया है
कुछ इनपुट फ़ाइलों को तो अन्य को कोई वॉल्यूम समायोजन नहीं मिलता है। कुछ में
परिस्थितियों में, स्वचालित वॉल्यूम समायोजन लागू किया जा सकता है (नीचे देखें)।

RSI -V विकल्प (नीचे) का उपयोग इनपुट फ़ाइल वॉल्यूम समायोजन को दिखाने के लिए किया जा सकता है
चयनित (या तो मैन्युअल रूप से या स्वचालित रूप से)।

इनपुट फ़ाइलों को मिश्रित करते समय कुछ विशेष बातों का ध्यान रखना आवश्यक है:

अन्य तरीकों के विपरीत, 'मिक्स' संयोजन में कतरन पैदा करने की क्षमता होती है
यदि कोई संतुलन नहीं बनाया गया है तो कंबाइनर। इस मामले में, यदि मैन्युअल वॉल्यूम समायोजन नहीं हैं
दिया गया है, SoX स्वचालित रूप से समायोजित करके यह सुनिश्चित करने का प्रयास करेगा कि क्लिपिंग न हो
¹/n के कारक द्वारा प्रत्येक इनपुट सिग्नल का आयतन (आयाम), जहां n इनपुट की संख्या है
फ़ाइलें. यदि इसके परिणामस्वरूप ऑडियो बहुत शांत या अन्यथा असंतुलित है तो इनपुट करें
ऊपर वर्णित अनुसार फ़ाइल वॉल्यूम को मैन्युअल रूप से सेट किया जा सकता है। का उपयोग आदर्श मिश्रण पर प्रभाव पड़ता है
एक अन्य विकल्प.

यदि मिश्रित ऑडियो कुछ बिंदुओं पर काफी तेज़ लगता है लेकिन दूसरों में बहुत शांत लगता है तो गतिशील रेंज
इसे ठीक करने के लिए संपीड़न लागू किया जाना चाहिए - देखें कंपंड प्रभाव।

'मिक्स-पॉवर' संयोजन विधि से, मिश्रित मात्रा लगभग बराबर होती है
इनपुट सिग्नलों में से एक। इसके बजाय ¹/√n के कारक का उपयोग करके संतुलन बनाकर इसे प्राप्त किया जाता है
¹/एन. ध्यान दें कि यह संतुलन कारक यह गारंटी नहीं देता है कि क्लिपिंग नहीं होगी, लेकिन
क्लिप की संख्या आमतौर पर कम होगी और परिणामी विकृति आम तौर पर होगी
अगोचर।

उत्पादन फ़ाइलें
SoX का डिफ़ॉल्ट व्यवहार एक या अधिक इनपुट फ़ाइलें लेना और उन्हें एक में लिखना है
निर्गम संचिका।

इस व्यवहार को प्रभावों के भीतर छद्म-प्रभाव `न्यूफ़ाइल' निर्दिष्ट करके बदला जा सकता है
सूची। SoX फिर एकाधिक आउटपुट मोड में प्रवेश करेगा।

एकाधिक आउटपुट मोड में, 'न्यूफ़ाइल' से पहले के प्रभाव होने पर एक नई फ़ाइल बनाई जाती है
इंगित करें कि वे पूर्ण हो गए हैं। `न्यूफ़ाइल' के बाद सूचीबद्ध प्रभाव श्रृंखला फिर शुरू की जाती है और
इसका आउटपुट नई फ़ाइल में सहेजा जाता है।

एकाधिक आउटपुट मोड में, सभी के अंत में एक अद्वितीय संख्या स्वचालित रूप से जोड़ दी जाएगी
फ़ाइलनाम. यदि फ़ाइल नाम में एक्सटेंशन है तो नंबर पहले डाला जाता है
विस्तार। इस व्यवहार को फ़ाइल नाम में कहीं भी %n रखकर अनुकूलित किया जा सकता है
जहां संख्या प्रतिस्थापित की जानी चाहिए. % के बाद एक वैकल्पिक संख्या रखी जा सकती है
संख्या के लिए न्यूनतम निश्चित चौड़ाई इंगित करें।

एकाधिक आउटपुट मोड तब तक बहुत उपयोगी नहीं है जब तक कि कोई प्रभाव प्रभाव श्रृंखला को रोक न दे
जल्दी `न्यूफ़ाइल' से पहले निर्दिष्ट किया गया है। यदि प्रभाव से पहले फ़ाइल का अंत पहुँच जाता है
श्रृंखला स्वयं बंद हो जाती है तो कोई नई फ़ाइल नहीं बनाई जाएगी क्योंकि यह खाली होगी।

निम्नलिखित एक इनपुट फ़ाइल के पहले 60 सेकंड को दो 30 सेकंड में विभाजित करने का एक उदाहरण है
दूसरी फ़ाइलें और बाकी को अनदेखा करना।
sox गाना.wav रिंगटोन%1n.wav ट्रिम 0 30 : नई फ़ाइल : ट्रिम 0 30

रोक सॉक्स
आमतौर पर SoX अपनी प्रोसेसिंग पूरी कर लेगा और सब कुछ पढ़ लेने के बाद स्वचालित रूप से बाहर निकल जाएगा
इनपुट फ़ाइलों से उपलब्ध ऑडियो डेटा।

यदि चाहें तो प्रक्रिया में व्यवधान संकेत भेजकर इसे पहले भी समाप्त किया जा सकता है
(आमतौर पर कीबोर्ड इंटरप्ट कुंजी दबाकर जो सामान्यतः Ctrl-C होती है)। यह है एक
कुछ परिस्थितियों में स्वाभाविक आवश्यकता, उदाहरण के लिए रिकॉर्डिंग करने के लिए SoX का उपयोग करते समय। टिप्पणी
एकाधिक फ़ाइलों को चलाने के लिए SoX का उपयोग करते समय, Ctrl-C थोड़ा अलग व्यवहार करता है: दबाने पर
यह एक बार SoX को अगली फ़ाइल पर जाने का कारण बनता है; इसे लगातार दो बार दबाने से समस्या उत्पन्न हो जाती है
बाहर निकलने के लिए SoX.

प्रसंस्करण को जल्दी रोकने का एक अन्य विकल्प एक ऐसे प्रभाव का उपयोग करना है जिसकी एक समय अवधि होती है या
रुकने का बिंदु निर्धारित करने के लिए नमूना गणना। ट्रिम प्रभाव इसका एक उदाहरण है. एक बार
सभी प्रभाव शृंखलाएँ बंद हो गई हैं तो SoX भी बंद हो जाएगा।

फ़ाइल नाम


फ़ाइल नाम सरल फ़ाइल नाम, पूर्ण या सापेक्ष पथ नाम, या यूआरएल (इनपुट फ़ाइलें) हो सकते हैं
केवल)। ध्यान दें कि यूआरएल समर्थन के लिए इसकी आवश्यकता है wget(1) उपलब्ध है।

नोट: SoX को एक इनपुट या आउटपुट फ़ाइल नाम देना जो SoX प्रभाव-नाम के समान हो
काम नहीं करेगा क्योंकि SoX इसे एक प्रभाव विनिर्देश के रूप में मानेगा। इसका एकमात्र समाधान यही है
ऐसे फ़ाइलनामों से बचना है। अधिकांश ऑडियो फ़ाइलनामों के कारण यह आम तौर पर कठिन नहीं है
फ़ाइल नाम `एक्सटेंशन' है, जबकि प्रभाव-नाम नहीं है।

विशिष्ट फ़ाइल नाम
सामान्य के स्थान पर कुछ विशेष परिस्थितियों में निम्नलिखित विशेष फ़ाइल नामों का उपयोग किया जा सकता है
कमांड लाइन पर फ़ाइल नाम:

- SoX का उपयोग विशेष फ़ाइल नाम `-' का उपयोग करके सरल पाइपलाइन संचालन में किया जा सकता है
जिसे, यदि इनपुट फ़ाइल नाम के रूप में उपयोग किया जाता है, तो SoX ऑडियो डेटा पढ़ेगा
`मानक इनपुट' (stdin), और जो, यदि आउटपुट फ़ाइल नाम के रूप में उपयोग किया जाता है, तो SoX का कारण बनेगा
ऑडियो डेटा को `मानक आउटपुट' (स्टडआउट) पर भेज देगा। इसका उपयोग करते समय ध्यान दें
आउटपुट फ़ाइल के लिए विकल्प, और कभी-कभी इनपुट फ़ाइल के लिए इसका उपयोग करते समय,
फ़ाइल-प्रकार (देखें) -t नीचे) भी दिया जाना चाहिए।

"|कार्यक्रम [विकल्पों]..."
इसका उपयोग दिए गए प्रोग्राम को निर्दिष्ट करने के लिए इनपुट फ़ाइल नाम के स्थान पर किया जा सकता है
मानक आउटपुट (स्टडआउट) का उपयोग इनपुट फ़ाइल के रूप में किया जाना चाहिए। भिन्न - (ऊपर), यह हो सकता है
एक SoX कमांड में कई इनपुट के लिए उपयोग किया जाता है। उदाहरण के लिए, यदि `genw' मोनो उत्पन्न करता है
WAV ने अपने मानक आउटपुट के लिए सिग्नल को स्वरूपित किया, फिर निम्न कमांड बनाता है
दो उत्पन्न संकेतों से स्टीरियो फ़ाइल:
sox -M "|genw --imd -" "|genw --thd -" out.wav
हेडरलेस (कच्चा) ऑडियो के लिए, -t (और शायद अन्य प्रारूप विकल्प) की आवश्यकता होगी
इनपुट कमांड से पहले दिया गया।

"वाइल्डकार्ड-फ़ाइल नाम"
निर्दिष्ट करता है कि फ़ाइल नाम `ग्लोबिंग' (वाइल्ड-कार्ड मिलान) SoX द्वारा निष्पादित किया जाना चाहिए
खोल के बजाय. यह फ़ाइल विकल्पों के एक सेट को लागू करने की अनुमति देता है
फ़ाइलों का एक समूह. उदाहरण के लिए, यदि वर्तमान निर्देशिका में तीन `वोक्स' हैं
फ़ाइलें, फ़ाइल1.वॉक्स, फ़ाइल2.वॉक्स, और फ़ाइल3.वॉक्स, फिर
प्ले--रेट 6k *.vox
'शेल' द्वारा (अधिकांश परिवेशों में) विस्तारित किया जाएगा
प्ले --रेट 6k फ़ाइल1.वॉक्स फ़ाइल2.वॉक्स फ़ाइल3.वॉक्स
जो केवल पहली वॉक्स फ़ाइल को 6k की नमूना दर के रूप में मानेगा। साथ
खेलें --रेट 6k "*.vox"
दिया गया नमूना दर विकल्प सभी तीन वॉक्स फ़ाइलों पर लागू किया जाएगा।

-p, --सॉक्स-पाइप
SoX कमांड को निर्दिष्ट करने के लिए आउटपुट फ़ाइल नाम के स्थान पर इसका उपयोग किया जा सकता है
किसी अन्य SoX कमांड के इनपुट पाइप के रूप में उपयोग किया जाना चाहिए। उदाहरण के लिए, आदेश:
प्ले "|सॉक्स -एन -पी सिंथ 2" "|सॉक्स -एन -पी सिंथ 2 ट्रेमोलो 10" स्टेट
लगातार दो `फ़ाइलें' चलाता है, प्रत्येक अलग-अलग प्रभावों के साथ।

-p वास्तव में ` का उपनाम है-t सॉक्स -'.

-d, --डिफ़ॉल्ट उपकरण
यह निर्दिष्ट करने के लिए इनपुट या आउटपुट फ़ाइल नाम के स्थान पर इसका उपयोग किया जा सकता है
डिफ़ॉल्ट ऑडियो डिवाइस (यदि कोई SoX में बनाया गया है) का उपयोग किया जाना है। यह एक जैसा है
आह्वान करने के लिए ग्रामीण विद्युतीकरण निगम or प्ले (जैसा ऊपर बताया गया है)।

-n, --शून्य
इसे 'शून्य' निर्दिष्ट करने के लिए इनपुट या आउटपुट फ़ाइल नाम के स्थान पर उपयोग किया जा सकता है
फ़ाइल' का उपयोग करना होगा। ध्यान दें कि यहां, 'शून्य फ़ाइल' SoX-विशिष्ट को संदर्भित करती है
तंत्र और समान नाम वाले किसी भी ऑपरेटिंग-सिस्टम तंत्र से संबंधित नहीं है।

ऑडियो इनपुट करने के लिए एक शून्य फ़ाइल का उपयोग करना एक सामान्य ऑडियो फ़ाइल का उपयोग करने के बराबर है
इसमें अनंत मात्रा में मौन होता है, और तब तक यह आम तौर पर उपयोगी नहीं होता है
ऐसे प्रभाव के साथ प्रयोग किया जाता है जो एक सीमित समय लंबाई निर्दिष्ट करता है (जैसे ट्रिम or synth).

ऑडियो आउटपुट के लिए एक शून्य फ़ाइल का उपयोग करना ऑडियो को हटाने के बराबर है और उपयोगी है
मुख्य रूप से ऐसे प्रभावों के साथ जो प्रभावित करने के बजाय ऑडियो के बारे में जानकारी उत्पन्न करते हैं
यह (जैसे नॉइज़प्रोफ़ or स्टेट).

एक शून्य फ़ाइल से जुड़ी नमूना दर डिफ़ॉल्ट रूप से 48 kHz है, लेकिन, जैसा कि a
सामान्य फ़ाइल, यदि वांछित हो तो कमांड-लाइन प्रारूप विकल्पों का उपयोग करके इसे ओवरराइड किया जा सकता है
(निचे देखो)।

समर्थित पट्टिका & ऑडियो युक्ति प्रकार
देख soxformat(7) समर्थित फ़ाइल स्वरूपों और ऑडियो डिवाइस की सूची और विवरण के लिए
ड्राइवरों।

विकल्प


वैश्विक ऑप्शंस
इन विकल्पों को पहले प्रभाव से पहले किसी भी बिंदु पर कमांड लाइन पर निर्दिष्ट किया जा सकता है
नाम.

RSI SOX_OPTS पर्यावरण चर का उपयोग वैकल्पिक डिफ़ॉल्ट मान प्रदान करने के लिए किया जा सकता है
SoX के वैश्विक विकल्प। उदाहरण के लिए:
SOX_OPTS=''-बफर 20000 --प्ले-रेट-आर्ग -एचएस --टेम्प /एमएनटी/टेम्प''
ध्यान दें कि SOX_OPTS को सेट करने से संभावित रूप से व्यवहार में अवांछित परिवर्तन हो सकते हैं
स्क्रिप्ट या अन्य प्रोग्राम जो SoX को आमंत्रित करते हैं। SOX_OPTS का सबसे अच्छा उपयोग चीजों के लिए किया जा सकता है (जैसे
जैसा कि दिए गए उदाहरण में है) जो उस वातावरण को दर्शाता है जिसमें SoX चलाया जा रहा है। सक्षम करने से
जैसे विकल्प --नो-क्लोबर चूंकि डिफ़ॉल्ट को शेल उपनाम का उपयोग करके बेहतर ढंग से संभाला जा सकता है
शेल उपनाम स्क्रिप्ट आदि में संचालन को प्रभावित नहीं करेगा।

यह सुनिश्चित करने का एक तरीका है कि कोई स्क्रिप्ट SOX_OPTS से प्रभावित नहीं हो सकती, SOX_OPTS को साफ़ करना है
स्क्रिप्ट की शुरुआत, लेकिन यह निश्चित रूप से कुछ ले जाने वाले SOX_OPTS के लाभ को खो देता है
सिस्टम-व्यापी डिफ़ॉल्ट विकल्प। एक वैकल्पिक दृष्टिकोण SoX को स्पष्ट रूप से लागू करना है
डिफ़ॉल्ट विकल्प मान, उदा
SOX_OPTS='-V--नो-क्लॉबर'
...
sox -V2 --क्लॉबर $इनपुट $आउटपुट...
ध्यान दें कि पर्यावरण चर सेट करने का तरीका अलग-अलग सिस्टम में अलग-अलग होता है। यहाँ हैं कुछ
उदाहरण:

यूनिक्स बैश:
निर्यात SOX_OPTS='-V --no-clobber'
यूनिक्स सीएसएच:
सेटेनव SOX_OPTS "-V --नो-क्लॉबर"
एमएस-डॉस/एमएस-विंडोज़:
SOX_OPTS=-V--नो-क्लॉबर सेट करें
एमएस-विंडोज जीयूआई: नियंत्रण कक्ष के माध्यम से: सिस्टम: उन्नत: पर्यावरण चर

Mac OS

--बफर बाइट्स, --इनपुट-बफर बाइट्स
ऑडियो प्रसंस्करण के लिए उपयोग किए जाने वाले बफ़र्स के बाइट्स में आकार सेट करें (डिफ़ॉल्ट 8192)।
--बफर इनपुट, प्रभाव और आउटपुट प्रोसेसिंग पर लागू होता है; --इनपुट-बफर लागू होता है
केवल इनपुट प्रोसेसिंग के लिए (जिसके लिए यह ओवरराइड करता है)। --बफर यदि दोनों दिए गए हैं)।

ध्यान रखें कि इसके लिए बड़े मूल्य हैं --बफर SoX प्रतिक्रिया देने में धीमा हो जाएगा
वर्तमान इनपुट फ़ाइल को समाप्त करने या छोड़ने का अनुरोध करने के लिए।

--क्लोबर
किसी मौजूदा फ़ाइल को दिए गए समान नाम से अधिलेखित करने से पहले संकेत न दें
आउटपुट फ़ाइल के लिए. यह डिफ़ॉल्ट व्यवहार है.

--मिलाना जुटना|मर्ज|मिश्रण|मिश्रण शक्ति|गुणा करना|अनुक्रम
इनपुट फ़ाइल संयोजन विधि का चयन करें; इनमें से कुछ के लिए, संक्षिप्त विकल्प हैं
बिकाऊ: -m 'मिश्रण' का चयन करता है, -M 'मर्ज' का चयन करता है, और -T 'गुणा' का चयन करता है।

देख निवेश पट्टिका का मेल विभिन्न संयोजनों के विवरण के लिए ऊपर
तरीकों.

-D, --नो-डाइटर
स्वचालित डिथरिंग अक्षम करें - ऊपर 'डिथरिंग' देखें। ऐसा क्यों हो सकता है इसका एक उदाहरण
कभी-कभी उपयोगी होता है यदि फ़ाइल को 16 से 24 बिट में परिवर्तित किया गया हो
इस पर कुछ प्रसंस्करण करने का इरादा है, लेकिन वास्तव में इसके बाद किसी प्रसंस्करण की आवश्यकता नहीं है
सभी और मूल 16 बिट फ़ाइल खो गई है, फिर, सख्ती से कहें तो, कोई संदेह नहीं
फ़ाइल को वापस 16 बिट में परिवर्तित करने के लिए इसकी आवश्यकता है। यह भी देखें आँकड़े कैसे के लिए प्रभाव
किसी फ़ाइल के भीतर ऑडियो की वास्तविक बिट गहराई निर्धारित करने के लिए।

--प्रभाव-फ़ाइल फ़ाइल का नाम
सभी प्रभाव और उनके तर्क प्राप्त करने के लिए FILENAME का उपयोग करें। फ़ाइल को इस प्रकार पार्स किया गया है जैसे कि
मान कमांड लाइन पर निर्दिष्ट किए गए थे। इसके स्थान पर नई लाइन का उपयोग किया जा सकता है
विशेष : प्रभाव श्रृंखलाओं को अलग करने के लिए मार्कर। सुविधा के लिए, ऐसे मार्करों पर
फ़ाइल के अंत को सामान्यतः अनदेखा कर दिया जाता है; यदि आप एक खाली अंतिम निर्दिष्ट करना चाहते हैं
प्रभाव श्रृंखला, एक स्पष्ट का उपयोग करें : फ़ाइल की अंतिम पंक्ति पर स्वयं। यह
विकल्प कमांड लाइन पर निर्दिष्ट किसी भी प्रभाव को खारिज कर देता है।

-G, --रक्षक
स्वचालित रूप से आह्वान करें लाभ कतरन से बचाव के लिए प्रभाव। उदाहरण के लिए
सॉक्स -जी इनफाइल -बी 16 आउटफाइल रेट 44100 डिथर -एस
के लिए आशुलिपि है
सॉक्स इनफाइल -बी 16 आउटफाइल गेन -एच रेट 44100 गेन -आरएच डिथर -एस
यह भी देखें -वी, --आदर्श, और लाभ प्रभाव।

-h, --मदद
संस्करण संख्या और उपयोग की जानकारी दिखाएँ.

--सहायता-प्रभाव नाम
निर्दिष्ट प्रभाव पर उपयोग की जानकारी दिखाएँ. नाम सब दिखाने के लिए उपयोग किया जा सकता है
सभी प्रभावों पर उपयोग.

--सहायता-प्रारूप नाम
निर्दिष्ट फ़ाइल स्वरूप के बारे में जानकारी दिखाएँ। नाम सब दिखाने के लिए उपयोग किया जा सकता है
सभी प्रारूपों पर जानकारी.

--मैं, --जानकारी
केवल यदि पहले पैरामीटर के रूप में दिया गया हो सॉक्स, जैसा व्यवहार करें सोक्सी(1).

-m|-M के बराबर --मिलाना मिश्रण और --मिलाना मर्ज, क्रमशः।

--जादू
यदि SoX को वैकल्पिक `लिबमैजिक' लाइब्रेरी के साथ बनाया गया है तो यह विकल्प हो सकता है
ऑडियो फ़ाइल प्रकारों का पता लगाने में इसके उपयोग को सक्षम करने के लिए दिया गया।

--बहु-थ्रेडेड | --एकल-थ्रेडेड
डिफ़ॉल्ट रूप से, SoX `सिंगल थ्रेडेड' है। यदि --बहु-थ्रेडेड विकल्प दिया गया है
हालाँकि, SoX अधिकांश मल्टी-चैनल प्रभावों के लिए ऑडियो चैनलों को संसाधित करेगा
हाइपर-थ्रेडिंग/मल्टी-कोर आर्किटेक्चर पर समानांतर। इससे प्रोसेसिंग कम हो सकती है
समय, हालाँकि कभी-कभी इस विकल्प का उपयोग a के साथ संयोजन में करना आवश्यक हो सकता है
मल्टी-थ्रेडेड से कोई भी लाभ प्राप्त करने के लिए डिफ़ॉल्ट से बड़ा बफ़र आकार है
प्रसंस्करण (जैसे 131072; देखें --बफर ऊपर)।

--नो-क्लोबर
किसी मौजूदा फ़ाइल को उसी नाम से अधिलेखित करने से पहले संकेत दें जो इसके लिए दिया गया है
निर्गम संचिका।

एनबी किसी फ़ाइल को अनजाने में ओवरराइट करना जितना आप सोच सकते हैं उससे कहीं अधिक आसान है
उदाहरण के लिए, यदि आप गलती से प्रवेश कर जाते हैं
sox फ़ाइल1 फ़ाइल2 प्रभाव1 प्रभाव2...
जबकि आपका वास्तव में क्या मतलब था
फ़ाइल1 फ़ाइल2 प्रभाव1 प्रभाव2 चलाएँ...
फिर, इस विकल्प के बिना, फ़ाइल2 को अधिलेखित कर दिया जाएगा। इसलिए, इस विकल्प का उपयोग करना है
अनुशंसित। SOX_OPTS (ऊपर), एक `शेल' उपनाम, स्क्रिप्ट, या बैच फ़ाइल एक हो सकती है
इसे स्थायी रूप से सक्षम करने का उचित तरीका।

--नॉर्म[=डीबी-स्तर]
स्वचालित रूप से आह्वान करें लाभ कतरन से बचाने और सामान्य करने के लिए प्रभाव
ऑडियो. उदाहरण के लिए
sox --norm infile -b 16 आउटफ़ाइल दर 44100 dither -s
के लिए आशुलिपि है
सॉक्स इनफाइल -बी 16 आउटफाइल गेन -एच रेट 44100 गेन -एनएच डिथर -एस
वैकल्पिक रूप से, ऑडियो को 0 dBFS से नीचे दिए गए स्तर (आमतौर पर) पर सामान्यीकृत किया जा सकता है:
sox --norm=-3 इनफ़ाइल आउटफ़ाइल

यह भी देखें -वी, -जी, और लाभ प्रभाव।

--प्ले-रेट-आर्ग ARG
'दर' प्रभाव स्वचालित रूप से लागू होने पर उपयोग किए जाने वाले गुणवत्ता विकल्प का चयन करता है
ऑडियो चलाते समय. यह विकल्प आमतौर पर के माध्यम से सेट किया जाता है SOX_OPTS वातावरण
परिवर्तनीय (ऊपर देखें)।

--भूखंड ग्नूप्लोट|सप्टक|बंद
यदि सेट नहीं है बंद (डिफ़ॉल्ट यदि --भूखंड नहीं दिया गया है), उस मोड में चलाएँ जो हो सकता है
सहायता के लिए, gnuplot प्रोग्राम या GNU ऑक्टेव प्रोग्राम के संयोजन में उपयोग किया जाता है
स्थानांतरण-फ़ंक्शन आधारित कई के चयन और कॉन्फ़िगरेशन के साथ
प्रभाव. पहले दिए गए प्रभाव के लिए जो चयनित प्लॉटिंग प्रोग्राम का समर्थन करता है,
SoX प्रभाव के स्थानांतरण फ़ंक्शन को प्लॉट करने के लिए कमांड आउटपुट करेगा, और फिर बाहर निकल जाएगा
वास्तव में किसी भी ऑडियो को संसाधित किए बिना। उदाहरण के लिए
sox --प्लॉट ऑक्टेव इनपुट-फ़ाइल -n हाईपास 1320 > हाईपास.पीएलटी
ऑक्टेव हाईपास.पीएलटी

-q, --नहीं-दिखाओ-प्रगति
जब SoX अन्यथा ऐसा न करे तो शांत मोड में चलाएँ। यह इसके विपरीत है
-S विकल्प.

-R 'दोहराने योग्य' मोड में चलाएँ। जब यह विकल्प दिया जाता है, जहां लागू हो, SoX करेगा
आउटपुट फ़ाइल में एक निश्चित टाइम-स्टैम्प एम्बेड करें (जैसे एआईएफएफ) और 'बीज' छद्म होगा
यादृच्छिक संख्या जनरेटर (उदा तड़पना) एक निश्चित संख्या के साथ, इस प्रकार यह सुनिश्चित होता है
समान इनपुट और समान मापदंडों के साथ क्रमिक SoX आमंत्रण से परिणाम मिलता है
वही आउटपुट.

--पुनःप्रदर्शन करना ट्रैक|एल्बम|बंद
चुनें कि इनपुट फ़ाइलों पर रीप्ले-गेन समायोजन लागू करना है या नहीं। डिफ़ॉल्ट
is बंद एसटी सॉक्स और ग्रामीण विद्युतीकरण निगम, एल्बम एसटी प्ले जहां (कम से कम) पहली दो इनपुट फ़ाइलें
समान कलाकार और एल्बम नामों के साथ टैग किए गए हैं, और ट्रैक एसटी प्ले अन्यथा।

-S, --शो-प्रगति
इनपुट फ़ाइल प्रारूप/हेडर जानकारी और प्रसंस्करण प्रगति को इनपुट के रूप में प्रदर्शित करें
फ़ाइल(फ़ाइलों) का प्रतिशत पूर्ण, बीता हुआ समय, और शेष समय (यदि ज्ञात हो; में दिखाया गया है
कोष्ठक), और आउटपुट फ़ाइल में लिखे गए नमूनों की संख्या। यह भी दिखाया गया है एक
पीक-लेवल मीटर, और एक संकेत कि क्या क्लिपिंग हुई है। शिखर स्तर का मीटर
अधिकतम दो चैनल दिखाता है और इसे डिजिटल ऑडियो के लिए निम्नानुसार कैलिब्रेट किया जाता है (दाएं)।
चैनल दिखाया गया):

dB FSD डिस्प्ले dB FSD डिस्प्ले
-25 - -11 ====
-23 = -9 =-
-21=--7=====
-19 == -5 =====-
-17 ==- -3 ======

-15 === -1 =====!
-13 ===-

डीबी में हेडरूम का तीन-सेकंड का पीक-होल्ड मान दाईं ओर दिखाया जाएगा
मीटर यदि यह 6dB से कम है।

ऑडियो चलाने या रिकॉर्ड करने के लिए SoX का उपयोग करते समय यह विकल्प डिफ़ॉल्ट रूप से सक्षम होता है।

-T के बराबर --मिलाना गुणा करना.

--अस्थायी निर्देशिका
निर्दिष्ट करें कि कोई भी अस्थायी फ़ाइल दिए गए में बनाई जानी चाहिए निर्देशिका। इस
यदि डिफ़ॉल्ट के साथ अनुमति या खाली स्थान की समस्या है तो यह उपयोगी हो सकता है
जगह। इस मामले में, ` का उपयोग करना--अस्थायी .' (वर्तमान निर्देशिका का उपयोग करने के लिए) अक्सर एक होता है
अच्छा समाधान।

--संस्करण
SoX का संस्करण क्रमांक दिखाएँ और बाहर निकलें।

-V[स्तर]
वाचालता सेट करें. यह विशेष रूप से यह देखने के लिए उपयोगी है कि कोई स्वचालित प्रभाव कैसे पड़ता है
SoX द्वारा लागू किया गया है।

SoX निम्नलिखित वर्बोसिटी के अनुसार कंसोल (stderr) पर संदेश प्रदर्शित करता है
स्तर:

0 कोई संदेश बिल्कुल नहीं दिखाया गया है; कोई त्रुटि है या नहीं यह निर्धारित करने के लिए निकास स्थिति का उपयोग करें
हो गया।

1 केवल त्रुटि संदेश दिखाए जाते हैं. यदि SoX पूरा नहीं हो पाता तो ये उत्पन्न होते हैं
अनुरोधित आदेश.

2 चेतावनी संदेश भी दिखाए गए हैं. यदि SoX पूरा कर सकता है तो ये उत्पन्न होते हैं
अनुरोधित आदेश, लेकिन बिल्कुल अनुरोधित आदेश के अनुसार नहीं
पैरामीटर, या यदि क्लिपिंग होती है।

SoX के प्रसंस्करण चरणों के 3 विवरण भी दिखाए गए हैं। देखने के लिए उपयोगी
वास्तव में SoX आपके ऑडियो को कैसे प्रोसेस कर रहा है।

4 और ऊपर
SoX को डीबग करने में सहायता के लिए संदेश भी दिखाए गए हैं।

डिफ़ॉल्ट रूप से, वर्बोसिटी स्तर 2 पर सेट है (त्रुटियों और चेतावनियों को दिखाता है)। प्रत्येक
की घटना -V विकल्प वर्बोसिटी स्तर को 1 से बढ़ा देता है। वैकल्पिक रूप से,
वर्बोसिटी स्तर को तुरंत बाद निर्दिष्ट करके एक निरपेक्ष संख्या पर सेट किया जा सकता है
la -V, उदा -V0 इसे 0 पर सेट करता है।

निवेश पट्टिका ऑप्शंस
ये विकल्प केवल इनपुट फ़ाइलों पर लागू होते हैं और केवल इनपुट फ़ाइल नामों से पहले हो सकते हैं
कमांड लाइन।

--अनदेखा-लंबाई
किसी ऑडियो फ़ाइल के हेडर में दी गई (गलत) ऑडियो लंबाई को ओवरराइड करें। यदि यह हो तो
विकल्प दिया गया है तो SoX तब तक ऑडियो पढ़ता रहेगा जब तक वह अंत तक नहीं पहुंच जाता
इनपुट फ़ाइल।

-v, --आयतन FACTOR
एकाधिक इनपुट फ़ाइलों को संयोजित करते समय उपयोग के लिए, यह विकल्प समायोजित करता है
फ़ाइल का वॉल्यूम जो कमांड लाइन पर एक कारक द्वारा इसका अनुसरण करता है FACTOR। इस
इसे अन्य इनपुट फ़ाइलों के साथ 'संतुलित' होने की अनुमति देता है। यह एक रैखिक है
(आयाम) समायोजन, इसलिए 1 से कम संख्या का आयतन और संख्या कम हो जाती है
1 से अधिक इसे बढ़ाता है। यदि कोई ऋणात्मक संख्या दी गई है तो इसके अतिरिक्त
वॉल्यूम समायोजन, ऑडियो सिग्नल उलटा हो जाएगा।

यह भी देखें आदर्श, वॉल, तथा लाभ प्रभाव, और देखो निवेश पट्टिका संतुलन ऊपर।

निवेश & उत्पादन पट्टिका प्रारूप ऑप्शंस
ये विकल्प उस इनपुट या आउटपुट फ़ाइल पर लागू होते हैं जिसके नाम के ठीक पहले वे आते हैं
कमांड लाइन और मुख्य रूप से हेडरलेस फ़ाइल स्वरूपों के साथ काम करते समय या कब उपयोग किया जाता है
आउटपुट फ़ाइल के लिए एक प्रारूप निर्दिष्ट करना जो इनपुट फ़ाइल से भिन्न हो।

-b बिट्स, --बिट्स बिट्स
प्रत्येक एन्कोडेड में बिट्स की संख्या (उर्फ बिट-गहराई या कभी-कभी शब्द-लंबाई)।
नमूना। एमपी3 या जीएसएम जैसे जटिल एन्कोडिंग पर लागू नहीं है। आवश्यक नहीं
ऐसे एन्कोडिंग के साथ जिनमें बिट्स की एक निश्चित संख्या होती है, उदाहरण के लिए A/μ-law, ADPCM।

किसी इनपुट फ़ाइल के लिए, इस विकल्प का सबसे आम उपयोग SoX को सूचित करना है
'कच्ची' ('हेडरलेस') ऑडियो फ़ाइल में प्रति नमूना बिट्स की संख्या। उदाहरण के लिए
sox -r 16k -e हस्ताक्षरित -b 8 इनपुट.रॉ आउटपुट.wav
एक विशेष 'कच्ची' फ़ाइल को स्व-वर्णन करने वाली 'WAV' फ़ाइल में परिवर्तित करता है।

आउटपुट फ़ाइल के लिए, इस विकल्प का उपयोग किया जा सकता है (संभवतः साथ में)। -e) सेट करने के लिए
आउटपुट एन्कोडिंग आकार। डिफ़ॉल्ट रूप से (अर्थात यदि यह विकल्प नहीं दिया गया है), आउटपुट
एन्कोडिंग आकार (बशर्ते यह आउटपुट फ़ाइल प्रकार द्वारा समर्थित हो) पर सेट किया जाएगा
इनपुट एन्कोडिंग आकार. उदाहरण के लिए
sox इनपुट.cdda -b 24 आउटपुट.wav
कच्चे सीडी डिजिटल ऑडियो (16-बिट, हस्ताक्षरित-पूर्णांक) को 24-बिट (हस्ताक्षरित-पूर्णांक) में परिवर्तित करता है
`WAV' फ़ाइल.

-1/-2/-3/-4/-8
प्रत्येक एन्कोडेड नमूने में बाइट्स की संख्या। के लिए पदावनत उपनाम -b 8, -b 16, -b
24, -b 32, -b 64 क्रमशः.

-c चैनलों, --चैनल चैनलों
ऑडियो फ़ाइल में ऑडियो चैनलों की संख्या. यह इससे बड़ी कोई भी संख्या हो सकती है
शून्य।

किसी इनपुट फ़ाइल के लिए, इस विकल्प का सबसे आम उपयोग SoX को सूचित करना है
'रॉ' ('हेडरलेस') ऑडियो फ़ाइल में चैनलों की संख्या। कभी-कभी, यह हो सकता है
ओवरराइड करने के लिए, 'हेडर' फ़ाइल के साथ इस विकल्प का उपयोग करना उपयोगी है
हेडर में (संभवतः गलत) मान - ध्यान दें कि यह केवल इसके साथ समर्थित है
कुछ फ़ाइल प्रकार. उदाहरण:
sox -r 48k -e फ्लोट -b 32 -c 2 इनपुट.रॉ आउटपुट.wav
एक विशेष 'कच्ची' फ़ाइल को स्व-वर्णन करने वाली 'WAV' फ़ाइल में परिवर्तित करता है।
प्ले-सी 1 म्यूजिक.वेव
फ़ाइल डेटा की व्याख्या एक ही चैनल से संबंधित के रूप में की जाती है, भले ही वह कुछ भी हो
फ़ाइल शीर्षलेख में दर्शाया गया है. ध्यान दें कि यदि फ़ाइल में वास्तव में दो हैं
चैनल, इसके परिणामस्वरूप फ़ाइल आधी गति से चलेगी।

आउटपुट फ़ाइल के लिए, यह विकल्प निर्दिष्ट करने के लिए एक शॉर्टहैंड प्रदान करता है
चैनलों की संख्या को बदलने (यदि आवश्यक हो) के लिए प्रभाव लागू किया जाना चाहिए
दिए गए नंबर पर ऑडियो सिग्नल में चैनल। उदाहरण के लिए, निम्नलिखित दो
आदेश समतुल्य हैं:
sox इनपुट.wav -c 1 आउटपुट.wav बास -b 24
sox इनपुट.wav आउटपुट.wav बास -बी 24 चैनल 1
हालाँकि दूसरा रूप अधिक लचीला है क्योंकि यह प्रभावों को व्यवस्थित करने की अनुमति देता है
मनमाने ढंग से।

-e एन्कोडिंग, --एन्कोडिंग एन्कोडिंग
ऑडियो एन्कोडिंग प्रकार. कभी-कभी फ़ाइल-प्रकारों की आवश्यकता होती है जो इससे अधिक का समर्थन करते हैं
एक एन्कोडिंग प्रकार. उदाहरण के लिए, कच्चे, WAV, या AU के साथ (लेकिन नहीं, उदाहरण के लिए, के साथ
एमपी3 या एफएलएसी)। उपलब्ध एन्कोडिंग प्रकार इस प्रकार हैं:

हस्ताक्षरित-पूर्णांक
पीसीएम डेटा को हस्ताक्षरित (`दो के पूरक') पूर्णांक के रूप में संग्रहीत किया जाता है। आमतौर पर इसके साथ प्रयोग किया जाता है
16 या 24-बिट एन्कोडिंग आकार। 0 का मान न्यूनतम सिग्नल को दर्शाता है
शक्ति।

अहस्ताक्षरित-पूर्णांक
पीसीएम डेटा अहस्ताक्षरित पूर्णांक के रूप में संग्रहीत है। आमतौर पर 8-बिट एन्कोडिंग के साथ उपयोग किया जाता है
आकार। 0 का मान अधिकतम सिग्नल शक्ति को दर्शाता है।

तैरनेवाला स्थल
पीसीएम डेटा को आईईईई 753 सिंगल प्रिसिजन (32-बिट) या डबल प्रिसिजन के रूप में संग्रहीत किया जाता है
(64-बिट) फ़्लोटिंग-पॉइंट ('वास्तविक') संख्याएँ। 0 का मान न्यूनतम दर्शाता है
संकेत शक्ति.

एक कानून 8 बिट प्रति लॉगरिदमिक एन्कोडिंग के लिए अंतर्राष्ट्रीय टेलीफोनी मानक
नमूना। इसकी परिशुद्धता लगभग 13-बिट पीसीएम के बराबर है और है
कभी-कभी उल्टे बिट-ऑर्डरिंग के साथ एन्कोड किया जाता है (देखें)। -X विकल्प)।

यू-लॉ, म्यू कानून
8 बिट प्रति लॉगरिदमिक एन्कोडिंग के लिए उत्तर अमेरिकी टेलीफोनी मानक
नमूना। उर्फ μ-कानून. इसकी परिशुद्धता लगभग 14-बिट पीसीएम के बराबर है
और कभी-कभी इसे उल्टे बिट-ऑर्डरिंग के साथ एन्कोड किया जाता है (देखें)। -X विकल्प)।

ओकी-एडीपीसीएम
ओकेआई (उर्फ वोक्स, डायलॉगिक, या इंटेल) 4-बिट एडीपीसीएम; इसमें एक परिशुद्धता है
लगभग 12-बिट पीसीएम के बराबर। ADPCM ऑडियो कम्प्रेशन का एक रूप है
इसमें ऑडियो गुणवत्ता और एन्कोडिंग/डिकोडिंग गति के बीच अच्छा समझौता है।

आईएमए-ADPCM
आईएमए (उर्फ डीवीआई) 4-बिट एडीपीसीएम; इसकी परिशुद्धता मोटे तौर पर बराबर है
13-बिट पीसीएम।

एमएस-एडीपीसीएम
माइक्रोसॉफ्ट 4-बिट एडीपीसीएम; इसकी परिशुद्धता लगभग 14-बिट पीसीएम के बराबर है।

जीएसएम-पूर्ण-दर
जीएसएम का उपयोग वर्तमान में दुनिया के अधिकांश डिजिटल वायरलेस के लिए किया जाता है
टेलीफोन के फोन। यह विभिन्न बिट-रेट के साथ कई ऑडियो प्रारूपों का उपयोग करता है
और संबंधित भाषण गुणवत्ता। SoX के पास GSM के मूल 13kbps के लिए समर्थन है
'पूर्ण दर' ऑडियो प्रारूप। जीएसएम के साथ काम करना आमतौर पर सीपीयू-गहन होता है
ऑडियो।

एन्कोडिंग नामों को संक्षिप्त किया जा सकता है जहां यह अस्पष्ट नहीं होगा; उदाहरण के लिए
'अहस्ताक्षरित-पूर्णांक' को 'अन' के रूप में दिया जा सकता है, लेकिन 'यू' के रूप में नहीं ('यू-लॉ' के साथ अस्पष्ट)।

किसी इनपुट फ़ाइल के लिए, इस विकल्प का सबसे आम उपयोग SoX को सूचित करना है
`रॉ' (`हेडरलेस') ऑडियो फ़ाइल की एन्कोडिंग (उदाहरण देखें)। -b और -c
ऊपर)।

आउटपुट फ़ाइल के लिए, इस विकल्प का उपयोग किया जा सकता है (संभवतः साथ में)। -b) सेट करने के लिए
उदाहरण के लिए आउटपुट एन्कोडिंग प्रकार
sox इनपुट.cdda -e फ्लोट आउटपुट1.wav

sox इनपुट.cdda -b 64 -e फ़्लोट आउटपुट2.wav
कच्चे सीडी डिजिटल ऑडियो (16-बिट, हस्ताक्षरित-पूर्णांक) को फ्लोटिंग-पॉइंट 'डब्ल्यूएवी' फाइलों में परिवर्तित करें
(क्रमशः एकल और दोहरी परिशुद्धता)।

डिफ़ॉल्ट रूप से (अर्थात यदि यह विकल्प नहीं दिया गया है), तो आउटपुट एन्कोडिंग प्रकार होगा
(बशर्ते यह आउटपुट फ़ाइल प्रकार द्वारा समर्थित हो) इनपुट एन्कोडिंग पर सेट किया जाए
प्रकार।

-s/-u/-f/-A/-U/-o/-i/-a/-g
एन्कोडिंग प्रकार निर्दिष्ट करने के लिए अप्रचलित उपनाम हस्ताक्षरित-पूर्णांक, अहस्ताक्षरित-
पूर्णांक, तैरनेवाला स्थल, एक कानून, म्यू कानून, ओकी-एडीपीसीएम, आईएमए-ADPCM, एमएस-एडीपीसीएम, जीएसएम-पूर्ण-
दर क्रमशः (देखें -e ऊपर)।

--नो-ग्लोब
निर्दिष्ट करता है कि फ़ाइल नाम `ग्लोबिंग' (वाइल्ड-कार्ड मिलान) द्वारा निष्पादित नहीं किया जाना चाहिए
निम्नलिखित फ़ाइल नाम पर SoX. उदाहरण के लिए, यदि वर्तमान निर्देशिका में शामिल है
फिर दो फ़ाइलें `पाँच-सेकंड.wav' और `पाँच*.wav'
प्ले--नो-ग्लोब "फाइव*.वेव"
केवल एक फ़ाइल `पांच*.wav' को चलाने के लिए उपयोग किया जा सकता है।

-आर, --भाव दर[k]
फ़ाइल का नमूना दर Hz (या यदि `k' के साथ जोड़ा जाए तो kHz) में देता है।

किसी इनपुट फ़ाइल के लिए, इस विकल्प का सबसे आम उपयोग SoX को सूचित करना है
'रॉ' ('हेडरलेस') ऑडियो फ़ाइल की नमूना दर (उदाहरण देखें)। -b और -c
ऊपर)। कभी-कभी 'हेडरेड' फ़ाइल के साथ इस विकल्प का उपयोग करना उपयोगी हो सकता है,
हेडर में (संभवतः गलत) मान को ओवरराइड करने के लिए - ध्यान दें
यह केवल कुछ फ़ाइल प्रकारों के साथ समर्थित है। उदाहरण के लिए, यदि ऑडियो रिकॉर्ड किया गया था
एक स्रोत से 48k की नमूना-दर के साथ, जिसने थोड़ा पीछे खेला, मान लीजिए 1.5%,
फिर, बहुत धीरे-धीरे
sox -r 48720 इनपुट.wav आउटपुट.wav
केवल फ़ाइल हेडर को बदलकर गति को प्रभावी ढंग से ठीक करता है (लेकिन यह भी देखें)।
गति इस समस्या के अधिक सामान्य समाधान के लिए प्रभाव)।

आउटपुट फ़ाइल के लिए, यह विकल्प निर्दिष्ट करने के लिए एक शॉर्टहैंड प्रदान करता है दर
(यदि आवश्यक हो) नमूना दर को बदलने के लिए प्रभाव लागू किया जाना चाहिए
दिए गए मान पर ऑडियो सिग्नल। उदाहरण के लिए, निम्नलिखित दो आदेश हैं
समकक्ष:
sox इनपुट.wav -r 48k आउटपुट.wav बास -b 24
sox इनपुट.wav आउटपुट.wav बास -बी 24 रेट 48k
हालाँकि दूसरा रूप अधिक लचीला है क्योंकि यह अनुमति देता है दर दिए जाने वाले विकल्प, और
प्रभावों को मनमाने ढंग से आदेशित करने की अनुमति देता है।

-t, --प्रकार फाइल का प्रकार
ऑडियो फ़ाइल का प्रकार देता है. इनपुट और आउटपुट दोनों फ़ाइलों के लिए, यह विकल्प है
आमतौर पर SoX को `हेडरलेस' ऑडियो फ़ाइल (उदाहरण के लिए रॉ, एमपी 3) के प्रकार की जानकारी देने के लिए उपयोग किया जाता है
जहां किसी दिए गए फ़ाइल नाम एक्सटेंशन से वास्तविक/वांछित प्रकार निर्धारित नहीं किया जा सकता है।
उदाहरण के लिए:
अन्य-आदेश | sox -t mp3 - आउटपुट.wav

sox इनपुट.wav -t कच्चा आउटपुट.बिन
इसका उपयोग इनपुट फ़ाइल नाम एक्सटेंशन द्वारा निहित प्रकार को ओवरराइड करने के लिए भी किया जा सकता है,
लेकिन यदि हेडर वाले प्रकार के साथ ओवरराइडिंग की जाती है, तो SoX उपयुक्त के साथ बाहर निकल जाएगा
यदि ऐसा हेडर वास्तव में मौजूद नहीं है तो त्रुटि संदेश।

देख soxformat(7) समर्थित फ़ाइल प्रकारों की सूची के लिए।

-L, --एंडियन थोड़ा
-B, --एंडियन बड़ा
-x, --एंडियन विनिमय
ये विकल्प निर्दिष्ट करते हैं कि ऑडियो डेटा का बाइट-ऑर्डर क्रमशः है या नहीं,
'लिटिल एंडियन', 'बिग एंडियन', या उस सिस्टम के विपरीत जिस पर SoX है
उपयोग किया जा रहा है। एंडियननेस केवल फ़्लोटिंग-पॉइंट, या के रूप में एन्कोड किए गए डेटा पर लागू होता है
16 या अधिक बिट्स के हस्ताक्षरित या अहस्ताक्षरित पूर्णांक। इसे निर्दिष्ट करना अक्सर आवश्यक होता है
हेडरलेस फ़ाइलों के लिए इन विकल्पों में से एक, और कभी-कभी (अन्यथा) के लिए आवश्यक
स्व-वर्णन फ़ाइलें। किसी इनपुट के लिए दिए गए एंडियन-सेटिंग विकल्प को अनदेखा किया जा सकता है
फ़ाइल जिसके हेडर में एक विशिष्ट एंडियननेस पहचानकर्ता होता है, या आउटपुट फ़ाइल के लिए
वह वास्तव में एक ऑडियो डिवाइस है.

एनबी अन्य प्रारूप विशेषताओं के विपरीत, एंडियननेस (बाइट, निबल और बिट
इनपुट फ़ाइल का ऑर्डरिंग) आउटपुट फ़ाइल के लिए स्वचालित रूप से उपयोग नहीं किया जाता है; अभीतक के लिए तो
उदाहरण के लिए, जब निम्नलिखित को लिटिल-एंडियन सिस्टम पर चलाया जाता है:
sox -B audio.s16 trimed.s16 trim 2
ट्रिम्ड.एस16 को लिटिल-एंडियन के रूप में बनाया जाएगा;
sox -B audio.s16 -B trimed.s16 trim 2
आउटपुट फ़ाइल में big-endianness को संरक्षित करने के लिए इसका उपयोग किया जाना चाहिए।

RSI -V विकल्प का उपयोग चयनित ऑर्डरों की जांच करने के लिए किया जा सकता है।

-N, --रिवर्स-निबल्स
निर्दिष्ट करता है कि नमूनों का निबल ऑर्डर (यानी एक बाइट के 2 हिस्से)।
उलटा होना चाहिए; कभी-कभी एडीपीसीएम-आधारित प्रारूपों के साथ उपयोगी।

एनबी अनुभाग में एनबी भी देखें -x ऊपर।

-X, --रिवर्स-बिट्स
निर्दिष्ट करता है कि नमूनों का बिट क्रम उलट दिया जाना चाहिए; कभी-कभी उपयोगी
कुछ (अधिकतर हेडर रहित) प्रारूपों के साथ।

एनबी अनुभाग में एनबी भी देखें -x ऊपर।

उत्पादन पट्टिका प्रारूप ऑप्शंस
ये विकल्प केवल आउटपुट फ़ाइल पर लागू होते हैं और केवल आउटपुट फ़ाइल नाम से पहले हो सकते हैं
कमांड लाइन।

--टिप्पणी जोड़ना पाठ
आउटपुट फ़ाइल हेडर में एक टिप्पणी जोड़ें (जहां लागू हो)।

--टिप्पणी पाठ
आउटपुट फ़ाइल हेडर (जहां लागू हो) में स्टोर करने के लिए टिप्पणी टेक्स्ट निर्दिष्ट करें।

यदि यह विकल्प (या) SoX एक डिफ़ॉल्ट टिप्पणी प्रदान करेगा --टिप्पणी-फ़ाइल) नहीं दिया गया है.
यह निर्दिष्ट करने के लिए कि आउटपुट फ़ाइल में कोई टिप्पणी संग्रहीत नहीं होनी चाहिए, उपयोग करें --टिप्पणी "" .

--टिप्पणी-फ़ाइल फ़ाइल का नाम
आउटपुट फ़ाइल हेडर में संग्रहीत करने के लिए टिप्पणी टेक्स्ट वाली फ़ाइल निर्दिष्ट करें
(जहां लागू)।

-C, --संपीड़न FACTOR
आउटपुट फ़ाइल स्वरूपों को परिवर्तनशील रूप से संपीड़ित करने के लिए संपीड़न कारक। यदि यह हो तो
विकल्प नहीं दिया गया है तो एक डिफ़ॉल्ट संपीड़न कारक लागू होगा। संपीड़न
विभिन्न संपीड़ित फ़ाइल स्वरूपों के लिए कारक की अलग-अलग व्याख्या की जाती है। देखें
उन फ़ाइल स्वरूपों का विवरण जिनमें इस विकल्प का उपयोग किया जाता है soxformat(7) अधिक के लिए
जानकारी.

प्रभाव


ऑडियो फ़ाइलों को परिवर्तित करने, चलाने और रिकॉर्ड करने के अलावा, SoX का उपयोग a को लागू करने के लिए किया जा सकता है
ऑडियो `प्रभावों' की संख्या. एकाधिक प्रभावों को एक के बाद एक निर्दिष्ट करके लागू किया जा सकता है
SoX कमांड लाइन के अंत में एक और, एक `प्रभाव श्रृंखला' बनाता है। ध्यान दें कि
वास्तविक समय में (अर्थात् ऑडियो चलाते समय) एकाधिक प्रभाव लागू करने की आवश्यकता होने की संभावना है
उच्च प्रदर्शन कंप्यूटर. अन्य एप्लिकेशन को रोकने से प्रदर्शन संबंधी समस्याएं कम हो सकती हैं
क्या उन्हें घटित होना चाहिए.

SoX प्रभावों में से कुछ का उद्देश्य मुख्य रूप से एक ही उपकरण पर लागू करना है
`आवाज'. इसे सुविधाजनक बनाने के लिए, रीमिक्स प्रभाव और वैश्विक SoX विकल्प -M करने के लिए इस्तेमाल किया जा सकता है
मल्टी-ट्रैक रिकॉर्डिंग से ट्रैक को अलग करें और फिर पुनः संयोजित करें।

विभिन्न प्रभाव चेन
एक एकल प्रभाव श्रृंखला एक या अधिक प्रभावों से बनी होती है। इनपुट से ऑडियो चलता है
श्रृंखला के माध्यम से जब तक या तो इनपुट फ़ाइल के अंत तक नहीं पहुंच जाता या उसमें कोई प्रभाव नहीं पड़ता
श्रृंखला श्रृंखला को समाप्त करने का अनुरोध करती है।

SoX इनपुट ऑडियो पर एकाधिक प्रभाव श्रृंखला चलाने का समर्थन करता है। इस मामले में, जब एक
चेन इंगित करती है कि ऑडियो प्रोसेसिंग पूरी हो गई है, फिर ऑडियो डेटा अगले के माध्यम से भेजा जाता है
प्रभाव श्रृंखला. यह तब तक जारी रहता है जब तक या तो कोई और प्रभाव श्रृंखला मौजूद नहीं होती या इनपुट मौजूद नहीं होता
फ़ाइल के अंत तक पहुँच गया.

एक प्रभाव श्रृंखला को रखकर समाप्त किया जाता है : (कोलन) एक प्रभाव के बाद। कोई निम्नलिखित
प्रभाव एक नई प्रभाव श्रृंखला का हिस्सा हैं।

उस प्रभाव को पहले प्रभाव के रूप में रखना महत्वपूर्ण है जो श्रृंखला को रोक देगा
ज़ंजीर। इसका कारण यह है कि कोई भी नमूना जो बाईं ओर के प्रभावों से बफ़र किया गया है
समाप्ति प्रभाव ख़ारिज कर दिया जाएगा. छोड़े गए नमूनों की मात्रा से संबंधित है
--बफर विकल्प और इसे नमूना दर के सापेक्ष छोटा रखा जाना चाहिए, यदि
समाप्ति प्रभाव पहले नहीं हो सकता. रोकने के प्रभावों के बारे में अधिक जानकारी पाई जा सकती है
में रोक सॉक्स अनुभाग।

कुछ छद्म प्रभाव हैं जो एकाधिक प्रभाव श्रृंखलाओं का उपयोग करने में सहायता करते हैं। इसमे शामिल है
नई फ़ाइल जो अगले प्रभावों पर जाने से पहले एक नई आउटपुट फ़ाइल पर लिखना शुरू कर देगा
श्रृंखला और पुनः प्रारंभ जो प्रथम प्रभाव श्रृंखला में वापस चला जाएगा। छद्म-प्रभाव होना ही चाहिए
एक श्रृंखला में पहले प्रभाव के रूप में और एक श्रृंखला में एकमात्र प्रभाव के रूप में निर्दिष्ट (उन्हें होना ही चाहिए)।
a : उनके निर्दिष्ट होने से पहले और बाद में)।

निम्नलिखित एकाधिक प्रभाव श्रृंखलाओं का एक उदाहरण है। यह इनपुट फ़ाइल को विभाजित कर देगा
30 सेकंड की लंबाई वाली एकाधिक फ़ाइलें। प्रत्येक आउटपुट फ़ाइल नाम में अद्वितीय संख्या होगी
इसका नाम दस्तावेज़ में दर्ज है उत्पादन फ़ाइलें अनुभाग।
sox infile.wav आउटपुट.wav ट्रिम 0 30: नई फ़ाइल: पुनरारंभ करें

सामान्य नोटेशन तथा पैरामीटर्स
निम्नलिखित विवरणों में, कोष्ठक [] का उपयोग उन मापदंडों को दर्शाने के लिए किया जाता है जो हैं
वैकल्पिक, ब्रेसिज़ { } उन्हें इंगित करने के लिए जो वैकल्पिक और दोहराने योग्य और कोण दोनों हैं
कोष्ठक < > उन्हें दर्शाने के लिए जो दोहराए जाने योग्य हैं लेकिन वैकल्पिक नहीं हैं। जहां लागू,
वैकल्पिक मापदंडों के लिए डिफ़ॉल्ट मान कोष्ठक () में दिखाए गए हैं।

निम्नलिखित मापदंडों का उपयोग कई प्रभावों के साथ किया जाता है और उनका अर्थ समान होता है:

केंद्र[k]
देख आवृत्ति.

आवृत्ति[k]
हर्ट्ज़ में एक आवृत्ति, या, यदि 'k' के साथ जोड़ा जाए, तो kHz।

लाभ डीबी में एक शक्ति लाभ. शून्य कोई लाभ नहीं देता; शून्य से कम क्षीणन देता है।

चौडाई[h|k|o|q]
फ़िल्टर की बैंड-चौड़ाई निर्दिष्ट करने के लिए उपयोग किया जाता है। करने के लिए विभिन्न तरीकों की एक संख्या
निर्दिष्ट करें कि चौड़ाई उपलब्ध है (हालाँकि प्रत्येक प्रभाव के लिए सभी नहीं)। निम्न में से एक
दिखाए गए वर्णों को वांछित विधि का चयन करने के लिए निम्नानुसार जोड़ा जा सकता है:

विधि नोट्स
h Hz
k किलोहर्ट्ज़
o सप्तक
q क्यू-कारक देखें [2]

इस पैरामीटर का उपयोग करने वाले प्रत्येक प्रभाव के लिए, डिफ़ॉल्ट विधि (यानी यदि कोई वर्ण नहीं है
संलग्न है) वह है जिसे प्रभाव की पहली पंक्ति में सबसे पहले सूचीबद्ध किया गया है
विवरण।

यह देखने के लिए कि क्या SoX के पास वैकल्पिक प्रभाव के लिए समर्थन है, दर्ज करें सॉक्स -h और नीचे इसका नाम खोजें
सूची: 'प्रभाव'।

समर्थित प्रभाव
नोट: प्रभावों की एक वर्गीकृत सूची संलग्न 'README' फ़ाइल में पाई जा सकती है।

सभी उत्तीर्ण आवृत्ति[k] चौडाई[h|k|o|q]
केंद्रीय आवृत्ति (हर्ट्ज में) के साथ दो-पोल ऑल-पास फ़िल्टर लागू करें आवृत्ति, तथा
फ़िल्टर-चौड़ाई चौडाई. एक ऑल-पास फ़िल्टर ऑडियो की आवृत्ति को चरण में बदल देता है
इसकी आवृत्ति को आयाम संबंध में बदले बिना संबंध। फ़िल्टर
[1] में विस्तार से वर्णित है।

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

बैंड [-n] केंद्र[k] [चौडाई[h|k|o|q]]
बैंड-पास फ़िल्टर लागू करें. आवृत्ति प्रतिक्रिया लघुगणकीय रूप से चारों ओर गिरती है
केंद्र आवृत्ति। चौडाई पैरामीटर ड्रॉप का ढलान देता है।
आवृत्तियों पर केंद्र + चौडाई और केंद्र - चौडाई उनके मूल का आधा होगा
आयाम बैंड डिफ़ॉल्ट रूप से पिच किए गए ऑडियो, यानी आवाज पर उन्मुख एक मोड होता है,
गायन, या वाद्य संगीत. -n (शोर के लिए) विकल्प वैकल्पिक मोड का उपयोग करता है
अन-पिच ऑडियो के लिए (जैसे पर्कशन)। चेतावनी: -n की शक्ति-लाभ का परिचय देता है
फ़िल्टर में लगभग 11dB, इसलिए आउटपुट क्लिपिंग से सावधान रहें। बैंड शोर का परिचय देता है
फ़िल्टर का आकार, अर्थात शिखर पर केंद्र आवृत्ति और चारों ओर बसना
यह।

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

यह भी देखें ईमानदारी से तेज़ कंधों वाले बैंडपास फ़िल्टर के लिए।

बैंडपास|बैंडरेजेक्ट [-c] आवृत्ति[k] चौडाई[h|k|o|q]
केंद्रीय आवृत्ति के साथ दो-पोल बटरवर्थ बैंड-पास या बैंड-अस्वीकार फ़िल्टर लागू करें
आवृत्ति, और (3डीबी-बिंदु) बैंड-चौड़ाई चौडाई-c विकल्प केवल पर लागू होता है
बैंडपास और डिफ़ॉल्ट के बजाय एक स्थिर स्कर्ट लाभ (पीक गेन = क्यू) का चयन करता है:
निरंतर 0dB शिखर लाभ। फ़िल्टर 6dB प्रति ऑक्टेव (20dB प्रति दशक) पर बंद हो जाते हैं
और [1] में विस्तार से वर्णित है।

ये प्रभाव समर्थन करते हैं --भूखंड वैश्विक विकल्प.

यह भी देखें ईमानदारी से तेज़ कंधों वाले बैंडपास फ़िल्टर के लिए।

बैंडरेजेक्ट आवृत्ति[k] चौडाई[h|k|o|q]
बैंड-रिजेक्ट फ़िल्टर लागू करें. का विवरण देखें बैंडपास के लिए प्रभाव
विवरण।

बास|तिहरा लाभ [आवृत्ति[k] [चौडाई[s|h|k|o|q]]]
का उपयोग करके ऑडियो की बास (निचली) या तिगुनी (ऊपरी) आवृत्तियों को बढ़ाएं या काटें
मानक हाई-फाई के समान प्रतिक्रिया के साथ दो-पोल शेल्विंग फ़िल्टर
स्वर-नियंत्रण. इसे शेल्विंग इक्वलाइज़ेशन (ईक्यू) के रूप में भी जाना जाता है।

लाभ 0 हर्ट्ज पर लाभ देता है (के लिए) बास), या जो भी ∼22 kHz से कम हो
नाइक्विस्ट आवृत्ति (के लिए) तिहरा). इसकी उपयोगी सीमा लगभग -20 (बड़े के लिए) है
कटौती) से +20 (बड़ी वृद्धि के लिए)। सावधान रहो कतरन सकारात्मक का उपयोग करते समय लाभ.

यदि वांछित है, तो निम्नलिखित वैकल्पिक मापदंडों का उपयोग करके फ़िल्टर को ठीक किया जा सकता है:

आवृत्ति फ़िल्टर की केंद्रीय आवृत्ति सेट करता है और इसलिए इसका उपयोग विस्तार करने के लिए किया जा सकता है
बढ़ाए जाने या काटे जाने वाली आवृत्ति रेंज को कम करें। डिफ़ॉल्ट मान 100 हर्ट्ज़ है (के लिए)।
बास) या 3 kHz (के लिए) तिहरा).

चौडाई यह निर्धारित करता है कि फ़िल्टर का शेल्फ संक्रमण कितना तेज़ है। निम्न के अलावा
ऊपर वर्णित सामान्य चौड़ाई विनिर्देश विधियाँ, `ढलान' (डिफ़ॉल्ट, या यदि
के साथ जोड़ा गयाs') उपयोग किया जा सकता है। 'ढलान' की उपयोगी सीमा लगभग 0.3 है
तीव्र ढलान के लिए, सौम्य ढलान, 1 (अधिकतम) तक; डिफ़ॉल्ट मान 0.5 है.

फ़िल्टर का वर्णन [1] में विस्तार से किया गया है।

ये प्रभाव समर्थन करते हैं --भूखंड वैश्विक विकल्प.

यह भी देखें तुल्यकारक चरम समकारी प्रभाव के लिए.

मोड़ [-f फ्रेम रेट(25)] [-o अति-नमूना(16)] { देरी,सेंट,अवधि }
निर्दिष्ट समय पर निर्दिष्ट मात्रा के अनुसार पिच बदलता है। प्रत्येक दिया गया त्रिगुण:
देरी,सेंट,अवधि एक मोड़ निर्दिष्ट करता है। देरी के बाद का समय है
ऑडियो स्ट्रीम की शुरुआत, या पिछले मोड़ का अंत, जहां से शुरू करना है
पिच को झुकाना; सेंट सेंट की संख्या है (100 सेंट = 1 सेमीटोन) जिसके द्वारा
पिच को मोड़ना, और अवधि समय की वह अवधि जिस पर पिच होगी
कर रहे हैं।

पिच-बेंडिंग एल्गोरिदम असतत फूरियर ट्रांसफॉर्म (डीएफटी) का उपयोग करता है
विशेष फ़्रेम दर और ओवर-सैंपलिंग दर। -f और -o पैरामीटर्स का उपयोग किया जा सकता है
इन मापदंडों को समायोजित करने के लिए और इस प्रकार पिच में परिवर्तन की सहजता को नियंत्रित करने के लिए।

उदाहरण के लिए, एक प्रारंभिक स्वर उत्पन्न होता है, फिर तीन बार मुड़ता है, जिससे चार प्राप्त होते हैं
कुल मिलाकर अलग-अलग नोट:
प्ले-एन सिंथ 2.5 सिन 667 गेन 1
bend .35,180,.25 .15,740,.53 0,-520,.3
ध्यान दें कि इस उदाहरण में जो क्लिपिंग तैयार की गई है वह जानबूझकर है; दूर करना
यह, उपयोग करें लाभ -5 जगह की में लाभ 1.

यह भी देखें पिच.

बिकाड b0 b1 b2 a0 a1 a2
दिए गए गुणांकों के साथ एक बाइक्वाड IIR फ़िल्टर लागू करें। जहां b* और a* हैं
क्रमशः अंश और हर गुणांक।

देख http://en.wikipedia.org/wiki/Digital_biquad_filter (जहाँ a0 = 1).

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

चैनलों चैनलों
ऑडियो सिग्नल में चैनलों की संख्या बदलने के लिए एक सरल एल्गोरिदम लागू करें
दिया गया नंबर चैनलों: यदि चैनलों की संख्या कम हो रही है तो मिश्रण करना या
चैनलों की संख्या बढ़ाने पर डुप्लिकेटिंग।

RSI चैनलों यदि SoX है तो प्रभाव स्वचालित रूप से लागू हो जाता है -c विकल्प एक संख्या निर्दिष्ट करता है
उन चैनलों की संख्या जो इनपुट फ़ाइल(फ़ाइलों) से भिन्न हैं। वैकल्पिक रूप से, यदि यह
प्रभाव स्पष्ट रूप से दिया गया है, फिर SoX का -c विकल्प देने की आवश्यकता नहीं है. उदाहरण के लिए,
निम्नलिखित दो आदेश समतुल्य हैं:
sox इनपुट.wav -c 1 आउटपुट.wav बास -b 24
sox इनपुट.wav आउटपुट.wav बास -बी 24 चैनल 1
हालाँकि दूसरा रूप अधिक लचीला है क्योंकि यह प्रभावों को व्यवस्थित करने की अनुमति देता है
मनमाने ढंग से।

यह भी देखें रीमिक्स एक ऐसे प्रभाव के लिए जो चैनलों को मनमाने ढंग से मिश्रित/चयन करने की अनुमति देता है।

कोरस इसमे मुनाफा होना लाभ बाहर <देरी क्षय गति गहराई -s|-t>
ऑडियो में कोरस प्रभाव जोड़ें. यह एक स्वर जैसी ध्वनि उत्पन्न कर सकता है
कोरस, लेकिन इसे वाद्ययंत्रण पर भी लागू किया जा सकता है।

कोरस थोड़े विलंब के साथ प्रतिध्वनि प्रभाव जैसा दिखता है, लेकिन प्रतिध्वनि में विलंब होता है
स्थिर है, कोरस के साथ, इसे साइनसॉइडल या त्रिकोणीय मॉड्यूलेशन का उपयोग करके विविध किया जाता है।
मॉड्यूलेशन गहराई उस सीमा को परिभाषित करती है जिसे मॉड्यूलेटेड विलंब से पहले खेला जाता है
देरी के बाद. अत: विलंबित ध्वनि धीमी या तेज सुनाई देगी, यही है
विलंबित ध्वनि को मूल ध्वनि के इर्द-गिर्द ट्यून किया जाता है, जैसे कोरस में जहां कुछ स्वर होते हैं
कुंजी से थोड़ा हटकर। कोरस प्रभाव की अधिक चर्चा के लिए [3] देखें।

प्रत्येक चार-टुपल पैरामीटर विलंब/क्षय/गति/गहराई मिलीसेकंड में विलंब देता है
और गहराई का उपयोग करके हर्ट्ज में मॉड्यूलेशन गति के साथ क्षय (गेन-इन के सापेक्ष)।
मिलीसेकंड. मॉड्यूलेशन या तो साइनसोइडल है (-s) या त्रिकोणीय (-t). पाना-
आउट आउटपुट का आयतन है।

एक सामान्य देरी लगभग 40 एमएस से 60 एमएस है; मॉड्यूलेशन गति 0.25Hz के पास सर्वोत्तम है
और मॉड्यूलेशन गहराई लगभग 2ms। उदाहरण के लिए, एक एकल विलंब:
गिटार बजाओ1.wav कोरस 0.7 0.9 55 0.4 0.25 2 -t
मूल नमूनों की दो देरी:
गिटार बजाओ1.wav कोरस 0.6 0.9 50 0.4 0.25 2 -t
60 0.32 0.4 1.3 -एस
एक पूर्ण ध्वनि वाला कोरस (तीन अतिरिक्त विलंबों के साथ):
गिटार बजाओ1.wav कोरस 0.5 0.9 50 0.4 0.25 2 -t
60 0.32 0.4 2.3 -टी 40 0.3 0.3 1.3 -एस

कंपंड हल्ला ०३ ९,क्षय1{,हल्ला ०३ ९,क्षय2}
[नरम-घुटना-डीबी:]इन-डीबी1[,आउट-dB1]{,इन-डीबी2,आउट-dB2}
[लाभ [प्रारंभिक-मात्रा-डीबी [देरी]]]

ऑडियो की गतिशील रेंज को संयोजित (संपीड़ित या विस्तारित) करें।

RSI आक्रमण और क्षय पैरामीटर (सेकंड में) उस समय को निर्धारित करते हैं जिस पर
इसकी मात्रा निर्धारित करने के लिए इनपुट सिग्नल के तात्कालिक स्तर का औसत निकाला जाता है;
आक्रमण का तात्पर्य मात्रा में वृद्धि से है और क्षय का तात्पर्य घटने से है। अधिकांश के लिए
स्थितियों में, आक्रमण का समय (संगीत के तेज़ होने पर प्रतिक्रिया) होना चाहिए
क्षय समय से कम क्योंकि मानव कान अचानक तेज़ आवाज़ के प्रति अधिक संवेदनशील होता है
अचानक नरम संगीत की तुलना में संगीत. जहां आक्रमण/क्षय मापदंडों की एक से अधिक जोड़ी हो
निर्दिष्ट हैं, प्रत्येक इनपुट चैनल को अलग से संयोजित किया गया है और जोड़े की संख्या
इनपुट चैनलों की संख्या से सहमत होना चाहिए। विशिष्ट मूल्य हैं 0.3,0.8 सेकंड.

दूसरा पैरामीटर कंपाउंडर के ट्रांसफर फ़ंक्शन पर बिंदुओं की एक सूची है
अधिकतम संभव सिग्नल आयाम के सापेक्ष डीबी में निर्दिष्ट। इनपुट
मान सख्ती से बढ़ते क्रम में होने चाहिए लेकिन स्थानांतरण फ़ंक्शन ऐसा नहीं करता है
नीरस रूप से ऊपर उठना होगा। यदि छोड़ दिया जाए तो का मान आउट-dB1 के लिए चूक
के समान मूल्य इन-डीबी1; नीचे का स्तर इन-डीबी1 संयोजित नहीं हैं (लेकिन लाभ हो सकता है
उन पर लागू) बिंदु 0,0 मान लिया गया है लेकिन इसे ओवरराइड किया जा सकता है (द्वारा)। 0,आउट-डीबीएन).
यदि सूची के पहले a नरम-घुटना-डीबी मान, फिर वे बिंदु जहां आसन्न हैं
ट्रांसफर फ़ंक्शन मीट पर लाइन सेगमेंट को दी गई राशि से पूर्णांकित किया जाएगा।
स्थानांतरण फ़ंक्शन के लिए विशिष्ट मान हैं 6:-70,-60,-20.

तीसरा (वैकल्पिक) पैरामीटर डीबी में एक अतिरिक्त लाभ है जिसे बिल्कुल भी लागू किया जाना चाहिए
स्थानांतरण फ़ंक्शन पर अंक और समग्र लाभ के आसान समायोजन की अनुमति देता है।

चौथा (वैकल्पिक) पैरामीटर प्रत्येक चैनल के लिए माना जाने वाला प्रारंभिक स्तर है
जब कंपाउंडिंग शुरू होती है. यह उपयोगकर्ता को प्रारंभ में नाममात्र स्तर की आपूर्ति करने की अनुमति देता है,
ताकि, उदाहरण के लिए, प्रारंभिक सिग्नल स्तरों पर बहुत बड़ा लाभ लागू न हो
कंपाउंडिंग क्रिया शुरू होने से पहले: इसकी काफी संभावना है कि
ऐसी घटना में, आउटपुट गंभीर रूप से कम हो जाएगा जबकि कंपाउंडर को लाभ होगा
अपने आप को ठीक से समायोजित कर लेता है। एक विशिष्ट मान (ऑडियो के लिए जो प्रारंभ में शांत है) है
-90 डीबी

पांचवां (वैकल्पिक) पैरामीटर सेकंड में देरी है। इनपुट सिग्नल का विश्लेषण किया जाता है
कंपाउंडर को तुरंत नियंत्रित करने के लिए, लेकिन इसे फीड किए जाने से पहले इसमें देरी हो जाती है
वॉल्यूम समायोजक. लगभग हमले/क्षय के समय के बराबर विलंब निर्दिष्ट करना
कंपाउंडर को 'भविष्यवाणी' के बजाय प्रभावी ढंग से काम करने की अनुमति देता है
प्रतिक्रियाशील मोड. एक विशिष्ट मान है 0.2 सेकंड.

* * *

निम्नलिखित उदाहरण का उपयोग शांत और संगीत दोनों के साथ संगीत का एक टुकड़ा बनाने के लिए किया जा सकता है
चलने-फिरने जैसे शोर-शराबे वाले माहौल में सुनने के लिए उपयुक्त तेज़ आवाज़ वाले मार्ग
वाहन:
sox asz.wav asz-car.wav कंपाउंड 0.3,1 6:-70,-60,-20 -5 -90 0.2
स्थानांतरण फ़ंक्शन (`6:-70,...') कहता है कि बहुत धीमी ध्वनियाँ (-70dB से नीचे) होंगी
अपरिवर्तित ही रहेंगे। यह कंपाउंडर को वॉल्यूम बढ़ाने से रोकेगा
'मौन' मार्ग जैसे कि आंदोलनों के बीच। हालाँकि, -60dB से लेकर रेंज में ध्वनियाँ
0dB (अधिकतम वॉल्यूम) को बढ़ाया जाएगा ताकि मूल की 60dB गतिशील रेंज हो
संगीत को 3-टू-1 को 20dB रेंज में संपीड़ित किया जाएगा, जो आनंद लेने के लिए पर्याप्त है
संगीत लेकिन इतना संकीर्ण कि सड़क के शोर से बचा जा सके। `6:' 6dB का चयन करता है
नरम-घुटने का संयोजन। क्लिपिंग से बचने के लिए -5 (डीबी) आउटपुट लाभ की आवश्यकता है
संख्या सटीक नहीं है, और प्रयोग द्वारा प्राप्त की गई थी)। -90 (डीबी) के लिए
आरंभिक वॉल्यूम उस क्लिप के लिए ठीक काम करेगा जो निकट मौन से शुरू होती है, और
0.2 (सेकंड) की देरी के कारण कंपाउंडर को कुछ अधिक प्रतिक्रिया करनी पड़ती है
जल्दी से अचानक मात्रा में परिवर्तन।

अगले उदाहरण में, शोर होने पर कंपाउंड का उपयोग शोर-द्वार के रूप में किया जा रहा है
सिग्नल से निचला स्तर:
इनफ़ाइल कंपाउंड चलाएं .1,.2 -inf,-50.1,-inf,-50,-50 0 -90 .1
यहां एक और शोर-द्वार है, इस बार तब जब शोर इससे ऊंचे स्तर पर हो
संकेत (इसे, कुछ मायनों में, स्क्वेल्च के समान बनाते हुए):
इनफ़ाइल कंपाउंड चलाएँ .1,.1 -45.1,-45,-inf,0,-inf 45 -90 .1
यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प (स्थानांतरण फ़ंक्शन के लिए)।

यह भी देखें mcompand मल्टीपल-बैंड कंपाउंडिंग प्रभाव के लिए।

इसके विपरीत [वृद्धि-राशि(75)]
संपीड़न के साथ तुलनीय, यह प्रभाव ध्वनि उत्पन्न करने के लिए एक ऑडियो सिग्नल को संशोधित करता है
जोर से. वृद्धि-राशि वृद्धि की मात्रा को नियंत्रित करता है और एक संख्या है
0-100 की रेंज में. ध्यान दें कि वृद्धि-राशि = 0 अभी भी एक महत्वपूर्ण परिणाम देता है
विपरीत रंगों में वृद्धि।

यह भी देखें कंपंड और mcompand प्रभाव.

डीसीशिफ्ट पाली [सीमित लाभ]
ऑडियो में DC शिफ्ट लागू करें। यह डीसी ऑफसेट (कारण) को हटाने के लिए उपयोगी हो सकता है
शायद रिकॉर्डिंग श्रृंखला में किसी हार्डवेयर समस्या के कारण) ऑडियो से। प्रभाव
डीसी ऑफसेट का हेडरूम कम हो जाता है और इसलिए वॉल्यूम कम हो जाता है। स्टेट or आँकड़े प्रभाव पड़ सकता है
यह निर्धारित करने के लिए उपयोग किया जाता है कि सिग्नल में डीसी ऑफसेट है या नहीं।

दिया डीसीशिफ्ट मान ±2 की सीमा में एक फ़्लोटिंग पॉइंट संख्या है
ऑडियो को स्थानांतरित करने की मात्रा इंगित करता है (जो ±1 की सीमा में है)।

एक वैकल्पिक सीमित लाभ भी निर्दिष्ट किया जा सकता है. इसका मूल्य इससे भी कम होना चाहिए
1 से (जैसे 0.05 या 0.02) और कतरन को रोकने के लिए केवल चोटियों पर उपयोग किया जाता है।

* * *

डीसी ऑफसेट को हटाने का एक वैकल्पिक तरीका (यद्यपि थोड़ी देरी के साथ) है
उपयोग उच्च मार्ग 10 हर्ट्ज की आवृत्ति पर फ़िल्टर प्रभाव, जैसा कि इसमें दिखाया गया है
निम्नलिखित उदाहरण:
sox -n dc.wav सिंथ 5 पाप% 0 50
sox dc.wav फिक्स्ड.wav हाईपास 10

डिम्फ कॉम्पैक्ट डिस्क (आईईसी 60908) डी-एम्फेसिस (एक तिगुना क्षीणन शेल्विंग फ़िल्टर) लागू करें।

1980 के दशक की शुरुआत में जारी की गई कुछ सीडी की मास्टरिंग में पूर्व-जोर लागू किया गया था।
इनमें कई शास्त्रीय संगीत एलबम के साथ-साथ अब चर्चित अंक भी शामिल हैं
द बीटल्स, पिंक फ़्लॉइड और अन्य के एल्बम। पूर्व-जोर को हटा दिया जाना चाहिए
प्लेबैक डिवाइस में डी-एम्फेसिस फ़िल्टर द्वारा प्लेबैक समय। हालाँकि, सभी नहीं
आधुनिक सीडी प्लेयर में यह फ़िल्टर होता है, और बहुत कम पीसी सीडी ड्राइव में यह होता है; पूर्व खेलना-
सही डी-एम्फेसिस फ़िल्टर के बिना ज़ोरदार ऑडियो का परिणाम ऑडियो में होता है
यह कठोर लगता है और इसके रचनाकारों की मंशा से बहुत दूर है।

उसके साथ डिम्फ प्रभाव से, ऑडियो पर आवश्यक ज़ोर कम करना संभव है
जिसे एक पूर्व-जोरदार सीडी से निकाला गया है, और फिर या तो डी- को जला दें
एक नई सीडी पर जोर दिया गया ऑडियो (जो तब किसी भी सीडी प्लेयर पर सही ढंग से चलेगा), या
बस पीसी पर सही ढंग से डी-एम्प्रेस्ड ऑडियो फ़ाइलें चलाएं। उदाहरण के लिए:
सॉक्स ट्रैक1.वेव ट्रैक1-डीम्फ.वेव डीम्फ
और फिर ट्रैक1-डीम्फ़.वेव को सीडी में जलाएं, या
ट्रैक1-डीम्फ.वेव चलायें
या बस
ट्रैक1.वेव डीम्फ चलायें
डी-एम्फेसिस फ़िल्टर को बाइक्वाड के रूप में लागू किया गया है; से इसका अधिकतम विचलन
आदर्श प्रतिक्रिया केवल 0.06dB (20kHz तक) है।

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

यह भी देखें बास और तिहरा समतलीकरण प्रभाव को ठंडे बस्ते में डालना।

देरी {लंबाई}
एक या अधिक ऑडियो चैनल विलंबित करें। लंबाई एक समय निर्दिष्ट कर सकते हैं या, यदि इसके साथ जोड़ा गया हो
एक 'एस', कई नमूने। इसमें समय और नमूने की देरी दोनों निर्दिष्ट न करें
वही आदेश. उदाहरण के लिए, देरी 1.5 0 0.5 पहले चैनल में 1.5 की देरी हुई
सेकंड, तीसरा चैनल 0.5 सेकंड, और दूसरा चैनल (और कोई भी) छोड़ देता है
अन्य चैनल जो मौजूद हो सकते हैं) अविलंबित। निम्नलिखित (एक लंबा) आदेश
झंकार ध्वनि बजाता है:
प्ले -एन सिंथ -जे 3 सिन %3 सिन %-2 सिन %-5 सिन %-9
पाप %-14 पाप %-21 फीका ज .01 2 1.5 विलंब
1.3 1 .76 .54 .27 रीमिक्स - फ़ेड एच 0 2.7 2.5 मानक -1
और यह गिटार का राग बजाता है:
प्ले-एन सिंथ पीएल जी2 पीएल बी2 पीएल डी3 पीएल जी3 पीएल डी4 पीएल जी4
विलंब 0 .05 .1 .15 .2 .25 रीमिक्स - फीका 0 4 .1 मानक -1

तड़पना [-S|-s|-f फ़िल्टर] [-a] [-p शुद्धता]
ऑडियो पर डिथरिंग लागू करें. डिथरिंग जानबूझकर थोड़ी मात्रा में शोर जोड़ता है
श्रव्य परिमाणीकरण प्रभावों को छुपाने के लिए सिग्नल पर, जो घटित हो सकता है
आउटपुट नमूना आकार 24 बिट से कम है। कोई विकल्प न होने से यह प्रभाव जुड़ जाएगा
त्रिकोणीय (टीपीडीएफ) सफेद शोर। शोर-आकार (केवल कुछ नमूना दरों के लिए) कर सकते हैं
के साथ चयन किया जाए -s। उसके साथ -f विकल्प, किसी विशेष का चयन करना संभव है
निम्नलिखित सूची से शोर-आकार देने वाला फ़िल्टर: लिपशिट्ज़, एफ-वेटेड, संशोधित-ई-
भारित, बेहतर-ई-भारित, गेसमैन, शिबाता, निम्न-शिबाता, उच्च-शिबाता। टिप्पणी
अधिकांश फ़िल्टर प्रकार केवल 44100Hz नमूना दर के साथ उपलब्ध हैं। फ़िल्टर
प्रकार निम्नलिखित गुणों द्वारा प्रतिष्ठित हैं: शोर की श्रव्यता, का स्तर
(अश्रव्य, लेकिन कुछ परिस्थितियों में, अन्यथा समस्याग्रस्त) आकार की उच्च आवृत्ति
शोर, और प्रसंस्करण गति।
देख http://sox.sourceforge.net/SoX/NoiseShaping विभिन्न शोर के ग्राफ़ के लिए-
वक्रों को आकार देना।

RSI -S विकल्प थोड़ा `ढलानदार' टीपीडीएफ का चयन करता है, जो उच्च आवृत्तियों के प्रति पक्षपाती है।
इसका उपयोग किसी भी नमूना दर पर किया जा सकता है लेकिन ≈22k से नीचे, सादा टीपीडीएफ संभवतः बेहतर है,
और ≈ 37k से ऊपर, शोर-आकार शायद बेहतर है।

RSI -a विकल्प एक ऐसे मोड को सक्षम करता है जहां डिथरिंग (और यदि लागू हो तो शोर-आकार देना) होता है
आवश्यकता पड़ने पर ही स्वचालित रूप से सक्षम किया जाता है। इसके लिए सबसे अधिक संभावित उपयोग कब होता है
पहले से ही बिखरी हुई फ़ाइल में फ़ेड इन या आउट लागू करना, ताकि पुनर्वितरण हो सके
केवल फीके भागों पर लागू होता है। हालाँकि, ऑटो डिथरिंग फुलप्रूफ नहीं है, इसलिए
किसी भी शोर मॉड्यूलेशन के लिए फ़ेड्स की सावधानीपूर्वक जाँच की जानी चाहिए; यदि ऐसा होता है,
फिर या तो पूरी फ़ाइल को दोबारा बदलें, या उपयोग करें ट्रिम, फीका करना, और संयोजित करें।

RSI -p विकल्प लक्ष्य परिशुद्धता को ओवरराइड करने की अनुमति देता है।

यदि SoX वैश्विक विकल्प -R विकल्प नहीं दिया गया है तो छद्म यादृच्छिक संख्या
श्वेत शोर उत्पन्न करने के लिए उपयोग किया जाने वाला जनरेटर 'रीसीड' किया जाएगा, अर्थात उत्पन्न किया जाएगा
आह्वान के बीच शोर अलग होगा।

इस प्रभाव के बाद कोई अन्य प्रभाव नहीं आना चाहिए जो ऑडियो को प्रभावित करता हो।

उपरोक्त 'डिथरिंग' अनुभाग भी देखें।

डाउनसैंपल [कारक(2)]
पूर्णांक कारक द्वारा सिग्नल को डाउनसैंपल करें: प्रत्येक में से केवल पहला कारक
नमूने रख लिए जाते हैं, बाकी छोड़ दिए जाते हैं।

कोई डिसीमेशन फ़िल्टर लागू नहीं किया गया है. यदि इनपुट ठीक से बैंडलिमिटेड नहीं है
बेसबैंड सिग्नल, अलियासिंग घटित होगी। यह वांछनीय हो सकता है, उदाहरण के लिए, आवृत्ति के लिए
अनुवाद।

एंटी-अलियासिंग के साथ सामान्य पुनः नमूनाकरण प्रभाव के लिए, देखें दर। यह भी देखें अपनमूना.

कान का गंधक हेडफ़ोन पर ऑडियो सुनना आसान बनाता है। 44.1kHz स्टीरियो में 'संकेत' जोड़ता है (अर्थात्
ऑडियो सीडी प्रारूप) ऑडियो ताकि हेडफ़ोन पर सुनने पर स्टीरियो छवि हो
आपके सिर के अंदर (हेडफ़ोन के लिए मानक) से बाहर और सामने की ओर ले जाया गया
श्रोता (वक्ताओं के लिए मानक)।

गूंज इसमे मुनाफा होना लाभ बाहर <देरी क्षय>
ऑडियो में प्रतिध्वनि जोड़ें. गूँज परावर्तित ध्वनि होती है और स्वाभाविक रूप से उत्पन्न हो सकती है
बात करते या चिल्लाते समय पहाड़ों (और कभी-कभी बड़ी इमारतों) के बीच; डिजिटल
प्रतिध्वनि प्रभाव इस व्यवहार का अनुकरण करते हैं और अक्सर ध्वनि को भरने में मदद के लिए उपयोग किए जाते हैं
एक ही वाद्य या स्वर का। मूल सिग्नल के बीच समय का अंतर
और प्रतिबिंब 'विलंब' (समय) है, और प्रतिबिंबित संकेत की प्रबलता है
'क्षय' है. एकाधिक प्रतिध्वनियों में अलग-अलग विलंब और क्षय हो सकते हैं।

प्रत्येक दिया गया देरी क्षय जोड़ी मिलीसेकंड में विलंब और क्षय (सापेक्ष) देती है
उस प्रतिध्वनि को प्राप्त करने के लिए)। गेन-आउट आउटपुट की मात्रा है। उदाहरण के लिए: यह
ऐसा लगेगा मानो वास्तव में जितने यंत्र हैं उससे दोगुने यंत्र हैं
खेलना:
लीड.एफ़ इको 0.8 0.88 60 0.4 चलाएँ
यदि विलंब बहुत कम है, तो यह एक (धात्विक) रोबोट द्वारा संगीत बजाने जैसा लगता है:
लीड.एफ़ इको 0.8 0.88 6 0.4 चलाएँ
अधिक विलंब पहाड़ों में एक खुली हवा के संगीत कार्यक्रम की तरह लगेगा:
लीड.एफ़ इको 0.8 0.9 1000 0.3 चलाएँ
एक पर्वत और, और:
प्ले लीड.एआईएफ इको 0.8 0.9 1000 0.3 1800 0.25

इको इसमे मुनाफा होना लाभ बाहर <देरी क्षय>
ऑडियो में गूँज का एक क्रम जोड़ें। प्रत्येक देरी क्षय जोड़ी में देरी देता है
मिलीसेकंड और उस प्रतिध्वनि का क्षय (गेन-इन के सापेक्ष)। गेन-आउट है
आउटपुट की मात्रा.

प्रतिध्वनि प्रभाव की तरह, प्रतिध्वनि का अर्थ 'सीक्वल में प्रतिध्वनि' है, जो कि पहली प्रतिध्वनि है
इनपुट लेता है, दूसरा इनपुट और पहला इकोस, तीसरा इनपुट और
पहली और दूसरी प्रतिध्वनि, ... इत्यादि। कई का उपयोग करते समय सावधानी बरतनी चाहिए
इकोस; एक एकल प्रतिध्वनि का प्रभाव एकल प्रतिध्वनि के समान ही होता है।

नमूना सममित इकोस में दो बार बाउंस किया जाएगा:
प्ले लीड.एआईएफ ईकोस 0.8 0.7 700 0.25 700 0.3
नमूना असममित इकोस में दो बार बाउंस किया जाएगा:
प्ले लीड.एआईएफ ईकोस 0.8 0.7 700 0.25 900 0.3
नमूना ऐसा लगेगा मानो गैरेज में खेला जा रहा हो:
प्ले लीड.एआईएफ ईकोस 0.8 0.7 40 0.25 63 0.3

तुल्यकारक आवृत्ति[k] चौडाई[q|o|h|k] लाभ
दो-पोल पीकिंग इक्वलाइज़ेशन (ईक्यू) फ़िल्टर लागू करें। इस फ़िल्टर के साथ, सिग्नल-
चयनित आवृत्ति पर और उसके आस-पास स्तर को बढ़ाया या घटाया जा सकता है
(बैंड-पास और बैंड-रिजेक्ट फिल्टर के विपरीत) जो कि अन्य सभी आवृत्तियों पर है
अपरिवर्तित।

आवृत्ति Hz में फ़िल्टर की केंद्रीय आवृत्ति देता है, चौडाई, बैंड-विड्थ, और
लाभ डीबी में आवश्यक लाभ या क्षीणन। सावधान रहो कतरन जब एक का उपयोग कर
सकारात्मक लाभ.

जटिल समकारी वक्र उत्पन्न करने के लिए, इस प्रभाव को कई दिया जा सकता है
समय, प्रत्येक एक अलग केंद्रीय आवृत्ति के साथ।

फ़िल्टर का वर्णन [1] में विस्तार से किया गया है।

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

यह भी देखें बास और तिहरा समकारी प्रभावों को ठंडे बस्ते में डालने के लिए।

फीका करना [टाइप] लंबाई में फीका पड़ना [रुकने का समय [फीका-आउट-लंबाई]]
ऑडियो के आरंभ, अंत या दोनों पर फीका प्रभाव लागू करें।

एक वैकल्पिक टाइप फीका वक्र के आकार का चयन करने के लिए निर्दिष्ट किया जा सकता है: q एसटी
एक चौथाई साइन लहर, h आधी साइन लहर के लिए, t रैखिक ('त्रिकोणीय') ढलान के लिए,
l लघुगणक के लिए, और p उल्टे परवलय के लिए. डिफ़ॉल्ट लघुगणक है.

फ़ेड-इन पहले नमूने से शुरू होता है और सिग्नल स्तर को 0 से पूर्ण तक बढ़ा देता है
वॉल्यूम ख़त्म लंबाई में फीका पड़ना सेकंड. यदि कोई फ़ेड-इन नहीं चाहिए तो 0 सेकंड निर्दिष्ट करें।

फ़ेड-आउट के लिए, ऑडियो को छोटा कर दिया जाएगा रुकने का समय और सिग्नल स्तर होगा
पूर्ण वॉल्यूम से प्रारंभ करके 0 तक रैंप किया जाए फीका-आउट-लंबाई सेकेण्ड पहले
रुकने का समय. अगर फीका-आउट-लंबाई निर्दिष्ट नहीं है, यह उसी मान पर डिफ़ॉल्ट है
लंबाई में फीका पड़ना. यदि कोई फ़ेड-आउट नहीं किया जाता है रुकने का समय निर्दिष्ट नहीं है. यदि
फ़ाइल की लंबाई इनपुट फ़ाइल हेडर और लंबाई-परिवर्तन से निर्धारित की जा सकती है
तब प्रभाव प्रभाव में नहीं होते हैं 0 के लिए निर्दिष्ट किया जा सकता है रुकने का समय संकेत करना
फ़ेड-आउट का सामान्य मामला जो इनपुट ऑडियो स्ट्रीम के अंत में समाप्त होता है।

सभी समयों को समय की अवधि या नमूना गणना में निर्दिष्ट किया जा सकता है। स्पष्ट रूप से बताने के लिए
समय अवधि hh:mm:ss.frac प्रारूप का उपयोग करती है। नमूना गणना का उपयोग करके निर्दिष्ट करने के लिए,
नमूनों की संख्या निर्दिष्ट करें और नमूना गिनती में अक्षर 'एस' जोड़ें (के लिए)।
उदाहरण `8000')।

यह भी देखें ब्याह प्रभाव।

देवदार [coefs-file|कोफ़्स]
दिए गए FIR फ़िल्टर गुणांक के साथ SoX के FFT कनवल्शन इंजन का उपयोग करें। यदि एक
तर्क दिया गया है तो इसे फ़िल्टर वाली फ़ाइल के नाम के रूप में माना जाता है
गुणांक (श्वेत-स्थान अलग; '#' टिप्पणियाँ हो सकती हैं)। यदि दिया गया
फ़ाइल नाम `-' है, या यदि कोई तर्क नहीं दिया गया है, तो गुणांक पढ़े जाते हैं
'मानक इनपुट' (stdin); अन्यथा, आदेश पर गुणांक दिए जा सकते हैं
रेखा। उदाहरण:
सॉक्स इनफ़ाइल आउटफ़ाइल फ़िर 0.0195 -0.082 0.234 0.891 -0.145 0.043
coefs.txt के लिए sox इनफ़ाइल आउटफ़ाइल
coefs.txt युक्त
# एचपी फ़िल्टर
# आवृत्ति=10000
1.2311233052619888e-+०००२३६२८६१
-4.4777096106211783ई-01
5.1031563346705155e-+०००२३६२८६१
-6.6502926320995331ई-02
...

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

निकला हुआ किनारा [देरी गहराई Regen चौडाई गति आकार चरण इंटरपो]
ऑडियो पर फ़्लैंगिंग प्रभाव लागू करें। विस्तृत विवरण के लिए [3] देखें
फ़्लैंगिंग

सभी पैरामीटर वैकल्पिक हैं (दाएं से बाएं)।

रेंज चूक विवरण
देरी 0 - 30 0 आधार विलंब मिलीसेकेंड में।
गहराई 0 - 10 2 मिलीसेकंड में स्वेप्ट विलंब जोड़ा गया।
Regen -95 - 95 0 प्रतिशत पुनर्जनन (विलंबित)।
सिग्नल फीडबैक)।
चौडाई 0 - 100 71 विलंबित सिग्नल का प्रतिशत मिश्रित
मूल के साथ.
गति 0.1 - 10 0.5 स्वीप प्रति सेकंड (हर्ट्ज)।
आकार पाप स्वेप्ट तरंग आकार: ज्या|त्रिकोण.
चरण 0 - 100 25 स्वेप्ट तरंग प्रतिशत चरण-शिफ्ट
मल्टी-चैनल के लिए (जैसे स्टीरियो)
निकला हुआ किनारा; 0 = 100 = समान चरण चालू
प्रत्येक चैनल।
इंटरपो लिन डिजिटल डिले-लाइन इंटरपोलेशन:
रैखिक|द्विघात.

लाभ [-e|-B|-b|-r] [-n] [-l|-h] [लाभ-डीबी]
ऑडियो सिग्नल पर प्रवर्धन या क्षीणन लागू करें, या, कुछ मामलों में, कुछ पर
इसके चैनलों का. ध्यान दें कि इनमें से किसी का भी उपयोग करें -e, -B, -b, -rया, -n अस्थायी आवश्यकता है
संसाधित किए जाने वाले ऑडियो को संग्रहीत करने के लिए फ़ाइल स्थान, इसलिए उपयोग के लिए अनुपयुक्त हो सकता है
`स्ट्रीम' किया गया ऑडियो।

अन्य विकल्पों के बिना, लाभ-डीबी द्वारा सिग्नल पावर स्तर को समायोजित करने के लिए उपयोग किया जाता है
डीबी की दी गई संख्या: सकारात्मक बढ़ती है (क्लिपिंग से सावधान रहें), नकारात्मक क्षीण होती है।
अन्य विकल्पों के साथ, लाभ-डीबी प्रवर्धन या क्षीणन (तार्किक रूप से) लागू किया जाता है
उन विकल्पों के कारण प्रसंस्करण के बाद.

देखते हुए -e विकल्प, मल्टी-चैनल फ़ाइल के ऑडियो चैनल के स्तर हैं
'बराबर', यानी लाभ उच्चतम वाले के अलावा अन्य सभी चैनलों पर लागू होता है
चरम स्तर, जैसे कि सभी चैनल समान चरम स्तर प्राप्त करें (लेकिन, इसके बिना भी)।
दे -n, ऑडियो 'सामान्यीकृत' नहीं है)।

RSI -B (बैलेंस) विकल्प के समान है -e, लेकिन इसके साथ -बी, RMS स्तर का उपयोग किया जाता है
चरम स्तर के बजाय. -B के कारण होने वाले स्टीरियो असंतुलन को ठीक करने के लिए उपयोग किया जा सकता है
एक अपूर्ण रिकॉर्ड टर्नटेबल कार्ट्रिज। ध्यान दें कि विपरीत -e, -B कुछ कारण हो सकता है
कतरन

-b के समान है -B लेकिन इसमें क्लिपिंग सुरक्षा है, यानी यदि आवश्यक हो तो रोकने के लिए
संतुलन बनाते समय क्लिपिंग करते समय सभी चैनलों पर क्षीणन लागू किया जाता है। हालाँकि, ध्यान दें,
कि साथ में -n, -B और -b समानार्थी हैं।

RSI -r विकल्प का उपयोग पूर्व आह्वान के साथ संयोजन में किया जाता है लाभ साथ -h
विकल्प - विवरण के लिए नीचे देखें।

RSI -n विकल्प ऑडियो को 0dB FSD पर सामान्य कर देता है; इसका उपयोग अक्सर इसके साथ संयोजन में किया जाता है
एक नकारात्मक लाभ-डीबी इस प्रभाव से कि ऑडियो एक निश्चित स्तर पर सामान्यीकृत हो जाता है
0dB से नीचे. उदाहरण के लिए,
सॉक्स इनफाइल आउटफाइल गेन -एन
0dB तक सामान्य हो जाता है, और
सॉक्स इनफाइल आउटफाइल गेन -एन -3
-3dB तक सामान्य हो जाता है।

RSI -l विकल्प एक साधारण सीमक को आमंत्रित करता है, उदाहरण के लिए
सॉक्स इनफाइल आउटफाइल गेन -एल 6
6dB का लाभ लागू करेगा लेकिन कभी क्लिप नहीं करेगा। ध्यान दें कि कुछ dB से अधिक को सीमित करना अधिक है
कभी-कभी (ऑडियो के एक टुकड़े में) की अनुशंसा नहीं की जाती है क्योंकि इससे सुनने में परेशानी हो सकती है
विरूपण। देखें कंपंड अधिक सक्षम सीमक के लिए प्रभाव।

RSI -h विकल्प का उपयोग बाद की प्रक्रिया के लिए हेड-रूम प्रदान करने के लिए लाभ लागू करने के लिए किया जाता है।
उदाहरण के लिए, साथ
सॉक्स इनफाइल आउटफाइल गेन -एच बास +6
इस प्रकार सुनिश्चित करने के लिए बास बूस्टिंग प्रभाव से पहले 6dB क्षीणन लागू किया जाएगा
कि यह क्लिप नहीं होगा. बेशक, बास के साथ, यह स्पष्ट है कि हेडरूम कितना होगा
आवश्यक हो, लेकिन अन्य प्रभावों (जैसे दर, इधर-उधर) के साथ यह हमेशा उतना स्पष्ट नहीं होता है।
उपयोग करने का एक और फायदा लाभ -h एक स्पष्ट क्षीणन के बजाय, क्या वह है यदि
हेडरूम का उपयोग बाद के प्रभावों द्वारा नहीं किया जाता है, इसे पुनः प्राप्त किया जा सकता है लाभ -r,
उदाहरण के लिए:
सॉक्स इनफाइल आउटफाइल गेन -एच बास +6 रेट 44100 गेन -आर
उपरोक्त प्रभाव शृंखला गारंटी देती है कि न तो कभी क्लिप होगी और न ही बढ़ेगी; यदि यह क्षीण हो जाता है
कतरन को रोकने के लिए आवश्यक है, लेकिन केवल उतना ही जितना ऐसा करने के लिए आवश्यक है।

आउटपुट फ़ॉर्मेटिंग (डिथरिंग और बिट-डेप्थ रिडक्शन) के लिए भी हेडरूम की आवश्यकता होती है (जो
'पुनर्प्राप्त' नहीं किया जा सकता), उदाहरण के लिए
सॉक्स इनफाइल आउटफाइल गेन -एच बास +6 रेट 44100 गेन -आरएच इधर-उधर
यहाँ, दूसरा लाभ आह्वान, जितना संभव हो उतना हेडरूम पुनः प्राप्त करता है
पूर्ववर्ती प्रभाव, लेकिन बाद के लिए जितनी आवश्यकता हो उतनी गुंजाइश बरकरार रखता है
प्रसंस्करण. SoX वैश्विक विकल्प -G स्वचालित रूप से आह्वान करने के लिए दिया जा सकता है लाभ -h
और लाभ -r.

यह भी देखें आदर्श और वॉल प्रभाव.

उच्च मार्ग|कम उत्तीर्ण [-1|-2] आवृत्ति[k] [चौड़ाई[q|o|h|k]]
3dB पॉइंट के साथ हाई-पास या लो-पास फ़िल्टर लागू करें आवृत्ति. फ़िल्टर हो सकता है
या तो सिंगल-पोल (साथ -1), या डबल-पोल (डिफ़ॉल्ट, या साथ -2). चौडाई
केवल डबल-पोल फ़िल्टर पर लागू होता है; डिफ़ॉल्ट Q = 0.707 है और a देता है
बटरवर्थ प्रतिक्रिया. फ़िल्टर 6dB प्रति पोल प्रति ऑक्टेव (20dB प्रति) पर बंद हो जाते हैं
पोल प्रति दशक)। डबल-पोल फ़िल्टर का वर्णन [1] में विस्तार से किया गया है।

ये प्रभाव समर्थन करते हैं --भूखंड वैश्विक विकल्प.

यह भी देखें ईमानदारी से तेज़ रोल-ऑफ़ वाले फ़िल्टर के लिए।

हिल्बर्ट [-n नल]
एक ऑड-टैप हिल्बर्ट ट्रांसफ़ॉर्म फ़िल्टर लागू करें, चरणबद्ध तरीके से सिग्नल को 90 डिग्री तक स्थानांतरित करें।

इसका उपयोग कई मैट्रिक्स कोडिंग योजनाओं और विश्लेषणात्मक सिग्नल पीढ़ी के लिए किया जाता है।
प्रक्रिया को अक्सर गुणन के रूप में लिखा जाता है i (या j), काल्पनिक इकाई।

एक ऑड-टैप हिल्बर्ट ट्रांसफ़ॉर्म फ़िल्टर में एक बैंडपास विशेषता होती है, जो इसे क्षीण करती है
निम्नतम और उच्चतम आवृत्तियाँ। इसकी बैंडविड्थ को की संख्या से नियंत्रित किया जा सकता है
फिल्टर नल, जिसके साथ निर्दिष्ट किया जा सकता है -n. डिफ़ॉल्ट रूप से, टैप की संख्या है
लगभग 75 हर्ट्ज़ की कटऑफ़ आवृत्ति के लिए चुना गया।

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

लडस्पा मॉड्यूल [लगाना] [तर्क...]
LADSPA [5] (लिनक्स ऑडियो डेवलपर का सरल प्लगइन एपीआई) प्लगइन लागू करें। के बावजूद
नाम, LADSPA लिनक्स-विशिष्ट नहीं है, और प्रभावों की एक विस्तृत श्रृंखला उपलब्ध है
LADSPA प्लगइन्स, जैसे cmt [6] (कंप्यूटर म्यूजिक टूलकिट) और स्टीव हैरिस
प्लगइन संग्रह [7]। पहला तर्क प्लगइन मॉड्यूल है, दूसरा नाम है
प्लगइन का (एक मॉड्यूल में एक से अधिक प्लगइन हो सकते हैं) और कोई अन्य तर्क
प्लगइन के नियंत्रण पोर्ट के लिए हैं। गुम तर्क डिफ़ॉल्ट रूप से प्रदान किए जाते हैं
यदि संभव हो तो मान. केवल अधिकतम एक ऑडियो इनपुट और एक ऑडियो आउटपुट वाले प्लगइन्स
पोर्ट का उपयोग किया जा सकता है। यदि पाया जाता है, तो पर्यावरण चर LADSPA_PATH का उपयोग किया जाएगा
प्लगइन्स के लिए खोज पथ.

आवाज़ की उंचाई [लाभ [संदर्भ]]
ध्वनि नियंत्रण - के समान लाभ प्रभाव, लेकिन के लिए समानता प्रदान करता है
मानव श्रवण प्रणाली. देखना http://en.wikipedia.org/wiki/Loudness विस्तृत जानकारी के लिए
प्रबलता का वर्णन. लाभ को दिए गए अनुसार समायोजित किया जाता है लाभ पैरामीटर (आमतौर पर
नकारात्मक) और सिग्नल आईएसओ 226 के संदर्भ स्तर के अनुसार बराबर हो गया
65dB, यद्यपि एक विकल्प संदर्भ यदि मूल ऑडियो है तो स्तर दिया जा सकता है
किसी अन्य इष्टतम स्तर के लिए बराबर किया गया है। -10dB का डिफ़ॉल्ट लाभ उपयोग किया जाता है यदि a
लाभ मूल्य नहीं दिया गया है.

यह भी देखें लाभ प्रभाव।

कम उत्तीर्ण [-1|-2] आवृत्ति[k] [चौड़ाई[q|o|h|k]]
लो-पास फ़िल्टर लागू करें। का विवरण देखें उच्च मार्ग विवरण के लिए प्रभाव.

mcompand "हल्ला ०३ ९,क्षय1{,हल्ला ०३ ९,क्षय2}
[नरम-घुटना-डीबी:]इन-डीबी1[,आउट-dB1]{,इन-डीबी2,आउट-dB2}
[लाभ [प्रारंभिक-मात्रा-डीबी [देरी]]]" {क्रॉसओवर-आवृत्ति[k] "हमला1,..."}

मल्टी-बैंड कंपाउंडर सिंगल-बैंड कंपाउंडर के समान है लेकिन ऑडियो है
पहले लिंकविट्ज़-रिले क्रॉस-ओवर फिल्टर और एक अलग से बैंड में विभाजित किया गया
प्रत्येक बैंड पर निर्दिष्ट कंपांडर चलता है। देखें कंपंड परिभाषा के लिए प्रभाव
इसके मापदंडों का. कंपाउंड पैरामीटर डबल कोट्स और के बीच निर्दिष्ट हैं
उस बैंड के लिए क्रॉसओवर आवृत्ति द्वारा दी गई है क्रॉसओवर-आवृत्ति; इन्हें दोहराया जा सकता है
एकाधिक बैंड बनाने के लिए.

उदाहरण के लिए, निम्नलिखित (एक लंबा) कमांड दिखाता है कि मल्टी-बैंड कंपाउंडिंग कैसी है
आमतौर पर एफएम रेडियो में उपयोग किया जाता है:
प्ले ट्रैक1.वेव गेन -3 सिंस 8000- 29 100 एमकंपैंड
"0.005,0.1 -47,-40,-34,-34,-17,-33" 100
"0.003,0.05 -47,-40,-34,-34,-17,-33" 400
"0.000625,0.0125 -47,-40,-34,-34,-15,-33" 1600
"0.0001,0.025 -47,-40,-34,-34,-31,-31,-0,-30" 6400
"0,0.025 -38,-31,-28,-28,-0,-25"
गेन 15 हाईपास 22 हाईपास 22 सिनसी -एन 255 -बी 16 -17500
लाभ 9 लोपास -1 17801
ऑडियो फ़ाइल को सिम्युलेटेड एफएम रेडियो ध्वनि (या प्रसारण सिग्नल) के साथ चलाया जाता है
स्थिति यदि अंत में लोपास फ़िल्टर छोड़ दिया गया है)। ध्यान दें कि पाइपलाइन है
यूएस-शैली 75us पूर्व-जोर के साथ स्थापित करें।

यह भी देखें कंपंड एकल-बैंड कंपाउंडिंग प्रभाव के लिए।

नॉइज़प्रोफ़ [प्रोफ़ाइल-फ़ाइल]
शोर कम करने में उपयोग के लिए ऑडियो की प्रोफ़ाइल की गणना करें। विवरण देखें
का शोर मचाया विवरण के लिए प्रभाव.

शोर मचाया [प्रोफ़ाइल-फ़ाइल [राशि]]
प्रोफाइलिंग और फ़िल्टरिंग द्वारा ऑडियो सिग्नल में शोर कम करें। यह प्रभाव है
लगातार पृष्ठभूमि शोर जैसे फुसफुसाहट या गुनगुनाहट को दूर करने में मध्यम रूप से प्रभावी।
इसका उपयोग करने के लिए, पहले SoX को इसके साथ चलाएँ नॉइज़प्रोफ़ ऑडियो के एक भाग पर प्रभाव
आदर्श रूप से इसमें मौन होता लेकिन वास्तव में इसमें शोर होता है - ऐसे खंड हैं
आमतौर पर रिकॉर्डिंग के आरंभ या अंत में पाया जाता है। नॉइज़प्रोफ़ लिखेंगे
एक शोर प्रोफ़ाइल बाहर करने के लिए प्रोफ़ाइल-फ़ाइल, या यदि नहीं तो स्टडआउट करें प्रोफ़ाइल-फ़ाइल या यदि `-' है
दिया गया। उदाहरण के लिए
सॉक्स स्पीच.वेव -एन ट्रिम 0 1.5 नॉइज़प्रोफ़ स्पीच.नॉइज़-प्रोफ़ाइल
वास्तव में शोर को दूर करने के लिए, SoX को फिर से चलाएँ, इस बार के साथ शोर मचाया प्रभाव;
शोर मचाया शोर प्रोफ़ाइल के अनुसार शोर को कम कर देगा (जो इसके द्वारा उत्पन्न किया गया था)।
नॉइज़प्रोफ़), से प्रोफ़ाइल-फ़ाइल, या यदि नहीं तो stdin से प्रोफ़ाइल-फ़ाइल या यदि `-' दिया गया है।
उदाहरण के लिए
सॉक्स स्पीच.wav क्लीन.wav शोरयुक्त स्पीच.शोर-प्रोफ़ाइल 0.3
कितना शोर हटाया जाना चाहिए यह निर्दिष्ट है राशि-a 0 और 1 . के बीच की संख्या
0.5 के डिफ़ॉल्ट के साथ. अधिक संख्याएँ अधिक शोर को दूर करेंगी लेकिन अधिक शोर प्रस्तुत करेंगी
ऑडियो सिग्नल के वांछित घटकों को हटाने की संभावना। एक को बदलने से पहले
शोर कम करने वाले संस्करण के साथ मूल रिकॉर्डिंग, भिन्न के साथ प्रयोग करें राशि
आपके ऑडियो के लिए इष्टतम खोजने के लिए मान; यह जांचने के लिए कि आप हैं, हेडफ़ोन का उपयोग करें
परिणामों से खुश हूं, शांत वर्गों पर विशेष ध्यान दे रहा हूं
ऑडियो।

अधिकांश प्रणालियों पर, दो चरणों - प्रोफाइलिंग और कमी - को एक का उपयोग करके जोड़ा जा सकता है
पाइप, उदा
sox noisy.wav -n ट्रिम 0 1 नॉइज़प्रोफ़ | शोर मचाओ। शोर मचाओ

आदर्श [डीबी-स्तर]
ऑडियो को सामान्य करें. आदर्श के लिए सिर्फ एक उपनाम है लाभ -n; देखें लाभ के लिए प्रभाव
विवरण।

उफ़ चरण से बाहर स्टीरियो प्रभाव. स्टीरियो को ट्विन-मोनो में मिलाता है जहां प्रत्येक मोनो चैनल होता है
बाएँ और दाएँ स्टीरियो चैनलों के बीच अंतर शामिल है। यह है
कभी-कभी इसे 'कराओके' प्रभाव के रूप में जाना जाता है क्योंकि इसमें अक्सर अधिकांश को हटाने का प्रभाव होता है
या रिकॉर्डिंग के सभी स्वर। यह के बराबर है रीमिक्स 1,2 1,2.

तेज [लाभ(20) [रंग(20)]]
गैर रेखीय विकृति. रंग पैरामीटर सम हार्मोनिक की मात्रा को नियंत्रित करता है
अति-संचालित आउटपुट में सामग्री।

पैड { लंबाई[@स्थिति]}
ऑडियो को आरंभ, अंत या किसी निर्दिष्ट बिंदु पर मौन रखें
ऑडियो के माध्यम से. दोनों लंबाई और स्थिति एक समय निर्दिष्ट कर सकते हैं या, यदि जोड़ा गया हो
एक `एस' के साथ, कई नमूने। लंबाई सम्मिलित करने के लिए मौन की मात्रा है और
स्थिति इनपुट ऑडियो स्ट्रीम में वह स्थिति जिस पर इसे सम्मिलित करना है। कोई संख्या
लंबाई और स्थिति निर्दिष्ट की जा सकती है, बशर्ते कि एक निर्दिष्ट स्थिति हो
पिछले वाले से कम नहीं. स्थिति प्रथम और अंतिम के लिए वैकल्पिक है
लंबाई निर्दिष्ट की गई है और यदि छोड़ी गई है तो शुरुआत और अंत के अनुरूप है
क्रमशः ऑडियो. उदाहरण के लिए, पैड 1.5 1.5 1.5 सेकंड की साइलेंस पैडिंग जोड़ता है
ऑडियो के प्रत्येक छोर पर, जबकि पैड 4000 @ 3:00 मौन के 4000 नमूने सम्मिलित करता है 3
ऑडियो में मिनट. यदि केवल ऑडियो के अंत में मौन चाहता है, तो निर्दिष्ट करें
या तो अंतिम स्थिति या प्रारंभ में शून्य-लंबाई पैड निर्दिष्ट करें।

यह भी देखें देरी एक ऐसे प्रभाव के लिए जो ऑडियो की शुरुआत में मौन जोड़ सकता है
चैनल-दर-चैनल आधार।

Phaser इसमे मुनाफा होना लाभ बाहर देरी क्षय गति [-s|-t]
ऑडियो में चरणबद्ध प्रभाव जोड़ें. चरणबद्धता के विस्तृत विवरण के लिए [3] देखें।

विलंब/क्षय/गति मिलीसेकंड में विलंब और क्षय (लाभ के सापेक्ष) देती है
in) Hz में मॉड्यूलेशन गति के साथ। मॉड्यूलेशन या तो साइनसोइडल है (-s) -
एकाधिक उपकरणों के लिए बेहतर, या त्रिकोणीय (-t) - एकल उपकरण देता है
एक तीव्र चरणबद्ध प्रभाव. फीडबैक से बचने के लिए क्षय 0.5 से कम होना चाहिए, और
आमतौर पर 0.1 से कम नहीं. गेन-आउट आउटपुट की मात्रा है।

उदाहरण के लिए:
स्नेयर.फ्लैक फ़ेसर 0.8 0.74 3 0.4 0.5 -टी खेलें
सज्जन:
प्ले स्नेयर.फ्लैक फेजर 0.9 0.85 4 0.23 1.3 -एस
एक लोकप्रिय ध्वनि:
स्नेयर.फ्लैक फ़ेसर 0.89 0.85 1 0.24 2 -टी खेलें
अधिक गंभीर:
स्नेयर.फ्लैक फ़ेसर 0.6 0.66 3 0.6 2 -टी खेलें

पिच [-q] पाली [खंड [यहाँ खोजें [ओवरलैप]]]
ऑडियो पिच बदलें (लेकिन गति नहीं)।

पाली पिच शिफ्ट को सकारात्मक या नकारात्मक `सेंट' (यानी ए का 100वां हिस्सा) के रूप में देता है
अर्धस्वर)। देखें समय अन्य मापदंडों के विवरण के लिए प्रभाव।

यह भी देखें मोड़, गति, तथा समय प्रभाव.

दर [-q|-l|-m|-h|-v] [ओवरराइड-विकल्प] दर[k]
ऑडियो सैंपलिंग दर (यानी ऑडियो को फिर से सैंपल करना) को किसी भी दिए गए में बदलें दर (यहाँ तक की
गैर-पूर्णांक यदि यह आउटपुट फ़ाइल स्वरूप द्वारा समर्थित है) गुणवत्ता स्तर का उपयोग करके
निम्नानुसार परिभाषित किया गया है:

गुणवत्ता बैंड- rej dB ठेठ उपयोग
चौडाई
-q त्वरित n/a ≈30 @ प्लेबैक चालू
एफएस/4 प्राचीन हार्डवेयर
-l पुराने पर कम 80% 100 प्लेबैक
हार्डवेयर
-m मध्यम 95% 100 ऑडियो प्लेबैक
-h उच्च 95% 125 16-बिट मास्टरिंग
(dither के साथ प्रयोग करें)
-v बहुत उच्च 95% 175 24-बिट मास्टरिंग

जहां बैंड-चौड़ाई संरक्षित ऑडियो फ़्रीक्वेंसी बैंड का प्रतिशत है
और rej dB शोर अस्वीकृति का स्तर है. पुनः नमूनाकरण का स्तर बढ़ रहा है
ऑडियो को संसाधित करने में लगने वाले समय की कीमत पर गुणवत्ता आती है। अगर
कोई गुणवत्ता विकल्प नहीं दिया गया है, उपयोग किया गया गुणवत्ता स्तर 'उच्च' है (लेकिन 'बजाना और देखें'
प्लेबैक के संबंध में ऊपर 'ऑडियो रिकॉर्डिंग' की गई है)।

'त्वरित' एल्गोरिदम क्यूबिक इंटरपोलेशन का उपयोग करता है; अन्य सभी बैंड-लिमिटेड का उपयोग करते हैं
अंतर्वेशन. डिफ़ॉल्ट रूप से, सभी एल्गोरिदम में एक 'रैखिक' चरण प्रतिक्रिया होती है; के लिए
'मध्यम', 'उच्च' और 'बहुत उच्च', चरण प्रतिक्रिया कॉन्फ़िगर करने योग्य है (नीचे देखें)।

RSI दर यदि SoX है तो प्रभाव स्वचालित रूप से लागू हो जाता है -r विकल्प एक दर निर्दिष्ट करता है
इनपुट फ़ाइल(फ़ाइलों) से भिन्न है। वैकल्पिक रूप से, यदि यह प्रभाव दिया जाता है
स्पष्ट रूप से, SoX का -r विकल्प देने की आवश्यकता नहीं है. उदाहरण के लिए, निम्नलिखित दो
आदेश समतुल्य हैं:
sox इनपुट.wav -r 48k आउटपुट.wav बास -b 24
sox इनपुट.wav आउटपुट.wav बास -बी 24 रेट 48k
हालाँकि दूसरा कमांड अधिक लचीला है क्योंकि यह अनुमति देता है दर दिए जाने वाले विकल्प,
और प्रभावों को मनमाने ढंग से आदेशित करने की अनुमति देता है।

* * *

चेतावनी: तकनीकी रूप से विस्तृत चर्चा इस प्रकार है।

ऊपर वर्णित सरल गुणवत्ता चयन ऐसी सेटिंग्स प्रदान करता है जो संतुष्ट करती हैं
पुन: नमूनाकरण कार्यों के विशाल बहुमत की आवश्यकताएँ। हालाँकि, कभी-कभी ऐसा हो सकता है
रेज़ैम्पलर की फ़िल्टर प्रतिक्रिया को ठीक करने के लिए वांछनीय; इसका उपयोग करके प्राप्त किया जा सकता है
ओवरराइड विकल्पों, जैसा कि निम्नलिखित तालिका में बताया गया है:

-एम/-आई/-एल चरण प्रतिक्रिया = न्यूनतम/मध्यवर्ती/रैखिक
-s खड़ी फिल्टर (बैंड-चौड़ाई = 99%)
-a पास-बैंड के ऊपर एलियासिंग/इमेजिंग की अनुमति दें
-b 74-99.7 कोई भी बैंड-चौड़ाई %
-p 0-100 कोई भी चरण प्रतिक्रिया (0 = न्यूनतम, 25 = मध्यवर्ती,
50 = रैखिक, 100 = अधिकतम)

एनबी ओवरराइड विकल्पों का उपयोग 'त्वरित' या 'निम्न' गुणवत्ता वाले एल्गोरिदम के साथ नहीं किया जा सकता है।

सभी रेज़ैम्पलर फ़िल्टर का उपयोग करते हैं जो कभी-कभी `इको' (उर्फ `रिंगिंग') पैदा कर सकते हैं
क्षणिक संकेतों वाली कलाकृतियाँ जैसे कि वे जो 'फिंगर स्नैप' या के साथ घटित होती हैं
अन्य अत्यधिक टकराने वाली ध्वनियाँ। ऐसी कलाकृतियाँ अधिक ध्यान देने योग्य होती हैं
मानव कान में यदि वे क्षणिक ('पूर्व-प्रतिध्वनि') से पहले घटित होते हैं, तो यदि वे बाद में घटित होते हैं
यह (`पोस्ट-इको')। ध्यान दें कि ऐसी किसी भी कलाकृति की आवृत्ति से संबंधित है
मूल और नई नमूना दरों की तुलना में कम लेकिन अगर यह कम से कम है
44.1kHz, तो कलाकृतियाँ मानव श्रवण की सीमा से बाहर होंगी।

किसी भी क्षणिक के वितरण को नियंत्रित करने के लिए एक चरण प्रतिक्रिया सेटिंग का उपयोग किया जा सकता है
`पूर्व' और `पोस्ट' के बीच प्रतिध्वनि: न्यूनतम चरण के साथ, कोई पूर्व-प्रतिध्वनि नहीं है लेकिन
सबसे लंबी पोस्ट-प्रतिध्वनि; रैखिक चरण के साथ, पूर्व और पश्च प्रतिध्वनि समान मात्रा में (इंच) होती हैं
संकेत शर्तें, लेकिन श्रव्यता शर्तें नहीं); मध्यवर्ती चरण सेटिंग का प्रयास करता है
प्री-इको और ए की एक छोटी लंबाई (और स्तर) का चयन करके सर्वोत्तम समझौता ढूंढें
मध्यम लंबाई वाली पोस्ट-इको।

का उपयोग करके न्यूनतम, मध्यवर्ती या रैखिक चरण प्रतिक्रिया का चयन किया जाता है -M, -Iया, -L
विकल्प; के साथ एक कस्टम चरण प्रतिक्रिया बनाई जा सकती है -p विकल्प। उस चरण पर ध्यान दें
'रैखिक' और 'अधिकतम' (50 से अधिक) के बीच प्रतिक्रियाएँ शायद ही कभी उपयोगी होती हैं।

एक रेज़ैम्पलर की बैंड-चौड़ाई सेटिंग यह निर्धारित करती है कि कितनी आवृत्ति सामग्री है
मूल संकेत (अप-सैंपलिंग करते समय मूल नमूना दर लिखें, या नया
डाउन-सैंपलिंग करते समय नमूना दर) रूपांतरण के दौरान संरक्षित रहती है। शब्द `पास-
बैंड' का उपयोग बैंड-चौड़ाई बिंदु तक सभी आवृत्तियों को संदर्भित करने के लिए किया जाता है (उदाहरण के लिए)।
44.1kHz नमूना दर, और 95% की पुन: नमूनाकरण बैंड-चौड़ाई, पास-बैंड दर्शाता है
0Hz (DC) से लगभग 21kHz तक आवृत्तियाँ)। रेज़ैम्पलर की बैंड-विड्थ बढ़ाना
परिणामस्वरूप धीमी गति से रूपांतरण होता है और क्षणिक प्रतिध्वनि कलाकृतियों (और इसके विपरीत) में वृद्धि हो सकती है
विपरीत).

RSI -s 'स्टीप फिल्टर' विकल्प डिफ़ॉल्ट 95% से पुनः नमूना बैंड-चौड़ाई बदलता है
(3डीबी बिंदु के आधार पर), 99% तक। -b विकल्प बैंड-विड्थ को सेट करने की अनुमति देता है
74-99.7% की सीमा में कोई भी मान, लेकिन ध्यान दें कि बैंड-विड्थ मान 99% से अधिक है
सामान्य उपयोग के लिए अनुशंसित नहीं हैं क्योंकि वे अत्यधिक क्षणिक प्रतिध्वनि का कारण बन सकते हैं।

अगर -a विकल्प दिया गया है, तो पास-बैंड के ऊपर एलियासिंग/इमेजिंग की अनुमति है।
उदाहरण के लिए, 44.1kHz नमूना दर और 95% की पुन: नमूनाकरण बैंड-चौड़ाई के साथ, यह
इसका मतलब है कि 21kHz से ऊपर की आवृत्ति सामग्री को विकृत किया जा सकता है; हालाँकि, चूँकि यह है
पास-बैंड के ऊपर (अर्थात रुचि/श्रव्यता की उच्चतम आवृत्ति के ऊपर),
यह कोई समस्या नहीं हो सकती. अलियासिंग/इमेजिंग की अनुमति देने के लाभ कम हो गए हैं
प्रसंस्करण समय, और कम (लगभग आधे से) क्षणिक प्रतिध्वनि कलाकृतियाँ। ध्यान दें कि
यदि यह विकल्प दिया गया है, तो न्यूनतम बैंड-विड्थ स्वीकार्य है -b तक बढ़ जाता है
85%.

उदाहरण:
sox इनपुट.wav -b 16 आउटपुट.wav रेट -s -a 44100 dither -s
डिफ़ॉल्ट (उच्च) गुणवत्ता पुनः नमूनाकरण; ओवरराइड: स्थिर फ़िल्टर, अलियासिंग की अनुमति दें; को
44.1kHz नमूना दर; 16-बिट WAV फ़ाइल के लिए शोर-आकार का।
sox इनपुट.wav -b 24 आउटपुट.aiff दर -v -I -b 90 48k
बहुत उच्च गुणवत्ता वाला पुन: नमूनाकरण; ओवरराइड: मध्यवर्ती चरण, बैंड-चौड़ाई 90%; से 48k
नमूना दर; आउटपुट को 24-बिट एआईएफएफ फ़ाइल में संग्रहीत करें।

* * *

RSI पिच और गति प्रभाव का उपयोग करें दर उनके मूल पर प्रभाव.

रीमिक्स [-a|-m|-p]बाह्य कल्पना>
बाह्य कल्पना = इन-स्पेक{,इन-स्पेक} | 0
इन-स्पेक = [में चान][-[इन-चान2]] [वॉल्यूम-स्पेक]
वॉल्यूम-स्पेक = p|i|v[आयतन]

इनपुट ऑडियो चैनलों को आउटपुट ऑडियो चैनलों में चुनें और मिलाएं। प्रत्येक आउटपुट
चैनल, बदले में, किसी दिए गए द्वारा निर्दिष्ट किया जाता है बाह्य कल्पना: योगदान देने वाले इनपुट की एक सूची
चैनल और वॉल्यूम विशिष्टताएँ।

ध्यान दें कि यह प्रभाव ऑडियो पर काम करता है चैनलों SoX प्रभाव के अंतर्गत
प्रसंस्करण श्रृंखला; इसके साथ भ्रमित नहीं होना चाहिए -m वैश्विक विकल्प (कहाँ
विभिन्न फ़ाइलों प्रभाव श्रृंखला में प्रवेश करने से पहले मिश्रण-संयुक्त होते हैं)।

An बाह्य कल्पना इसमें अल्पविराम से अलग किए गए इनपुट चैनल-नंबर और हाइफ़न-सीमांकित शामिल हैं
चैनल-संख्या श्रेणियाँ; वैकल्पिक रूप से, 0 साइलेंट आउटपुट बनाने के लिए दिया जा सकता है
चैनल। उदाहरण के लिए,
sox इनपुट.wav आउटपुट.wav रीमिक्स 6 7 8 0
चार चैनलों के साथ एक आउटपुट फ़ाइल बनाता है, जहां चैनल 1, 2, और 3 की प्रतियां हैं
इनपुट फ़ाइल में चैनल 6, 7, और 8, और चैनल 4 मौन है। जबकि
sox इनपुट.wav आउटपुट.wav रीमिक्स 1-3,7 3
एक (कुछ विचित्र) स्टीरियो आउटपुट फ़ाइल बनाता है जहां बायां चैनल एक मिश्रण है-
इनपुट चैनल 1, 2, 3, और 7 के नीचे, और दायां चैनल इनपुट की एक प्रति है
चैनल 3.

जहां चैनलों की एक श्रृंखला निर्दिष्ट की गई है, चैनल संख्याएं बाईं और दाईं ओर हैं
हाइफ़न वैकल्पिक है और 1 और इनपुट चैनलों की संख्या के लिए डिफ़ॉल्ट है
क्रमश। इस प्रकार
sox इनपुट.wav आउटपुट.wav रीमिक्स -
मोनो में सभी इनपुट चैनलों का मिश्रण-डाउन करता है।

डिफ़ॉल्ट रूप से, जहां एक आउटपुट चैनल एकाधिक (एन) इनपुट चैनलों से मिश्रित होता है
इनपुट चैनल को ¹/n के कारक द्वारा स्केल किया जाएगा। कस्टम मिक्सिंग वॉल्यूम सेट किया जा सकता है
किसी दिए गए इनपुट चैनल या इनपुट चैनलों की श्रेणी का अनुसरण करके वॉल्यूम-स्पेक
(वॉल्यूम विशिष्टता). यह पत्रों में से एक है p, iया, vइसके बाद ए
आयतन संख्या, जिसका अर्थ दिए गए अक्षर पर निर्भर करता है और इसे इस प्रकार परिभाषित किया जाता है
इस प्रकार है:

पत्र खंड संख्या नोट्स
पी पावर डीबी में समायोजित 0 = कोई परिवर्तन नहीं
मैं डीबी में `पी' के रूप में पावर समायोजित करता हूं, लेकिन उलटा करता हूं
ऑडियो
वी वोल्टेज गुणक 1 = कोई परिवर्तन नहीं, 0.5 ≈ 6 डीबी
क्षीणन, 2 ≈ 6dB
लाभ, -1 = उलटा

यदि एक बाह्य कल्पना कम से कम एक शामिल है वॉल्यूम-स्पेक फिर, डिफ़ॉल्ट रूप से, ¹/n स्केलिंग नहीं है
समान आउट-स्पेक में किसी भी अन्य चैनल पर लागू (हालांकि अन्य आउट-स्पेक में हो सकता है)
ऐनक)। हालाँकि, स्वचालित को बनाए रखने के लिए -a (स्वचालित) विकल्प दिया जा सकता है
इस मामले में स्केलिंग. उदाहरण के लिए,
sox इनपुट.wav आउटपुट.wav रीमिक्स 1,2 3,4v0.8
जबकि, चैनल स्तर गुणक 0.5,0.5 1,0.8 में परिणामित होते हैं
sox इनपुट.wav आउटपुट.wav रीमिक्स -a 1,2 3,4v0.8
0.5,0.5 0.5,0.8 के चैनल स्तर गुणक में परिणाम।

-एम (मैन्युअल) विकल्प सभी स्वचालित वॉल्यूम समायोजन को अक्षम कर देता है
sox इनपुट.wav आउटपुट.wav रीमिक्स -m 1,2 3,4v0.8
1,1 1,0.8 के चैनल स्तर गुणक में परिणाम।

वॉल्यूम संख्या वैकल्पिक है और इसे छोड़ने से कोई वॉल्यूम परिवर्तन नहीं होता है;
हालाँकि, एकमात्र मामला जिसमें यह उपयोगी है, इसके साथ संयोजन में है i. के लिए
उदाहरण, यदि इनपुट.wav तो, स्टीरियो है
sox इनपुट.wav आउटपुट.wav रीमिक्स 1,2i
का एक मोनो समतुल्य है उफ़ प्रभाव।

अगर -p विकल्प दिया गया है, तो किसी भी स्वचालित ¹/n स्केलिंग को ¹/√n से बदल दिया जाता है
('पावर') स्केलिंग; यह तेज़ मिश्रण देता है लेकिन कभी-कभी क्लिप हो सकता है।

* * *

का एक प्रयोग रीमिक्स इसका प्रभाव एक ऑडियो फ़ाइल को फ़ाइलों के एक सेट में विभाजित करना है
घटक चैनलों में से एक युक्त (बाद में प्रदर्शन करने के लिए)।
व्यक्तिगत ऑडियो चैनलों पर प्रसंस्करण)। जहां कुछ से अधिक चैनल हैं
शामिल, निम्नलिखित जैसी एक स्क्रिप्ट (बॉर्न शेल स्क्रिप्ट) उपयोगी है:
#!/ बिन / श
चान्स=`सोक्सी -सी "$1"`
जबकि [ $chans -ge 1 ]; करना
chans0=`printf %02i $chans` # 2 अंक इसलिए 99 चांस तक
out=`echo "$1"|sed "s/\(.*\)\.\(.*\)/\1-$chans0.\2/"`
sox "$1" "$out" रीमिक्स $chans
चांस=`एक्सपीआर $चांस - 1`
किया
अगर एक फाइल इनपुट.wav जिसमें छह ऑडियो चैनल दिए गए थे, स्क्रिप्ट होगी
छह आउटपुट फ़ाइलें तैयार करें: इनपुट-01.wav, इनपुट-02.wav, ..., इनपुट-06.wav.

यह भी देखें विनिमय प्रभाव।

दोहराना [गणना (1)]
पूरा ऑडियो दोहराएँ गणना बार, या एक बार यदि गणना नहीं दिया गया है. आवश्यक है
दोहराए जाने वाले ऑडियो को संग्रहीत करने के लिए अस्थायी फ़ाइल स्थान। ध्यान दें कि एक बार दोहराते रहें
दो प्रतियां प्राप्त होती हैं: मूल ऑडियो और दोहराया गया ऑडियो।

गूंज [-w|--केवल गीला] [प्रतिध्वनि (50%) [एचएफ-डंपिंग (50%)
[कमरे का पैमाना (100%) [स्टीरियो-गहराई (100%)
[पूर्व देरी (0ms) [गीला-लाभ (0dB)]]]]]

'फ्रीवर्ब' एल्गोरिथम का उपयोग करके ऑडियो में प्रतिध्वनि जोड़ें। एक प्रतिध्वनि
यह प्रभाव कभी-कभी ऐसे कॉन्सर्ट हॉल के लिए वांछनीय होता है जो बहुत छोटे होते हैं या इतने छोटे होते हैं
कई लोगों का कहना है कि हॉल की प्राकृतिक गूंज कम हो गई है। एक छोटा सा लगाना
एक (शुष्क) मोनो सिग्नल के लिए स्टीरियो रीवरब की मात्रा आमतौर पर इसे और अधिक ध्वनि बना देगी
प्राकृतिक। प्रतिध्वनि के विस्तृत विवरण के लिए [3] देखें।

ध्यान दें कि यह प्रभाव ऑडियो की मात्रा और लंबाई दोनों को बढ़ाता है
इन डोमेन में क्लिपिंग को रोकें, एक विशिष्ट आह्वान हो सकता है:
ड्राई.वेव गेन -3 पैड 0 3 रीवरब खेलें
RSI -w केवल 'गीले' सिग्नल का चयन करने का विकल्प दिया जा सकता है, इस प्रकार इसे अनुमति दी जा सकती है
'ड्राई' सिग्नल से स्वतंत्र रूप से आगे की प्रक्रिया की गई। उदाहरण के लिए
प्ले -एम वॉयस.वेव "|सॉक्स वॉयस.वेव -पी रिवर्स रीवरब -डब्ल्यू रिवर्स"
रिवर्स रीवरब प्रभाव के लिए।

उल्टा
ऑडियो को पूरी तरह उलट दें. ऑडियो को संग्रहीत करने के लिए अस्थायी फ़ाइल स्थान की आवश्यकता है
उलट दिया जाए.

रिया आरआईएए विनाइल प्लेबैक इक्वलाइजेशन लागू करें। नमूना दर इनमें से एक होनी चाहिए: 44.1,
48, 88.2, 96 किलोहर्ट्ज़।

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

मौन [-l] उपरोक्त अवधि [अवधि द्वार[d|%]
[नीचे की अवधि अवधि द्वार[d|%]]

ऑडियो के आरंभ, मध्य या अंत से मौन हटाता है। 'मौन' है
एक निर्दिष्ट सीमा द्वारा निर्धारित।

RSI उपरोक्त अवधि मान का उपयोग यह इंगित करने के लिए किया जाता है कि ऑडियो को ट्रिम किया जाना चाहिए या नहीं
ऑडियो की शुरुआत. शून्य का मान इंगित करता है कि किसी भी प्रकार की चुप्पी नहीं काटनी चाहिए
शुरुआत। गैर-शून्य निर्दिष्ट करते समय उपरोक्त अवधि, यह ऑडियो को तब तक ट्रिम करता है
यह अपरिग्रह पाता है। आम तौर पर, जब ऑडियो की शुरुआत से मौन को ट्रिम किया जाता है
उपरोक्त अवधि 1 होगा लेकिन सभी ऑडियो को ट्रिम करने के लिए इसे उच्च मान तक बढ़ाया जा सकता है
गैर-मौन अवधियों की एक विशिष्ट गिनती तक। उदाहरण के लिए, यदि आपके पास कोई ऑडियो है
दो गानों के साथ फाइल करें जिनमें से प्रत्येक में गाने से पहले 2 सेकंड का मौन हो, आप
एक निर्दिष्ट कर सकता है उपरोक्त अवधि मौन अवधि और प्रथम दोनों को हटाने के लिए 2 में से
गाना।

. उपरोक्त अवधि गैर-शून्य है, आपको a भी निर्दिष्ट करना होगा अवधि और द्वार.
अवधि उस समय की मात्रा का संकेत देता है जिसके पहले गैर-मौन का पता लगाया जाना चाहिए
ऑडियो ट्रिम करना बंद कर देता है। अवधि को बढ़ाकर शोर के विस्फोट का इलाज किया जा सकता है
मौन और काट दिया गया।

सीमा इसका उपयोग यह इंगित करने के लिए किया जाता है कि आपको किस नमूना मूल्य को मौन मानना ​​चाहिए। के लिए
डिजिटल ऑडियो, 0 का मान ठीक हो सकता है लेकिन एनालॉग से रिकॉर्ड किए गए ऑडियो के लिए, आप ऐसा कर सकते हैं
पृष्ठभूमि शोर को ध्यान में रखते हुए मूल्य बढ़ाना चाहते हैं।

जब ऑडियो के अंत से मौन को वैकल्पिक रूप से ट्रिम किया जाता है, तो आप एक निर्दिष्ट करते हैं के नीचे-
अवधि गिनती करना। इस मामले में, नीचे की अवधि मौन के बाद सभी ऑडियो को हटाने का मतलब है
पता चला है. आम तौर पर, यह 1 का मान होगा लेकिन इसे छोड़ने के लिए बढ़ाया जा सकता है
कुछ समय के लिए मौन रहना आवश्यक है। उदाहरण के लिए, यदि आपके पास 2 वाला गाना है
बीच में 2 सेकंड का मौन और अंत में XNUMX सेकंड का मौन, आप नीचे सेट कर सकते हैं-
ऑडियो के बीच में मौन को छोड़ने के लिए 2 के मान की अवधि।

के लिए नीचे की अवधि, अवधि मौन की एक अवधि निर्दिष्ट करता है जो पहले मौजूद होनी चाहिए
ऑडियो अब कॉपी नहीं किया गया है. अधिक अवधि निर्दिष्ट करके, मौन अर्थात् मौन
वांटेड को ऑडियो में छोड़ा जा सकता है। उदाहरण के लिए, यदि आपके पास अपेक्षित गाना है
बीच में 1 सेकंड का मौन और अंत में 2 सेकंड का मौन, एक अवधि
मध्य मौन को पार करने के लिए 2 सेकंड का उपयोग किया जा सकता है।

दुर्भाग्य से, आपको अपने ऑडियो के अंत में मौन की अवधि अवश्य जाननी चाहिए
चुप्पी को विश्वसनीय ढंग से दूर करने के लिए फ़ाइल करें। इसका उपयोग करना एक उपाय है मौन में प्रभाव
के साथ संयोजन उल्टा प्रभाव। पहले ऑडियो को रिवर्स करके, आप इसका उपयोग कर सकते हैं
उपरोक्त अवधि सामने की ओर दिखने वाले सभी ऑडियो को विश्वसनीय रूप से ट्रिम करने के लिए
फ़ाइल। फिर सामान्य स्थिति में वापस आने के लिए फ़ाइल को दोबारा उल्टा करें।

किसी फ़ाइल के बीच से मौन हटाने के लिए, निर्दिष्ट करें नीचे की अवधि है
नकारात्मक। इस मान को फिर एक सकारात्मक मान के रूप में माना जाता है और इसका उपयोग भी किया जाता है
इंगित करें कि प्रभाव को निर्दिष्ट अनुसार प्रसंस्करण पुनः आरंभ करना चाहिए उपरोक्त अवधि,
इसे ऑडियो के बीच में कुछ समय के मौन को हटाने के लिए उपयुक्त बनाया गया है।

विकल्प -l दर्शाता है कि नीचे की अवधि अवधि ऑडियो की लंबाई छोड़ देनी चाहिए
मौन की प्रत्येक अवधि की शुरुआत में बरकरार। उदाहरण के लिए, यदि आप चाहते हैं
शब्दों के बीच लंबे विराम तो हटा देते हैं लेकिन विरामों को पूरी तरह नहीं हटाना चाहते।

RSI अवधि गिनती नमूनों की इकाइयों में होती है। अवधि गिनती के प्रारूप में हो सकती है
hh:mm:ss.frac, या नमूनों की सटीक गिनती। सीमा संख्याएँ प्रत्यय लगाई जा सकती हैं
साथ में d यह इंगित करने के लिए कि मान डेसीबल में है, या % का प्रतिशत इंगित करने के लिए
नमूना मूल्य का अधिकतम मूल्य (0% शुद्ध डिजिटल मौन निर्दिष्ट करता है)।

निम्नलिखित उदाहरण दिखाता है कि रिकॉर्डिंग शुरू करने के लिए इस प्रभाव का उपयोग कैसे किया जा सकता है
इसमें प्रारंभ में होने वाला विलंब शामिल नहीं है जो आमतौर पर `दबाने' के बीच होता है
रिकॉर्ड बटन' और प्रदर्शन की शुरुआत:
ग्रामीण विद्युतीकरण निगम पैरामीटर फ़ाइल का नाम अन्य-प्रभाव मौन 1 5 2%

ईमानदारी से [-a तक|-b बीटा] [-p चरण|-M|-I|-L] [-t TBW|-n नल] [फ़्रीकएचपी][-फ़्रीकएलपी [-t टीबीडब्ल्यू|-n
नल]]
एक सिंक कैसर-विंडो लो-पास, हाई-पास, बैंड-पास, या बैंड-रिजेक्ट फ़िल्टर लागू करें
संकेत के लिए. फ़्रीकएचपी और फ़्रीकएलपी पैरामीटर 6dB की आवृत्तियाँ देते हैं
उच्च-पास और निम्न-पास फ़िल्टर के बिंदु जिन्हें व्यक्तिगत रूप से लागू किया जा सकता है, या
एक साथ। यदि दोनों दिए जाएं तो फ़्रीकएचपी की तुलना में कम फ़्रीकएलपी एक बैंड-पास बनाता है
फिल्टर, फ़्रीकएचपी से अधिक से अधिक फ़्रीकएलपी एक बैंड-अस्वीकार फ़िल्टर बनाता है। उदाहरण के लिए,
आमंत्रण
3k से
सिनसी -4k
3k-4k से
4k-3k से
क्रमशः हाई-पास, लो-पास, बैंड-पास और बैंड-रिजेक्ट फिल्टर बनाएं।

120dB के डिफ़ॉल्ट स्टॉप-बैंड क्षीणन को ओवरराइड किया जा सकता है -a;
वैकल्पिक रूप से, कैसर-विंडो `बीटा' पैरामीटर सीधे दिया जा सकता है -b.

कुल बैंड के 5% की डिफ़ॉल्ट ट्रांज़िशन बैंड-चौड़ाई को ओवरराइड किया जा सकता है -t
(और TBW हर्ट्ज़ में); वैकल्पिक रूप से, फ़िल्टर नल की संख्या सीधे दी जा सकती है
साथ में -n.

अगर दोनों फ़्रीकएचपी और फ़्रीकएलपी दिए गए हैं, तो ए -t or -n के बाईं ओर विकल्प दिया गया है
आवृत्तियाँ दोनों आवृत्तियों पर लागू होती हैं; इनमें से एक विकल्प दिया गया है
आवृत्तियों का अधिकार केवल पर लागू होता है फ़्रीकएलपी.

RSI -p, -M, -I, तथा -L विकल्प फ़िल्टर की चरण प्रतिक्रिया को नियंत्रित करते हैं; देखें दर
विवरण के लिए प्रभाव.

यह प्रभाव समर्थन करता है --भूखंड वैश्विक विकल्प.

spectrogram [विकल्पों]
ऑडियो का एक स्पेक्ट्रोग्राम बनाएं; ऑडियो को SoX के माध्यम से असंशोधित रूप से पारित किया जाता है
प्रसंस्करण श्रृंखला. यह प्रभाव वैकल्पिक है - प्रकार सॉक्स --मदद और की सूची जांचें
यह देखने के लिए समर्थित प्रभाव कि क्या इसे शामिल किया गया है।

स्पेक्ट्रोग्राम पोर्टेबल नेटवर्क ग्राफ़िक (पीएनजी) फ़ाइल में प्रस्तुत किया गया है, और दिखाता है
X-अक्ष में समय, Y-अक्ष में आवृत्ति, और Z-अक्ष में ऑडियो सिग्नल परिमाण
एक्सिस। Z-अक्ष मानों को रंग (या वैकल्पिक रूप से तीव्रता) द्वारा दर्शाया जाता है
XY तल में पिक्सेल. यदि ऑडियो सिग्नल में एकाधिक चैनल हैं
इन्हें चैनल 1 (जो बाईं ओर है) से शुरू करके ऊपर से नीचे तक दिखाया गया है
स्टीरियो ऑडियो के लिए चैनल)।

उदाहरण के लिए, यदि `my.wav' एक स्टीरियो फ़ाइल है, तो
sox my.wav -n स्पेक्ट्रोग्राम
संपूर्ण फ़ाइल का एक स्पेक्ट्रोग्राम `spectrogram.png' फ़ाइल में बनाया जाएगा।
हालाँकि, अक्सर, ऑडियो के एक छोटे हिस्से के विश्लेषण की आवश्यकता होती है; उदाहरण के लिए
साथ में
sox my.wav -n रीमिक्स 2 ट्रिम 20 30 स्पेक्ट्रोग्राम
स्पेक्ट्रोग्राम केवल दूसरे (दाएं) चैनल और से जानकारी दिखाता है
बीस सेकंड से शुरू होकर तीस सेकंड का ऑडियो। एक छोटे से विश्लेषण के लिए
आवृत्ति डोमेन का भाग, दर प्रभाव का उपयोग किया जा सकता है, उदा
sox my.wav -n रेट 6k स्पेक्ट्रोग्राम
3kHz (नमूना दर का आधा) तक आवृत्तियों के विस्तृत विश्लेषण की अनुमति देता है
जहां मानव श्रवण प्रणाली सबसे संवेदनशील होती है। साथ
sox my.wav -n ट्रिम 0 10 स्पेक्ट्रोग्राम -x 600 -y 200 -z 100
दिए गए विकल्प स्पेक्ट्रोग्राम के X, Y और Z अक्षों के आकार को नियंत्रित करते हैं (इसमें)।
मामले में, निर्मित छवि का स्पेक्ट्रोग्राम क्षेत्र 600 x 200 पिक्सेल आकार का होगा
और Z-अक्ष सीमा 100 dB होगी)। ध्यान दें कि निर्मित छवि में अक्ष शामिल हैं
किंवदंतियाँ आदि और इसलिए निर्दिष्ट स्पेक्ट्रोग्राम आकार से थोड़ा बड़ा होगा।
इस उदाहरण में:
sox -n -n synth 6 tri 10k:14k स्पेक्ट्रोग्राम -z 100 -w कैसर
सर्वोत्तम प्रदर्शन के लिए उच्च गतिशील रेंज वाली एक विश्लेषण 'विंडो' का चयन किया जाता है
एक स्वेप्ट त्रिकोणीय तरंग का स्पेक्ट्रोग्राम। एक समान उदाहरण के लिए, निम्नलिखित जोड़ें
के विवरण में 'झंकार' कमांड के लिए देरी प्रभाव (ऊपर):
दर 2k स्पेक्ट्रोग्राम -X 200 -Z -10 -w कैसर
उपस्थिति को नियंत्रित करने के लिए विकल्प भी उपलब्ध हैं (रंग-सेट, चमक,
कंट्रास्ट, आदि) और स्पेक्ट्रोग्राम का फ़ाइल नाम; उदाहरण के लिए
sox my.wav -n स्पेक्ट्रोग्राम -m -l -o print.png
'ब्लैक एंड व्हाइट' प्रिंटर पर मुद्रण के लिए उपयुक्त एक स्पेक्ट्रोग्राम बनाया जाता है।

विकल्प:

-x संख्या स्पेक्ट्रोग्राम की (अधिकतम) चौड़ाई (एक्स-अक्ष) को उसके डिफ़ॉल्ट से बदलें
800 और 100 के बीच किसी दिए गए नंबर पर 200000 पिक्सेल का मान। यह भी देखें -X
और -d.

-X संख्या एक्स-अक्ष पिक्सेल/सेकंड; दिए गए या में फिट होने के लिए डिफ़ॉल्ट की स्वतः गणना की जाती है
एक्स-अक्ष आकार में ज्ञात ऑडियो अवधि, या 100 अन्यथा। यदि दिया गया है
संयोग के साथ -d, यह विकल्प स्पेक्ट्रोग्राम की चौड़ाई को प्रभावित करता है;
अन्यथा, यह स्पेक्ट्रोग्राम की अवधि को प्रभावित करता है। संख्या 1 से हो सकता है
(कम समय रिज़ॉल्यूशन) से 5000 (उच्च समय रिज़ॉल्यूशन) और एक होने की आवश्यकता नहीं है
पूर्णांक. SoX दी गई संख्या में थोड़ा समायोजन कर सकता है
प्रसंस्करण परिमाणीकरण कारण; यदि हां, तो SoX वास्तविक संख्या की रिपोर्ट करेगा
उपयोग किया गया (देखने योग्य जब SoX वैश्विक विकल्प -V प्रभाव में है)। यह सभी देखें -x और
-d.

-y संख्या Y-अक्ष आकार को पिक्सेल (प्रति चैनल) में सेट करता है; यह की संख्या है
फूरियर विश्लेषण में प्रयुक्त आवृत्ति 'बिन्स' जो स्पेक्ट्रोग्राम का निर्माण करता है।
ध्यान दें, यदि यह संख्या एक नहीं है तो स्पेक्ट्रोग्राम का उत्पादन धीमा हो सकता है
दो की शक्ति से अधिक (जैसे 129)। डिफ़ॉल्ट रूप से Y-अक्ष आकार चुना जाता है
स्वचालित रूप से (चैनलों की संख्या के आधार पर)। देखना -Y विकल्प के लिए
स्पेक्ट्रोग्राम ऊंचाई निर्धारित करने का तरीका।

-Y संख्या स्पेक्ट्रोग्राम की लक्ष्य कुल ऊंचाई निर्धारित करता है। डिफ़ॉल्ट मान है
550 पिक्सेल. इस विकल्प का उपयोग करके (और डिफ़ॉल्ट रूप से), SoX एक ऊंचाई चुनेगा
व्यक्तिगत स्पेक्ट्रोग्राम चैनलों के लिए जो दो की शक्ति से एक अधिक है, इसलिए
वास्तविक कुल ऊंचाई दी गई संख्या से कम हो सकती है। हालाँकि, वहाँ
प्रति चैनल न्यूनतम ऊंचाई भी है, इसलिए यदि कई चैनल हैं, तो
संख्या अधिक हो सकती है. देखना -y स्पेक्ट्रोग्राम सेट करने के वैकल्पिक तरीके के लिए
ऊंचाई।

-z संख्या डीबी में जेड-अक्ष (रंग) रेंज, डिफ़ॉल्ट 120। यह डायनामिक-रेंज सेट करता है
होने वाला स्पेक्ट्रोग्राम -संख्या dBFS से 0 dBFS। में 20 से 180 तक हो सकता है।
डायनामिक-रेंज घटने से प्रभावी रूप से 'कंट्रास्ट' बढ़ जाता है
स्पेक्ट्रोग्राम डिस्प्ले, और इसके विपरीत।

-Z संख्या dBFS में Z-अक्ष की ऊपरी सीमा निर्धारित करता है। एक नकारात्मक संख्या प्रभावी रूप से
स्पेक्ट्रोग्राम डिस्प्ले की 'चमक' बढ़ाता है, और इसके विपरीत।

-q संख्या Z-अक्ष परिमाणीकरण सेट करता है, अर्थात विभिन्न रंगों की संख्या (या)।
तीव्रताएँ) जिसमें Z-अक्ष मान प्रस्तुत करना है। एक छोटी संख्या (जैसे 4) होगी
एक 'पोस्टर' जैसा प्रभाव दें जिससे परिमाण बैंड को समझना आसान हो जाए
समान स्तर. छोटी संख्याओं के परिणामस्वरूप आमतौर पर छोटी पीएनजी फ़ाइलें भी बनती हैं।
दी गई संख्या Z-अक्ष सीमा के अंदर उपयोग किए जाने वाले रंगों की संख्या निर्दिष्ट करती है;
दो रंग सीमा से बाहर के मानों को दर्शाने के लिए आरक्षित हैं।

-w नाम
विंडो: हैन (डिफ़ॉल्ट), हैमिंग, बार्टलेट, आयताकार या कैसर।
स्पेक्ट्रोग्राम का उत्पादन डिस्क्रीट फूरियर ट्रांसफॉर्म (डीएफटी) का उपयोग करके किया जाता है
कलन विधि। इस एल्गोरिथम का एक महत्वपूर्ण पैरामीटर का चुनाव है
'विंडो फ़ंक्शन'। डिफ़ॉल्ट रूप से, SoX हन विंडो का उपयोग करता है जिसमें सब कुछ अच्छा है-
गोल आवृत्ति-रिज़ॉल्यूशन और गतिशील-रेंज गुण। अच्छे के लिए
फ़्रीक्वेंसी रिज़ॉल्यूशन (लेकिन कम गतिशील-रेंज), एक हैमिंग विंडो का चयन करें; के लिए
उच्च गतिशील-रेंज (लेकिन खराब आवृत्ति-रिज़ॉल्यूशन), एक कैसर का चयन करें
खिड़की। बार्टलेट और आयताकार खिड़कियाँ भी उपलब्ध हैं।

-W संख्या विंडो समायोजन पैरामीटर. इसका उपयोग छोटे-मोटे समायोजन करने के लिए किया जा सकता है
कैसर विंडो आकार. एक धनात्मक संख्या (दस तक) इसे बढ़ा देती है
गतिशील रेंज, एक ऋणात्मक संख्या इसे घटा देती है।

-s डीएफटी विंडो की सुस्त ओवरलैपिंग की अनुमति दें। कुछ मामलों में यह बढ़ सकता है
छवि तीक्ष्णता और अधिक अनुपालन प्रदान करें -x मूल्य, लेकिन पर
थोड़ा वर्णक्रमीय नुकसान का खर्च.

-m एक मोनोक्रोम स्पेक्ट्रोग्राम बनाता है (डिफ़ॉल्ट रंग है)।

-h एक उच्च-रंग पैलेट का चयन करता है - डिफ़ॉल्ट की तुलना में कम दृश्यमान सुखदायक
रंग पैलेट, लेकिन इससे विभिन्न स्तरों में अंतर करना आसान हो सकता है।
यदि इस विकल्प का उपयोग इसके साथ संयोजन में किया जाता है -m, परिणाम एक संकर होगा
मोनोक्रोम/रंग पैलेट।

-p संख्या रंगों को किसी रंग या हाइब्रिड पैलेट में क्रमबद्ध करें। संख्या पैरामीटर, से
1 (डिफ़ॉल्ट) से 6, क्रमपरिवर्तन का चयन करता है।

-l हल्के बैकग्राउंड के साथ एक 'प्रिंटर फ्रेंडली' स्पेक्ट्रोग्राम बनाता है
डिफ़ॉल्ट की पृष्ठभूमि गहरे रंग की होती है)।

-a अक्ष रेखाओं के प्रदर्शन को रोकें. यह कभी-कभी मदद के काम आता है
स्पेक्ट्रोग्राम किनारों पर कलाकृतियों को समझने के लिए।

-r कच्चा स्पेक्ट्रोग्राम: कुल्हाड़ियों और किंवदंतियों के प्रदर्शन को रोकें।

-A एक वैकल्पिक, निश्चित रंग-सेट का चयन करता है। यह केवल के लिए प्रदान किया गया है
किसी अन्य पैकेज द्वारा उत्पादित स्पेक्ट्रोग्राम के साथ संगतता। यह नहीं होना चाहिए
आमतौर पर इसका उपयोग किया जाना चाहिए क्योंकि इसमें कुछ समस्याएं हैं, कम से कम कमी तो नहीं है
निचले सिरे पर विभेदन जिसके परिणामस्वरूप निम्न-स्तर छिप जाता है
कलाकृतियाँ।

-t टेक्स्ट
स्पेक्ट्रोग्राम के ऊपर प्रदर्शित करने के लिए छवि शीर्षक - टेक्स्ट सेट करें।

-c टेक्स्ट
छवि टिप्पणी सेट करें (या साफ़ करें) - नीचे और बाईं ओर प्रदर्शित करने के लिए पाठ
स्पेक्ट्रोग्राम.

-o टेक्स्ट
स्पेक्ट्रोग्राम आउटपुट पीएनजी फ़ाइल का नाम, डिफ़ॉल्ट `spectrogram.png'।

उन्नत विकल्प:
अन्य प्रभावों को प्रभावित किए बिना ऑडियो के एक छोटे हिस्से को संसाधित करने के लिए
आउटपुट सिग्नल (इसके विपरीत जब ट्रिम प्रभाव का उपयोग किया जाता है), निम्नलिखित विकल्प हो सकते हैं
इस्तेमाल किया गया।

-d अवधि
यह विकल्प एक्स-अक्ष रिज़ॉल्यूशन को इस प्रकार सेट करता है कि दिए गए ऑडियो के साथ
अवधि ([[HH:]MM:]SS) चयनित (या डिफ़ॉल्ट) एक्स-अक्ष चौड़ाई में फिट बैठता है। के लिए
उदाहरण,
sox input.mp3 output.wav -n स्पेक्ट्रोग्राम -d 1:00 आँकड़े
ऑडियो के पहले मिनट को दिखाते हुए एक स्पेक्ट्रोग्राम बनाता है
la आँकड़े प्रभाव संपूर्ण ऑडियो सिग्नल पर लागू होता है।

यह भी देखें -X एक्स-अक्ष रिज़ॉल्यूशन सेट करने के वैकल्पिक तरीके के लिए।

-S पहर
ऑडियो स्ट्रीम में दिए गए बिंदु पर स्पेक्ट्रोग्राम प्रारंभ करें। उदाहरण के लिए
sox इनपुट.एआईएफएफ आउटपुट.wav स्पेक्ट्रोग्राम -एस 1:00
एक स्पेक्ट्रोग्राम बनाता है जो ऑडियो के पहले मिनट को छोड़कर बाकी सब कुछ दिखाता है
हालाँकि, आउटपुट फ़ाइल संपूर्ण ऑडियो स्ट्रीम प्राप्त करती है)।

वर्णक्रमीय डेटा की ऑफ़लाइन प्रोसेसिंग करने की क्षमता के लिए, देखें स्टेट
प्रभाव।

गति कारक[c]
ऑडियो गति (पिच और टेम्पो एक साथ) समायोजित करें। कारक या तो का अनुपात है
पुरानी गति से नई गति: 1 से अधिक होने पर गति बढ़ती है, 1 से कम होने पर गति धीमी होती है,
या, यदि 'सी' अक्षर के साथ जोड़ा जाता है, तो सेंट की संख्या (यानी ए का 100वां हिस्सा)
सेमीटोन) जिसके द्वारा पिच (और टेम्पो) को समायोजित किया जाना चाहिए: 0 से अधिक
बढ़ता है, 0 से कम घटता है।

तकनीकी रूप से, गति प्रभाव केवल नमूना दर जानकारी को बदलता है, छोड़कर
नमूने स्वयं अछूते हैं। दर पुनः नमूना लेने के लिए प्रभाव स्वचालित रूप से लागू हो जाता है
इसकी डिफ़ॉल्ट गुणवत्ता/गति का उपयोग करके, आउटपुट नमूना दर तक। उच्च गुणवत्ता के लिए या
इसके अलावा, उच्च गति पुन: नमूनाकरण गति प्रभाव, निर्दिष्ट करें दर प्रभाव
वांछित गुणवत्ता विकल्प के साथ.

यह भी देखें मोड़, पिच, तथा समय प्रभाव.

ब्याह [-h|-t|-q] { स्थिति[,अतिरिक्त[,हवा की ओर]] }
ऑडियो अनुभागों को एक साथ विभाजित करें। यह प्रभाव साधारण ऑडियो पर दो चीजें प्रदान करता है
संयोजन: एक (आमतौर पर छोटा) क्रॉस-फ़ेड जोड़ पर लगाया जाता है, और एक तरंग
समानता की तुलना सबसे अच्छी जगह निर्धारित करने में मदद के लिए की जाती है जहां इसे बनाना है
में शामिल हो.

विकल्पों में से एक -h, -tया, -q फीके लिफाफे को आधे के रूप में चुनने के लिए दिया जा सकता है-
कोसाइन तरंग (डिफ़ॉल्ट), त्रिकोणीय (उर्फ रैखिक), या क्वार्टर-कोसाइन तरंग
क्रमशः.

प्रकार ऑडियो मुरझाना स्तर संक्रमण
t सहसंबद्ध निरंतर लाभ अचानक
h सहसंबद्ध निरंतर लाभ सुचारू
q असंबंधित निरंतर शक्ति सुचारू

ब्याह करने के लिए सबसे पहले इसका उपयोग करें ट्रिम प्रभाव को ऑडियो अनुभागों का चयन करना होगा
जुड़ा हुआ। जैसे कि टेप ब्याह करते समय, अनुभाग का अंत होना चाहिए
कटे हुए हिस्से को एक छोटे से काटा जाना चाहिए अतिरिक्त (डिफ़ॉल्ट 0.005 सेकंड) ऑडियो
आदर्श जुड़ाव बिंदु के बाद. जोड़ने के लिए ऑडियो अनुभाग की शुरुआत
उसी के साथ छंटनी की जानी चाहिए अतिरिक्त (आदर्श जुड़ाव बिंदु से पहले), प्लस ए
अतिरिक्त हवा की ओर (डिफ़ॉल्ट 0.005 सेकंड)। SoX को फिर दोनों के साथ लागू किया जाना चाहिए
इनपुट फ़ाइलों के रूप में ऑडियो अनुभाग और ब्याह स्थिति के साथ दिया गया प्रभाव
जो ब्याह करना है - यह पहले ऑडियो अनुभाग की लंबाई है (सहित)।
अधिशेष)।

निम्नलिखित आरेख स्प्लिस ऑपरेशन को चित्रित करने के लिए टेप सादृश्य का उपयोग करता है।
प्रभाव विकर्ण कटौती का अनुकरण करता है और दो टुकड़ों को जोड़ता है:

लंबाई1 अतिरिक्त
--------><--->
_________ : : _________________
\ : : :\ `
\ : : : \ `
\: : : \`
* : : * - - *
\ : : :\ `
\ : : : \ `
______________\: : : \_____`____
: : : : :
<---> <----->
अतिरिक्त छूट

जहां * जुड़ने वाले बिंदुओं को इंगित करता है।

उदाहरण के लिए, एक लंबा गीत दो छंदों से शुरू होता है जो शुरू होते हैं (उदाहरण के लिए निर्धारित)।
का उपयोग प्ले के साथ कमान ट्रिम (प्रारंभ) प्रभाव) कई बार 0:30.125 और
1:03.432. निम्नलिखित आदेशों ने पहली कविता को काट दिया:
सॉक्स टू-लॉन्ग.वेव पार्ट1.वेव ट्रिम 0 30.130
(5 एमएस अतिरिक्त, पहली कविता शुरू होने के बाद)
सॉक्स टू-लॉन्ग.वेव पार्ट2.वेव ट्रिम 1:03.422
(5 एमएस अतिरिक्त प्लस 5 एमएस छूट, दूसरा श्लोक शुरू होने से पहले)
sox पार्ट1.wav पार्ट2.wav जस्ट-राइट.wav स्प्लिस 30.130
दूसरे उदाहरण के लिए, SoX कमांड
प्ले "|सॉक्स -एन -पी सिंथ 1 सिन %1" "|सॉक्स -एन -पी सिंथ 1 सिन %3"
दो नोट्स उत्पन्न करता है और चलाता है, लेकिन संक्रमण पर एक बुरा क्लिक होता है;
क्लिक को ऑडियो को संयोजित करने के बजाय स्प्लिसिंग द्वारा हटाया जा सकता है, अर्थात
जोड़कर ब्याह 1 आदेश के लिए. (ऑडियो के आरंभ और अंत पर क्लिक करें
द्वारा हटाया जा सकता है पूर्ववर्ती के साथ ब्याह प्रभाव फीका करना q 01. 2 01.).

बशर्ते आपका अंकगणित काफी अच्छा हो, एकाधिक जोड़ एक के साथ निष्पादित किए जा सकते हैं
एक ब्याह मंगलाचरण। उदाहरण के लिए:
#!/ बिन / श
# ऑडियो कॉपी और पेस्ट करें
# एसीपीओ इनफाइल कॉपी-स्टार्ट कॉपी-स्टॉप पेस्ट-ओवर-स्टार्ट आउटफाइल
# सभी समय नमूनों में मापा गया।
दर=`सोक्सी -आर "$1"`
e=`expr $rate '*' 5/1000` # डिफ़ॉल्ट अतिरिक्त का उपयोग करना
l=$e # और छूट.
sox "$1" टुकड़ा.wav ट्रिम `expr $2 - $e - $l`s
`एक्सपीआर $3 - $2 + $ई + $एल + $ई`एस
sox "$1" भाग1.wav ट्रिम 0 `expr $4 + $e`s
sox "$1" भाग2.wav ट्रिम `expr $4 + $3 - $2 - $e - $l`s
सॉक्स पार्ट1.वेव पीस.वेव पार्ट2.वेव "$5" ब्याह
`एक्सपीआर $4 + $ई`एस
expr $4 + $e + $3 - $2 + $e + $l + $e`s
उपरोक्त बॉर्न शेल स्क्रिप्ट में, ऑडियो को 'कॉपी और पेस्ट' करने के लिए दो स्प्लिसेस का उपयोग किया जाता है।

* * *

इस प्रभाव का उपयोग सामान्य क्रॉस-फ़ेड निष्पादित करने के लिए भी संभव है, उदाहरण के लिए शामिल होने के लिए
दो गाने. इस मामले में, अतिरिक्त आम तौर पर कुछ सेकंड होंगे -q
विकल्प आम तौर पर दिया जाएगा ('समान शक्ति' क्रॉस-फ़ेड का चयन करने के लिए), और हवा की ओर
शून्य होना चाहिए (जो डिफ़ॉल्ट है यदि -q दिया हुआ है)। उदाहरण के लिए, यदि f1.wav और
f2.wav तो फिर क्रॉस-फ़ेड की जाने वाली ऑडियो फ़ाइलें हैं
sox f1.wav f2.wav out.wav ब्याह -q $(soxi -D f1.wav),3
उन फ़ाइलों को क्रॉस-फ़ेड करता है जहाँ समान ध्वनि का बिंदु समाप्ति से 3 सेकंड पहले होता है
f1.wav की, यानी क्रॉस-फ़ेड की कुल लंबाई 2 × 3 = 6 सेकंड है (नोट:
$(...) अंकन POSIX शेल है)।

स्टेट [-s स्केल] [-आरएमएस] [-आवृत्ति] [-v] [-d]
ऑडियो के बारे में समय और आवृत्ति डोमेन सांख्यिकीय जानकारी प्रदर्शित करें। ऑडियो
SoX प्रसंस्करण श्रृंखला के माध्यम से असंशोधित पारित किया जाता है।

जानकारी `मानक त्रुटि' (stderr) स्ट्रीम पर आउटपुट है और है
गणना की गई, कहाँ n नमूनों में ऑडियो की अवधि है, c की संख्या है
ऑडियो चैनल, r ऑडियो नमूना दर है, और xk पीसीएम मान का प्रतिनिधित्व करता है (में
ऑडियो में प्रत्येक क्रमिक नमूने की सीमा (डिफ़ॉल्ट रूप से -1 से +1) इस प्रकार है:

नमूने पढ़ना n×c
लंबाई (सेकंड) n÷r
परतदार by नीचे देखें -s.
अधिकतम आयाम अधिकतम(xk) अधिकतम नमूना मूल्य
ऑडियो में; आम तौर पर
यह सकारात्मक होगा
संख्या.
न्यूनतम आयाम मिनट(xk) न्यूनतम नमूना मूल्य
ऑडियो में; आम तौर पर
यह नकारात्मक होगा
संख्या.
मध्य रेखा आयाम ½मिनट(xk)+½अधिकतम(xk)
मतलब आदर्श ¹/nΣ│xk│ का औसत
प्रत्येक का पूर्ण मूल्य
ऑडियो में नमूना.
मतलब आयाम ¹/nΣxk प्रत्येक का औसत
ऑडियो में नमूना. अगर
यह आंकड़ा शून्य नहीं है,
तो यह इंगित करता है
एक डीसी की उपस्थिति
ऑफसेट (जो हो सकता है
का उपयोग करके हटा दिया गया
डीसीशिफ्ट प्रभाव)।
आरएमएस आयाम √(¹/nΣxk²) डीसी का स्तर
संकेत जो होगा
के समान शक्ति
ऑडियो की औसत शक्ति.
अधिकतम डेल्टा अधिकतम(│xk-एक्सके-1│)
न्यूनतम डेल्टा मिनट(│xk-एक्सके-1│)
मतलब डेल्टा ¹/n-1Σ│xk-एक्सके-1
आरएमएस डेल्टा √(¹/n-1Σ(xk-एक्सके-1)²)
असभ्य आवृत्ति हर्ट्ज में.
खंड समायोजन के लिए पैरामीटर वॉल
जो प्रभाव पड़ेगा
ऑडियो उतना ही तेज़
बिना संभव है
कतरन. नोट: देखें
पर चर्चा कतरन
उपरोक्त कारणों से ऐसा क्यों है
यह शायद ही कभी एक अच्छा विचार है
वास्तव में ऐसा करने के लिए.

ध्यान दें कि डेल्टा माप मल्टी-चैनल ऑडियो के लिए लागू नहीं हैं।

RSI -s किसी दिए गए कारक द्वारा इनपुट डेटा को स्केल करने के लिए विकल्प का उपयोग किया जा सकता है। डिफ़ॉल्ट
के मूल्य स्केल 2147483647 है (अर्थात् 32-बिट हस्ताक्षरित पूर्णांक का अधिकतम मान)।
आंतरिक प्रभाव हमेशा हस्ताक्षरित लंबे पीसीएम डेटा के साथ काम करते हैं और इसलिए मान होना चाहिए
इस तथ्य से संबंधित.

RSI -आरएमएस विकल्प सभी आउटपुट औसत मानों को 'मूल माध्य वर्ग' में बदल देगा
प्रारूप.

RSI -v विकल्प केवल 'वॉल्यूम समायोजन' मान प्रदर्शित करता है।

RSI -आवृत्ति विकल्प के बजाय इनपुट के पावर स्पेक्ट्रम (4096 पॉइंट डीएफटी) की गणना करता है
ऊपर सूचीबद्ध आँकड़े। इसका उपयोग केवल एकल चैनल ऑडियो के साथ किया जाना चाहिए
फ़ाइल.

RSI -d विकल्प SoX में 32-बिट हस्ताक्षरित PCM डेटा ऑडियो का हेक्स डंप प्रदर्शित करता है
आंतरिक बफ़र. इसका उपयोग मुख्य रूप से एंडियन समस्याओं को ट्रैक करने में मदद के लिए किया जाता है
कभी-कभी SoX के क्रॉस-प्लेटफ़ॉर्म संस्करणों में होता है।

यह भी देखें आँकड़े प्रभाव।

आँकड़े [-b बिट्स|-x बिट्स|-s स्केल] [-w खिड़की-समय]
ऑडियो चैनलों के बारे में समय डोमेन सांख्यिकीय जानकारी प्रदर्शित करें; ऑडियो है
SoX प्रसंस्करण श्रृंखला के माध्यम से असंशोधित पारित किया गया। सांख्यिकी की गणना की जाती है और
प्रत्येक ऑडियो चैनल के लिए प्रदर्शित किया गया है और, जहां लागू हो, एक समग्र आंकड़ा भी है
दिया हुआ।

उदाहरण के लिए, एक विशिष्ट अच्छी तरह से विकसित स्टीरियो संगीत फ़ाइल के लिए:

कुल मिलाकर बाएँ दाएँ
डीसी ऑफसेट 0.000803 -0.000391 0.000803
न्यूनतम स्तर -0.750977 -0.750977 -0.653412
अधिकतम स्तर 0.708801 0.708801 0.653534
पीके लेव डीबी -2.49 -2.49 -3.69
आरएमएस लेव डीबी -19.41 -19.13 -19.71
आरएमएस पीके डीबी -13.82 -13.82 -14.38
आरएमएस टीआर डीबी -85.25 -85.25 -82.66
क्रेस्ट फ़ैक्टर - 6.79 6.32
फ्लैट फैक्टर 0.00 0.00 0.00
पीके गिनती 2 2 2
बिट-गहराई 16/16 16/16 16/16
नमूनों की संख्या 7.72M
लंबाई एस 174.973
स्केल अधिकतम 1.000000
विंडो एस 0.050

DC ओफ़्सेट, मिन स्तर, तथा मैक्स स्तर डिफ़ॉल्ट रूप से, ±1 की सीमा में दिखाए जाते हैं। यदि
-b (बिट्स) विकल्प दिए गए हैं, तो इन तीन मापों को स्केल किया जाएगा
बिट्स की दी गई संख्या के साथ हस्ताक्षरित पूर्णांक; उदाहरण के लिए, 16 बिट्स के लिए, स्केल
-32768 से +32767 होगा। -x विकल्प उसी तरह व्यवहार करता है जैसे -b सिवाय इसके कि
हस्ताक्षरित पूर्णांक मान हेक्साडेसिमल में प्रदर्शित होते हैं। -s विकल्प तराजू
किसी दिए गए फ़्लोटिंग-पॉइंट नंबर द्वारा तीन माप।

Pk लेव dB और आरएमएस लेव dB मानक शिखर और आरएमएस स्तर डीबीएफएस में मापा जाता है।
आरएमएस Pk dB और आरएमएस Tr dB आरएमएस स्तर के लिए शिखर और गर्त मान एक से अधिक मापा जाता है
छोटी विंडो (डिफ़ॉल्ट 50ms)।

क्रेस्ट कारक शिखर से आरएमएस स्तर का मानक अनुपात है (नोट: डीबी में नहीं)।

फ्लैट कारक समतलता का एक माप है (यानी समान के साथ लगातार नमूने)।
सिग्नल का मान) अपने चरम स्तर पर (यानी या तो)। मिन स्तरया, मैक्स स्तर).
Pk गणना संकेत मिलने वाले अवसरों की संख्या (न कि नमूनों की संख्या) है
या तो प्राप्त किया मिन स्तरया, मैक्स स्तर.

दाहिना हाथ थोड़ी गहराई चित्र बिट-डेप्थ अर्थात बिट्स की मानक परिभाषा है
दी गई संख्या से कम महत्वपूर्ण संख्या शून्य पर तय की गई है। बाएँ हाथ की आकृति है
सबसे महत्वपूर्ण बिट्स की संख्या जो शून्य (या नकारात्मक के लिए एक) पर तय की गई है
संख्याएँ) दाएँ हाथ की आकृति से घटाई गई (घटाई गई संख्या सीधे है
से संबंधित Pk लेव dB).

मल्टी-चैनल ऑडियो के लिए, उपरोक्त प्रत्येक माप के लिए एक समग्र आंकड़ा है
चैनल के आंकड़े इस प्रकार दिए गए हैं और उनसे प्राप्त किए गए हैं: DC ओफ़्सेट: अधिकतम
परिमाण; मैक्स स्तर, Pk लेव dB, आरएमएस Pk dB, थोड़ी गहराई: अधिकतम; मिन स्तर,
आरएमएस Tr dB: न्यूनतम; आरएमएस लेव dB, फ्लैट कारक, Pk गणना: औसत; क्रेस्ट कारक: नहीं
लागू हो।

लंबाई s ऑडियो की अवधि सेकंड में है, और में नमूने के बराबर है
नमूना-दर से गुणा किया गया लंबाई. स्केल मैक्स स्केलिंग पहले पर लागू होती है
तीन माप; विशेष रूप से, यह वह अधिकतम मूल्य है जिस पर लागू हो सकता है
मैक्स स्तर. खिड़की s शिखर और गर्त आरएमएस के लिए उपयोग की जाने वाली विंडो की लंबाई है
माप।

यह भी देखें स्टेट प्रभाव।

विनिमय स्टीरियो चैनल स्वैप करें. यह सभी देखें रीमिक्स ऐसे प्रभाव के लिए जो मनमाने चैनल की अनुमति देता है
चयन और ऑर्डर करना (और मिश्रण)।

खिंचाव कारक [खिड़की फीका करना पाली लुप्त होती]
ऑडियो की अवधि बदलें (लेकिन उसकी पिच नहीं)। यह प्रभाव मोटे तौर पर समतुल्य है
को समय (के साथ प्रभावकारक उलटा और) यहाँ खोजें शून्य पर सेट करें, इसलिए सामान्य तौर पर,
इसके परिणाम तुलनात्मक रूप से ख़राब हैं; इसे बरकरार रखा जाता है क्योंकि यह कभी-कभी बेहतर प्रदर्शन कर सकता है
समय छोटे के लिए कारकs.

कारक स्ट्रेचिंग का: >1 लंबा, <1 अवधि छोटा। खिड़की आकार एमएस में है.
डिफ़ॉल्ट 20ms है. फीका करना विकल्प, 'लिन' हो सकता है। पाली अनुपात, [0 1] में। गलती करना
खिंचाव कारक पर निर्भर करता है. छोटा करने के लिए 1, लंबा करने के लिए 0.8। लुप्त होती अनुपात, [0 में
0.5]। फ़ेड की डिफॉल्ट की मात्रा इस पर निर्भर करती है कारक और पाली.

यह भी देखें समय प्रभाव।

synth [-j KEY] [-n] [लेन [बंद [ph [p1 [p2 [p3]]]]]] {[टाइप] [गठबंधन]
[[%]फ्रीक[k][:|+|/|-[%]आवृत्ति2[k]]] [बंद [ph [p1 [p2 [p3]]]]]}
इस प्रभाव का उपयोग निश्चित या स्वेप्ट फ़्रीक्वेंसी ऑडियो टोन उत्पन्न करने के लिए किया जा सकता है
विभिन्न तरंग आकार, या विभिन्न 'रंगों' का वाइड-बैंड शोर उत्पन्न करने के लिए। विभिन्न
अधिक जटिल तरंगों का उत्पादन करने के लिए सिंथ प्रभावों को कैस्केड किया जा सकता है; प्रत्येक चरण में यह
यह चुनना संभव है कि उत्पन्न तरंगरूप को मिश्रित किया जाएगा या नहीं
पिछले चरण के आउटपुट पर संशोधित। प्रत्येक चैनल के लिए ऑडियो
मल्टी-चैनल ऑडियो फ़ाइल को स्वतंत्र रूप से संश्लेषित किया जा सकता है।

हालाँकि इस प्रभाव का उपयोग ऑडियो उत्पन्न करने के लिए किया जाता है, फिर भी एक इनपुट फ़ाइल दी जानी चाहिए,
जिसकी विशेषताओं का उपयोग संश्लेषित ऑडियो लंबाई निर्धारित करने के लिए किया जाएगा
चैनलों की संख्या, और नमूनाकरण दर; हालाँकि, चूंकि इनपुट फ़ाइल का ऑडियो है
सामान्यतः इसकी आवश्यकता नहीं होती, एक 'शून्य फ़ाइल' (विशेष नाम के साथ)। -n) अक्सर दिया जाता है
इसके बजाय (और पैरामीटर के रूप में निर्दिष्ट लंबाई synth या किसी अन्य द्वारा दिया गया
प्रभाव जिसकी संबद्ध लंबाई हो सकती है)।

उदाहरण के लिए, निम्नलिखित एक 3 सेकंड, 48kHz, ऑडियो फ़ाइल उत्पन्न करता है जिसमें a शामिल है
साइन-वेव 300 से 3300 हर्ट्ज़ तक प्रवाहित:
sox -n आउटपुट.wav सिंथ 3 साइन 300-3300
और यह 8 kHz संस्करण तैयार करता है:
sox -r 8000 -n आउटपुट.wav सिंथ 3 साइन 300-3300
दिखाए गए मापदंडों के सेट को निर्दिष्ट करके एकाधिक चैनलों को संश्लेषित किया जा सकता है
ब्रेसिज़ के बीच कई बार; निम्नलिखित स्वेप्ट टोन को बाईं ओर रखता है
चैनल और दाईं ओर 'भूरा' शोर जोड़ता है:
सॉक्स -एन आउटपुट.वेव सिंथ 3 साइन 300-3300 ब्राउननोइज़
निम्नलिखित उदाहरण दिखाता है कि कैसे दो सिंथ प्रभावों को और अधिक बनाने के लिए कैस्केड किया जा सकता है
जटिल तरंगरूप:
प्ले-एन सिंथ 0.5 साइन 200-500 सिंथ 0.5 साइन एफएमओडी 700-100
आवृत्तियों को 'वैज्ञानिक' नोट नोटेशन में, या, '%' उपसर्ग लगाकर भी दिया जा सकता है
वर्ण, 'मध्य ए' (440 हर्ट्ज़) के सापेक्ष कई सेमीटोन के रूप में। उदाहरण के लिए,
गिटार की कम 'ई' स्ट्रिंग को ट्यून करने में मदद के लिए निम्नलिखित का उपयोग किया जा सकता है:
प्ले -एन सिंथ 4 प्लक %-29
या (बॉर्न शेल) लूप के साथ, संपूर्ण गिटार:
E2 A2 D3 G3 B3 E4 में n के लिए; करना
प्ले -एन सिंथ 4 प्लक $एन रिपीट 2; हो गया
देखना देरी प्रभाव (ऊपर) और `SoX स्क्रिप्टिंग उदाहरण' का संदर्भ (नीचे)
और अधिक के लिए synth उदाहरण।

एनबी यह प्रभाव अधिकतम वॉल्यूम (0dBFS) पर ऑडियो उत्पन्न करता है, जिसका अर्थ है कि वहाँ
बाद में ऑडियो का उपयोग करते समय क्लिपिंग की उच्च संभावना होती है, इसलिए कई मामलों में,
आप इस प्रभाव का अनुसरण करना चाहेंगे लाभ इसे रोकने के लिए प्रभाव
हो रहा है. (यह सभी देखें कतरन ऊपर।) ध्यान दें कि, डिफ़ॉल्ट रूप से, synth प्रभाव
की कार्यक्षमता को सम्मिलित करता है लाभ -h (देखें लाभ विवरण के लिए प्रभाव);
synth's -n इस व्यवहार को अक्षम करने का विकल्प दिया जा सकता है।

प्रत्येक का विस्तृत विवरण synth पैरामीटर इस प्रकार है:

लेन संश्लेषण के लिए ऑडियो की लंबाई को समय या संख्या के रूप में व्यक्त किया जाता है
नमूने; 0=इनपुटलेंथ, डिफ़ॉल्ट=0.

समय में लंबाई निर्दिष्ट करने का प्रारूप hh:mm:ss.frac है। के लिए प्रारूप
नमूना गणना निर्दिष्ट करना नमूनों की संख्या है जिसके साथ अक्षर 'एस' जुड़ा हुआ है
यह।

टाइप साइन, वर्ग, त्रिकोण, सॉटूथ, ट्रेपेज़ियम, ऍक्स्प, [सफ़ेद]शोर में से एक है,
टीपीडीएफनोइज़ पिंकनोइज़, ब्राउननोइज़, प्लक; डिफ़ॉल्ट=साइन.

गठबंधन क्रिएट, मिक्स, एमॉड (आयाम मॉड्यूलेशन), एफएमओडी (फ़्रीक्वेंसी) में से एक है
मॉड्यूलेशन); डिफ़ॉल्ट=बनाएँ.

फ्रीक/आवृत्ति2 संश्लेषण के आरंभ/अंत में आवृत्तियाँ Hz या, यदि में हैं
`%' से पहले, ए (440 हर्ट्ज) के सापेक्ष अर्धस्वर; वैकल्पिक रूप से, 'वैज्ञानिक'
नोट नोटेशन (जैसे E2) का उपयोग किया जा सकता है। डिफ़ॉल्ट आवृत्ति 440Hz है. डिफ़ॉल्ट रूप से,
नोट नोटेशन के साथ प्रयुक्त ट्यूनिंग 'समान स्वभाव' है; -j KEY विकल्प
'सिर्फ इंटोनेशन' का चयन करता है, जहां KEY के सापेक्ष सेमीटोन की एक पूर्णांक संख्या है
ए (उदाहरण के लिए, -9 या 3 सी की कुंजी का चयन करता है), या वैज्ञानिक नोटेशन में एक नोट।

If आवृत्ति2 दिया जाता है, तो लेन भी दिया होगा और उत्पन्न स्वर भी होगा
दी गई आवृत्तियों के बीच बह जाना। दी गई दो आवृत्तियाँ होनी चाहिए
`:', `+', `/', या `-' वर्णों में से किसी एक द्वारा अलग किया गया। इस अक्षर का प्रयोग किया जाता है
स्वीप फ़ंक्शन को निम्नानुसार निर्दिष्ट करने के लिए:

: रैखिक: स्वर प्रति सेकंड हर्ट्ज़ की एक निश्चित संख्या से बदल जाएगा।

+ वर्ग: टोन बदलने के लिए दूसरे क्रम के फ़ंक्शन का उपयोग किया जाता है।

/ घातीय: स्वर प्रति सेकंड सेमीटोन की एक निश्चित संख्या से बदल जाएगा।

- घातांक: `/' के रूप में, लेकिन प्रारंभिक चरण हमेशा शून्य होता है, और चरणबद्ध (कम) होता है
सुचारू) आवृत्ति परिवर्तन।

शोर के लिए उपयोग नहीं किया जाता.

बंद प्रतिशत में सिग्नल का पूर्वाग्रह (डीसी-ऑफ़सेट) है; डिफ़ॉल्ट=0.

ph 1 चक्र के प्रतिशत में चरण बदलाव है; डिफ़ॉल्ट=0. शोर के लिए उपयोग नहीं किया जाता.

p1 प्रत्येक चक्र का प्रतिशत है जो 'पर' (वर्ग), या 'बढ़ रहा है' (त्रिकोण,
ऍक्स्प, ट्रेपेज़ियम); डिफ़ॉल्ट=50 (वर्ग, त्रिकोण, क्स्प), डिफ़ॉल्ट=10 (ट्रैपेज़ियम), या
कायम रखना (तोड़ना); डिफ़ॉल्ट=40.

p2 (ट्रैपेज़ियम): प्रत्येक चक्र के माध्यम से प्रतिशत जिस पर 'गिरना' शुरू होता है;
डिफ़ॉल्ट=50. ऍक्स्प: 2dB के गुणकों में आयाम; डिफ़ॉल्ट=50, या टोन-1 (प्लक);
डिफ़ॉल्ट=20.

p3 (ट्रैपेज़ियम): प्रत्येक चक्र के माध्यम से प्रतिशत जिस पर 'गिरना' समाप्त होता है;
डिफ़ॉल्ट=60, या टोन-2 (प्लक); डिफ़ॉल्ट=90.

समय [-q] [-m|-s|-l] कारक [खंड [यहाँ खोजें [ओवरलैप]]]
ऑडियो प्लेबैक गति बदलें लेकिन उसकी पिच नहीं। यह प्रभाव WSOLA का उपयोग करता है
कलन विधि। ऑडियो को खंडों में विभाजित किया जाता है जिन्हें समय के साथ स्थानांतरित कर दिया जाता है
डोमेन और ओवरलैप्ड (क्रॉस-फ़ेड) उन बिंदुओं पर जहां उनके तरंग रूप सबसे अधिक हैं
'न्यूनतम वर्ग' के माप द्वारा निर्धारित के समान।

डिफ़ॉल्ट रूप से, सर्वोत्तम ओवरलैपिंग बिंदुओं को खोजने के लिए रैखिक खोजों का उपयोग किया जाता है। यदि
वैकल्पिक -q पैरामीटर दिया गया है, इसके स्थान पर ट्री खोजों का उपयोग किया जाता है। यह बनाता है
प्रभाव अधिक तेजी से काम करता है, लेकिन परिणाम उतना अच्छा नहीं लग सकता है। हालाँकि, यदि आप
प्रसंस्करण गति में सुधार करना चाहिए, इससे आम तौर पर ध्वनि की गुणवत्ता कम हो जाती है
खोज या ओवरलैप मानों को कम करने की तुलना में।

RSI -m विकल्प का उपयोग सेगमेंट के डिफ़ॉल्ट मानों को अनुकूलित करने, खोजने और ओवरलैप करने के लिए किया जाता है
संगीत प्रसंस्करण.

RSI -s विकल्प का उपयोग सेगमेंट के डिफ़ॉल्ट मानों को अनुकूलित करने, खोजने और ओवरलैप करने के लिए किया जाता है
भाषण प्रसंस्करण.

RSI -l विकल्प का उपयोग सेगमेंट के डिफ़ॉल्ट मानों को अनुकूलित करने, खोजने और ओवरलैप करने के लिए किया जाता है
'रैखिक' प्रसंस्करण जो अधिक ध्यान देने योग्य विकृति का कारण बनता है लेकिन हो सकता है
तब उपयोगी जब कारक 1 के करीब हो।

यदि -m, -s, या -l निर्दिष्ट किया गया है, तो खंड के डिफ़ॉल्ट मान की गणना की जाएगी
कारक पर आधारित, जबकि डिफ़ॉल्ट खोज और ओवरलैप मान खंड पर आधारित होते हैं। कोई
आपके द्वारा प्रदान किए गए मान अभी भी इन डिफ़ॉल्ट मानों को ओवरराइड करते हैं।

कारक नई गति और पुरानी गति का अनुपात देता है, उदाहरण के लिए 1.1 गति बढ़ाता है
गति 10% तक, और 0.9 इसे 10% तक धीमा कर देता है।

वैकल्पिक खंड पैरामीटर एल्गोरिदम के खंड आकार का चयन करता है
मिलीसेकंड. यदि कोई अन्य ध्वज निर्दिष्ट नहीं है, तो डिफ़ॉल्ट मान 82 है
आमतौर पर संगीत की गति में छोटे बदलाव करने के लिए उपयुक्त है। बड़े बदलावों के लिए
(उदाहरण के लिए 2 का कारक), 41 एमएस बेहतर परिणाम दे सकता है। -एम, -एस, और -एल झंडे
कारक के आधार पर खंड डिफ़ॉल्ट को स्वचालित रूप से समायोजित किया जाएगा। के लिए
उदाहरण के लिए 1.25 की गति के साथ -s (भाषण के लिए) का उपयोग करके एक डिफ़ॉल्ट खंड की गणना की जाएगी
32 का मान।

वैकल्पिक यहाँ खोजें पैरामीटर ऑडियो की लंबाई मिलीसेकंड में देता है जिस पर
एल्गोरिदम अतिव्यापी बिंदुओं की खोज करेगा। यदि कोई अन्य ध्वज निर्दिष्ट नहीं है, तो
डिफ़ॉल्ट मान 14.68 है. बड़े मान अधिक प्रसंस्करण समय का उपयोग करते हैं और हो भी सकता है और नहीं भी
बेहतर परिणाम उत्पन्न करें. एक व्यावहारिक अधिकतम खंड का आधा मूल्य है। खोज
आउटपुट गुणवत्ता में गिरावट के जोखिम पर प्रसंस्करण समय में कटौती करने के लिए इसे कम किया जा सकता है।
-एम, -एस, और -एल झंडे खोज डिफ़ॉल्ट को स्वचालित रूप से समायोजित करने का कारण बनेंगे
खंड के आधार पर.

वैकल्पिक ओवरलैप पैरामीटर सेगमेंट ओवरलैप लंबाई को मिलीसेकंड में देता है।
डिफ़ॉल्ट मान 12 है, लेकिन -m, -s, या -l झंडे स्वचालित रूप से इसके आधार पर ओवरलैप समायोजित करते हैं
खंड का आकार. ओवरलैप बढ़ने से प्रसंस्करण समय बढ़ता है और बढ़ भी सकता है
गुणवत्ता। ओवरलैप के लिए एक व्यावहारिक अधिकतम ओवरलैप के साथ खोज का मूल्य है
आम तौर पर (कम से कम) खोज से थोड़ा छोटा होता है।

यह भी देखें गति ऐसे प्रभाव के लिए जो गति और पिच को एक साथ बदल देता है, पिच और मोड़
उन प्रभावों के लिए जो केवल पिच बदलते हैं, और खिंचाव एक ऐसे प्रभाव के लिए जो गति को बदल देता है
एक अलग एल्गोरिदम का उपयोग करना।

तिहरा लाभ [आवृत्ति[k] [चौडाई[s|h|k|o|q]]]
तिगुना टोन-नियंत्रण प्रभाव लागू करें। का विवरण देखें बास के लिए प्रभाव
विवरण।

tremolo गति [गहराई]
ऑडियो पर ट्रेमोलो (कम आवृत्ति आयाम मॉड्यूलेशन) प्रभाव लागू करें।
हर्ट्ज में ट्रेमोलो आवृत्ति द्वारा दी गई है गति, और गहराई प्रतिशत के रूप में गहराई
(डिफ़ॉल्ट 40)।

ट्रिम {[=|-]स्थिति}
ऑडियो से कुछ अंश काट देता है. किसी भी संख्या में स्थितिs दिया जा सकता है; ऑडियो नहीं है
पहले तक आउटपुट पर भेजा गया स्थिति पहुंच गया। फिर प्रभाव बदलता रहता है
प्रत्येक स्थान पर ऑडियो को कॉपी करने और हटाने के बीच स्थिति.

एक तो स्थिति यदि इसके पहले बराबर या ऋण चिह्न है, तो इसकी व्याख्या इसके सापेक्ष की जाती है
क्रमशः ऑडियो की शुरुआत या अंत। (ऑडियो की लंबाई होनी चाहिए
काम करने के लिए अंतिम-सापेक्ष स्थानों के लिए जाना जाता है।) अन्यथा, इसे ऑफसेट माना जाता है
के पिछले स्थिति, या पहले पैरामीटर के लिए ऑडियो की शुरुआत से। का उपयोग करते हुए
पहले के लिए 0 का मान स्थिति पैरामीटर शुरुआत से ही कॉपी करने की अनुमति देता है
ऑडियो.

सभी मापदंडों को समय की मात्रा या सटीक गणना का उपयोग करके निर्दिष्ट किया जा सकता है
नमूने. समय में लंबाई निर्दिष्ट करने का प्रारूप hh:mm:ss.frac है। का एक मान
पहले पैरामीटर के लिए 1:30.5 1 मिनट, तीस और ½ सेकंड तक शुरू नहीं होगा
ऑडियो में. नमूना गणना निर्दिष्ट करने का प्रारूप नमूनों की संख्या है
इसके साथ अक्षर `s' जुड़ा हुआ है। पहले पैरामीटर के लिए 8000s का मान होगा
ऑडियो संसाधित करने से पहले 8000 नमूने पढ़े जाने तक प्रतीक्षा करें।

उदाहरण के लिए,
सॉक्स इनफाइल आउटफाइल ट्रिम 0 10
जबकि, पहले दस सेकंड कॉपी कर लेंगे
इनफ़ाइल ट्रिम चलाएं 12:34 =15:00 -2:00
ऑडियो में 12 मिनट 34 सेकंड से लेकर 15 मिनट तक ऑडियो चलेगा
(यानी 2 मिनट और 26 सेकंड लंबा), फिर दो मिनट पहले खेलना शुरू करें
ऑडियो का अंत.

अपनमूना [कारक]
पूर्णांक कारक द्वारा सिग्नल को अपसैंपल करें: कारक-1 शून्य-मूल्य नमूने डाले गए हैं
इनपुट नमूनों की प्रत्येक जोड़ी के बीच। परिणामस्वरूप, मूल स्पेक्ट्रम है
नए फ़्रीक्वेंसी स्पेस (अलियासिंग) में दोहराया गया और क्षीण किया गया। यह
क्षीणन की भरपाई जोड़कर की जा सकती है वॉल कारक किसी भी आगे के बाद
प्रसंस्करण. अपसैंपल प्रभाव का उपयोग आम तौर पर फ़िल्टरिंग के साथ संयोजन में किया जाता है
प्रभाव.

एंटी-अलियासिंग के साथ सामान्य पुनः नमूनाकरण प्रभाव के लिए, देखें दर। यह भी देखें डाउनसैंपल.

के रूप में [विकल्पों]
आवाज गतिविधि डिटेक्टर. मौन और शांत पृष्ठभूमि ध्वनियों को ट्रिम करने का प्रयास
भाषण की रिकॉर्डिंग के सिरे (काफ़ी उच्च रिज़ॉल्यूशन यानी 16-बिट, 44-48kHz)।
एल्गोरिथ्म वर्तमान में आवाज का पता लगाने के लिए एक सरल सेप्स्ट्रल पावर माप का उपयोग करता है,
इसलिए अन्य चीजों, विशेषकर संगीत से मूर्ख बनाया जा सकता है। प्रभाव केवल से ही ट्रिम हो सकता है
ऑडियो के सामने, इसलिए पीछे से ट्रिम करने के लिए उल्टा प्रभाव होना चाहिए
भी उपयोग किया जाए. उदाहरण के लिए
भाषण चलाएं.wav मानदंड vad
सामने से ट्रिम करना,
स्पीच प्ले करें.wav नॉर्म रिवर्स vad रिवर्स
पीछे से ट्रिम करना, और
भाषण चलाएं.wav मानदंड vad रिवर्स vad रिवर्स
दोनों सिरों से ट्रिम करना. का उपयोग आदर्श प्रभाव की अनुशंसा की जाती है, लेकिन याद रखें
वह भी नहीं उल्टाआदर्श स्ट्रीम किए गए ऑडियो के साथ उपयोग के लिए उपयुक्त है।

विकल्प:
डिफ़ॉल्ट मान कोष्ठक में दिखाए गए हैं.

-t संख्या (7)
गतिविधि का पता लगाने के लिए उपयोग किया जाने वाला माप स्तर। इसकी आवश्यकता हो सकती है
शोर स्तर, सिग्नल स्तर और अन्य के आधार पर बदला जाना चाहिए
इनपुट ऑडियो की विशेषताएं.

-T संख्या (0.25)
समय स्थिरांक (सेकंड में) का उपयोग ध्वनि के छोटे विस्फोटों को अनदेखा करने में मदद के लिए किया जाता है।

-s संख्या (1)
शांत/छोटे विस्फोटों को खोजने के लिए ऑडियो की मात्रा (सेकंड में)।
पता लगाए गए ट्रिगर बिंदु से पहले शामिल करने के लिए ऑडियो।

-g संख्या (0.25)
ऑडियो के शांत/छोटे विस्फोटों के बीच अनुमत अंतराल (सेकेंड में) शामिल किया जाना चाहिए
पता लगाए गए ट्रिगर बिंदु से पहले।

-p संख्या (0)
ट्रिगर बिंदु से पहले संरक्षित करने के लिए ऑडियो की मात्रा (सेकंड में)।
कोई भी शांत/छोटा विस्फोट पाया गया।

उन्नत विकल्प:
ये एल्गोरिदम के आंतरिक मापदंडों को ठीक से ट्यून करने की अनुमति देते हैं।

-b संख्या एल्गोरिदम (आंतरिक रूप से) क्रम में अनुकूली शोर अनुमान/कमी का उपयोग करता है
वांछित ऑडियो की शुरुआत का पता लगाने के लिए। यह विकल्प इसके लिए समय निर्धारित करता है
प्रारंभिक शोर अनुमान.

-N संख्या शोर स्तर के लिए अनुकूली शोर अनुमानक द्वारा उपयोग किया जाने वाला समय स्थिरांक
बढ़ती जा रही है।

-n संख्या शोर स्तर के लिए अनुकूली शोर अनुमानक द्वारा उपयोग किया जाने वाला समय स्थिरांक
कम हो रहा है।

-r संख्या डिटेक्शन एल्गोरिदम में उपयोग करने के लिए शोर में कमी की मात्रा (जैसे 0, 0.5,
...)

-f संख्या एल्गोरिथम के प्रसंस्करण/माप की आवृत्ति।

-m संख्या मापन अवधि; डिफ़ॉल्ट रूप से, माप अवधि से दोगुना; यानी के साथ
ओवरलैप।

-M संख्या वर्णक्रमीय माप को सुचारू करने के लिए समय स्थिरांक का उपयोग किया जाता है।

-h संख्या हाई-पास फ़िल्टर की 'ईंट-दीवार' आवृत्ति को इनपुट पर लागू किया जाता है
डिटेक्टर एल्गोरिथ्म.

-l संख्या निम्न-पास फ़िल्टर की 'ईंट-दीवार' आवृत्ति को इनपुट पर लागू किया जाता है
डिटेक्टर एल्गोरिथ्म.

-H संख्या डिटेक्टर एल्गोरिथ्म में प्रयुक्त हाई-पास लिफ्टर की 'ईंट-दीवार' आवृत्ति।

-L संख्या डिटेक्टर एल्गोरिदम में उपयोग किए जाने वाले लो-पास लिफ्टर की 'ईंट-दीवार' आवृत्ति।

यह भी देखें मौन प्रभाव।

वॉल लाभ [टाइप [सीमित लाभ]]
ऑडियो सिग्नल पर प्रवर्धन या क्षीणन लागू करें। से भिन्न -v विकल्प
(जिसका उपयोग कई इनपुट फ़ाइलों को SoX प्रभावों में प्रवेश करते समय संतुलित करने के लिए किया जाता है
प्रसंस्करण श्रृंखला), वॉल यह किसी भी अन्य प्रभाव की तरह ही एक प्रभाव है इसलिए इसे कहीं भी लागू किया जा सकता है, और
यदि आवश्यक हो तो प्रसंस्करण श्रृंखला के दौरान कई बार।

वॉल्यूम बदलने की राशि दी गई है लाभ जिसके अनुसार व्याख्या की जाती है
दिया टाइप, इस प्रकार है: यदि टाइप is आयाम (या छोड़ दिया गया है), फिर लाभ है एक
आयाम (यानी वोल्टेज या रैखिक) अनुपात, यदि बिजली, फिर एक शक्ति (यानी वाट क्षमता या
वोल्टेज-वर्ग) अनुपात, और यदि dB, फिर dB में शक्ति परिवर्तन।

. टाइप is आयाम or बिजलीतक लाभ 1 का आयतन अपरिवर्तित छोड़ देता है, से कम
1 इसे घटाता है, और 1 से अधिक इसे बढ़ाता है; एक नकारात्मक लाभ ऑडियो को पलट देता है
इसकी मात्रा को समायोजित करने के अलावा संकेत।

. टाइप is dBतक लाभ 0 से आयतन अपरिवर्तित रहता है, 0 से कम होने पर यह घट जाता है,
और 0 से अधिक होने पर यह बढ़ जाता है।

विद्युत (और इसलिए ऑडियो सिग्नल) वोल्टेज पर विस्तृत चर्चा के लिए [4] देखें
और शक्ति अनुपात.

सावधान रहो कतरन जब वॉल्यूम बढ़ रहा है.

RSI लाभ और टाइप यदि वांछित हो तो पैरामीटरों को संयोजित किया जा सकता है, उदाहरण के लिए वॉल 10dB.

एक वैकल्पिक सीमित लाभ मान निर्दिष्ट किया जा सकता है और यह मान से बहुत कम होना चाहिए
1 (जैसे 0.05 या 0.02) और कतरन को रोकने के लिए केवल चोटियों पर उपयोग किया जाता है। नहीं
इस पैरामीटर को निर्दिष्ट करने से कोई लिमिटर का उपयोग नहीं किया जाएगा। वर्बोज़ मोड में, यह
प्रभाव ऑडियो का वह प्रतिशत प्रदर्शित करेगा जिसे सीमित करने की आवश्यकता है।

यह भी देखें लाभ विभिन्न क्षमताओं के साथ वॉल्यूम-चेंजिंग प्रभाव के लिए, और कंपंड
डायनामिक-रेंज संपीड़न/विस्तार/सीमित प्रभाव के लिए।

पदावनत प्रभाव
निम्नलिखित प्रभावों का नाम बदल दिया गया है या उनकी कार्यक्षमता को किसी अन्य में शामिल कर दिया गया है
प्रभाव; वे SoX के इस संस्करण में काम करना जारी रखेंगे लेकिन भविष्य में उन्हें हटाया जा सकता है।

मिक्सर [ -l|-r|-f|-b|-1|-2|-3|-4|n{,n} ]
चैनलों को मिलाकर या चयन करके ऑडियो चैनलों की संख्या कम करें, या बढ़ाएँ
डुप्लिकेट चैनलों द्वारा चैनलों की संख्या. नोट: यह प्रभाव पर कार्य करता है
ऑडियो चैनलों SoX प्रभाव प्रसंस्करण श्रृंखला के भीतर; इसमें भ्रमित नहीं होना चाहिए
साथ -m वैश्विक विकल्प (जहाँ एकाधिक फ़ाइलों प्रवेश करने से पहले मिश्रित-संयुक्त होते हैं
प्रभाव श्रृंखला)।

चैनलों की संख्या कम करते समय इसका उपयोग करना संभव है -l, -r, -f, -b, -1,
-2, -3, -4, केवल बाएँ, दाएँ, आगे, पीछे के चैनल या का चयन करने के विकल्प
चैनलों के औसत के बजाय आउटपुट के लिए विशिष्ट चैनल। -l, तथा -r
विकल्प क्वाड-चैनल फ़ाइलों में औसत कार्य करेंगे, इसलिए सटीक चैनल का चयन करें
इसे रोकें।

RSI मिक्सर प्रभाव को अल्पविराम द्वारा अलग किए गए अधिकतम 16 संख्याओं के साथ भी लागू किया जा सकता है,
जो प्रत्येक इनपुट चैनल के अनुपात (0 = 0% और 1 = 100%) को निर्दिष्ट करता है
प्रत्येक आउटपुट चैनल में मिलाया जाए। दो-चैनल मोड में, 4 नंबर दिए गए हैं: l →
एल, एल → आर, आर → एल, और आर → आर, क्रमशः। चार-चैनल मोड में, पहले 4
संख्याएँ बाएँ-सामने आउटपुट चैनल के लिए अनुपात इस प्रकार देती हैं: lf →
एलएफ, आरएफ → एलएफ, एलबी → एलएफ, और आरबी → आरएफ। अगले 4 में राइट-फ्रंट आउटपुट देते हैं
समान क्रम, फिर बाएँ-पीछे और दाएँ-पीछे।

चैनल संख्या को बढ़ाने या घटाने के लिए 16 नंबरों का उपयोग करना भी संभव है;
अप्रयुक्त चैनलों के लिए बस 0 निर्दिष्ट करें।

अंत में, संख्याओं के कुछ कम संयोजन को निश्चित रूप से निर्दिष्ट किया जा सकता है
इनपुट/आउटपुट चैनल संयोजन।

In Ch बाहर Ch में मैपिंग
2 1 2 एल → एल, आर → एल
2 2 1 संतुलन समायोजित करें
4 1 4 एलएफ → एल, आरएफ → एल, एलबी → एल, आरबी → एल
4 2 2 एलएफ → एल&आरएफ → आर, एलबी → एल&आरबी → आर
4 4 1 संतुलन समायोजित करें
4 4 2 फ्रंट बैलेंस, बैक बैलेंस

इस प्रभाव को हटा दिया गया है रीमिक्स प्रभाव जो किसी भी संख्या को संभालता है
चैनल।

निदान


बिना किसी त्रुटि के निकास स्थिति 0 है, यदि कमांड-लाइन पैरामीटर में कोई समस्या है तो 1 है,
या 2 यदि फ़ाइल प्रोसेसिंग के दौरान कोई त्रुटि होती है।

onworks.net सेवाओं का उपयोग करके rec ऑनलाइन का उपयोग करें



नवीनतम Linux और Windows ऑनलाइन प्रोग्राम