این دستور پخش است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
SoX - Sound eXchange، چاقوی ارتش سوئیس برای دستکاری صدا
خلاصه
جورابها [گزینه های جهانی] [قالب-گزینه ها] infile1
[[قالب-گزینه ها] infile2] ... [قالب-گزینه ها] مجموعه
[اثر [افکت گزینه ها]]...
بازی [گزینه های جهانی] [قالب-گزینه ها] infile1
[[قالب-گزینه ها] infile2] ... [قالب-گزینه ها]
[اثر [افکت گزینه ها]]...
ضبط [گزینه های جهانی] [قالب-گزینه ها] مجموعه
[اثر [افکت گزینه ها]]...
شرح
معرفی
SoX فایل های صوتی را در اکثر فرمت های محبوب می خواند و می نویسد و می تواند به صورت اختیاری افکت ها را اعمال کند
به آنها. این می تواند چندین منبع ورودی را ترکیب کند، صدا را سنتز کند و در بسیاری از سیستم ها،
به عنوان یک پخش کننده صوتی عمومی یا یک ضبط کننده صوتی چند آهنگی عمل کنید. محدود هم دارد
توانایی تقسیم ورودی به چندین فایل خروجی
تمام عملکردهای SoX فقط با استفاده از جورابها فرمان برای ساده کردن بازی و
ضبط صدا، اگر SoX به عنوان فراخوانی شود بازی، فایل خروجی به صورت خودکار تنظیم می شود
دستگاه صدای پیش فرض، و اگر به عنوان فراخوانی شود ضبط، دستگاه صدای پیش فرض به عنوان ورودی استفاده می شود
منبع علاوه بر این، سوکسیدستور (1) راه مناسبی را برای پرس و جوی صوتی فراهم می کند
اطلاعات هدر فایل
قلب SoX کتابخانه ای به نام libSoX است. کسانی که علاقه مند به گسترش SoX یا استفاده از آن هستند
در برنامه های دیگر باید به صفحه راهنمای libSoX مراجعه کنید: libsox(3).
SoX یک ابزار پردازش صوتی خط فرمان است که به ویژه برای ساخت سریع و ساده مناسب است
ویرایش ها و پردازش دسته ای. اگر به یک ویرایشگر صوتی تعاملی و گرافیکی نیاز دارید، از آن استفاده کنید
جسارت(1).
* * * *
کل زنجیره پردازش SoX را می توان به صورت زیر خلاصه کرد:
ورودی(های) → ترکیب کننده → جلوه ها → خروجی(های)
با این حال، توجه داشته باشید که در خط فرمان SoX، موقعیت های خروجی (ها) و افکت ها وجود دارد
با جریان منطقی که نشان داده شده است، مبادله می شوند. همچنین توجه داشته باشید که در حالی که گزینه های مربوط به
به فایلها قبل از نام فایل مربوطه خود قرار میگیرند، برعکس برای افکتها صادق است.
برای نشان دادن اینکه چگونه این در عمل کار می کند، در اینجا نمونه هایی از نحوه عملکرد SoX آورده شده است
استفاده شده. ساده
sox recital.au recital.wav
در حالی که یک فایل صوتی را با فرمت Sun AU به یک فایل WAV مایکروسافت ترجمه می کند
sox recital.au -b 16 کانال recital.wav 1 rate 16k fade 3 norm
ترجمه فرمت یکسانی را انجام می دهد، اما چهار افکت را نیز اعمال می کند (پایین-میکس به یک
کانال، تغییر نرخ نمونه، محو کردن، عادی سازی) و ذخیره نتیجه در عمق بیت
16.
sox -r 16k -e signed -b 8 -c 1 voice-memo. voice-memo.wav
صوتی «خام» (معروف به «بی سر») را به فرمت فایل خود توصیفی تبدیل می کند،
sox slow.aiff fixed.aiff speed 1.027
سرعت صدا را تنظیم می کند،
sox short.wav طولانی.wav طولانی تر.wav
دو فایل صوتی را به هم متصل می کند و
sox -m music.mp3 voice.wav mixed.flac
دو فایل صوتی را با هم میکس می کند.
پخش باس "The Moonbeams/Greatest/*.ogg" +3
مجموعه ای از فایل های صوتی را همزمان با اعمال افکت تقویت کننده باس پخش می کند.
بازی -n -c1 synth sint -12 sin -9 sin -5 sin -2 fade h 0.1 1 0.1
یک آکورد سنتز شده «یک هفتم جزئی» را با صدایی از اندام پیپ می نوازد،
rec -c 2 radio.aiff trim 0 30:00
نیم ساعت صدای استریو را ضبط می کند و
play -q take1.aiff & rec -M take1.aiff take1-dub.aiff
(با پوسته POSIX و در جایی که توسط سخت افزار پشتیبانی می شود) یک آهنگ جدید را در یک مسیر چندگانه ضبط می کند
ضبط کردن سرانجام،
rec -r 44100 -b 16 -s -p سکوت 1 0.50 0.1% 1 10:00 0.1% | \
sox -p song.ogg silence 1 0.50 0.1% 1 2.0 0.1% : \
فایل جدید: راه اندازی مجدد
جریانی از صدا مانند LP/کاست را ضبط می کند و به چندین فایل صوتی تقسیم می شود
امتیاز با 2 ثانیه سکوت. همچنین تا زمانی که تشخیص ندهد شروع به ضبط نمی کند
صدا در حال پخش است و پس از مشاهده 10 دقیقه سکوت متوقف می شود.
توجه: موارد فوق فقط یک نمای کلی از قابلیت های SoX است. توضیحات مفصل در مورد چگونگی
استفاده کنید تمام پارامترهای SoX، فرمتهای فایل و افکتها را میتوانید در زیر در این کتابچه راهنمای کاربر پیدا کنید
soxformat(7) ، و در سوکسی(1).
پرونده قالب انواع
SoX میتواند با فایلهای صوتی «خود توصیفی» و «خام» کار کند. قالبهای «خود توصیفی».
(به عنوان مثال WAV، FLAC، MP3) دارای یک هدر است که سیگنال و رمزگذاری را به طور کامل توصیف می کند.
ویژگی های داده های صوتی زیر قالبهای «خام» یا «بدون سرفصل» شامل نمیشوند
این اطلاعات، بنابراین ویژگی های صوتی آنها باید در SoX توضیح داده شود
خط فرمان یا استنباط از موارد فایل ورودی.
چهار ویژگی زیر برای توصیف قالب داده های صوتی استفاده می شود به طوری که
می توان آن را با SoX پردازش کرد:
نرخ نمونه
نرخ نمونه بر حسب نمونه در ثانیه («هرتز» یا «هرتز»). تلفن دیجیتال
به طور سنتی از نرخ نمونه 8000 هرتز (8 کیلوهرتز) استفاده می کند، اگرچه این روزها، 16 و حتی
32 کیلوهرتز رایج تر می شود. دیسک های فشرده صوتی از 44100 هرتز (44.1 کیلوهرتز) استفاده می کنند.
نوار صوتی دیجیتال و بسیاری از سیستم های کامپیوتری از 48 کیلوهرتز استفاده می کنند. سیستم های صوتی حرفه ای
اغلب از 96 کیلوهرتز استفاده می کنند.
اندازهی نمونه
تعداد بیت های مورد استفاده برای ذخیره هر نمونه. امروزه معمولا از 16 بیت استفاده می شود.
8 بیت در روزهای اولیه صدای کامپیوتر محبوب بود. 24 بیتی در
عرصه صوتی حرفه ای سایزهای دیگر نیز استفاده می شود.
رمزگذاری داده ها
روشی که در آن هر نمونه صوتی نمایش داده می شود (یا "رمزگذاری"). برخی از رمزگذاری ها
دارای انواع با ترتیب بایت یا ترتیب بیت متفاوت است. بعضی ها را فشرده می کنند
داده های صوتی به طوری که داده های صوتی ذخیره شده فضای کمتری را اشغال کند (یعنی فضای دیسک یا
پهنای باند انتقال) نسبت به سایر پارامترهای قالب و تعداد نمونه ها
دلالت خواهد کرد. انواع رمزگذاری رایج شامل ممیز شناور، μ-قانون، ADPCM،
PCM، MP3 و FLAC با عدد صحیح امضا شده.
کانال
تعداد کانال های صوتی موجود در فایل. یک ("مونو") و دو
("استریو") به طور گسترده استفاده می شود. صدای «صدای فراگیر» معمولاً شامل شش یا بیشتر است
کانال ها
اصطلاح «نرخ بیت» اندازهگیری مقدار فضای ذخیرهسازی اشغال شده توسط یک صدای رمزگذاری شده است.
سیگنال در یک واحد زمان می تواند به همه موارد فوق بستگی داشته باشد و معمولاً به عنوان نشان داده می شود
تعدادی کیلو بیت در ثانیه (kbps). یک سیگنال تلفنی A-law دارای نرخ بیت 64 است
کیلوبیت بر ثانیه موسیقی استریو با کد MP3 معمولاً دارای نرخ بیت 128-196 کیلوبیت بر ثانیه است. دارای کد FLAC
موسیقی استریو معمولاً دارای نرخ بیت 550-760 کیلوبیت بر ثانیه است.
اکثر قالبهای خود توصیفی همچنین اجازه میدهند «نظرات» متنی در فایلی جاسازی شوند که
می تواند برای توصیف صدا به نحوی استفاده شود، به عنوان مثال برای موسیقی، عنوان، نویسنده و غیره.
یکی از کاربردهای مهم کامنت های فایل های صوتی، انتقال اطلاعات "Replay Gain" است. SoX
از اعمال اطلاعات Replay Gain پشتیبانی می کند، اما از تولید آن استفاده نمی کند. توجه داشته باشید که به طور پیش فرض،
SoX نظرات فایل ورودی را در فایل های خروجی که از نظرات پشتیبانی می کنند کپی می کند، بنابراین فایل های خروجی ممکن است
اگر مقداری در فایل ورودی وجود داشت، حاوی اطلاعات Replay Gain باشد. در این صورت، اگر
هر چیزی غیر از یک تبدیل فرمت ساده انجام شد و سپس فایل خروجی Replay انجام شد
اطلاعات کسب به احتمال زیاد نادرست است و بنابراین باید با استفاده از ابزاری که مجدداً محاسبه شود
این را پشتیبانی می کند (نه SoX).
La سوکسیدستور (1) را می توان برای نمایش اطلاعات از هدر فایل های صوتی استفاده کرد.
تعیین & محیط La پرونده قالب
مکانیسمهای مختلفی برای SoX برای تعیین یا تنظیم قالب وجود دارد
ویژگی های یک فایل صوتی بسته به شرایط، فردی
ویژگی ها ممکن است با استفاده از مکانیسم های مختلف تعیین یا تنظیم شوند.
برای تعیین فرمت یک فایل ورودی، SoX به ترتیب اولویت و به عنوان استفاده می کند
داده شده یا موجود:
1. گزینه های قالب خط فرمان.
2. محتویات هدر فایل.
3. پسوند نام فایل.
برای تنظیم فرمت فایل خروجی، SoX به ترتیب اولویت و به عنوان یا
در دسترس:
1. گزینه های قالب خط فرمان.
2. پسوند نام فایل.
3. مشخصات فرمت فایل ورودی، یا نزدیکترین فرمت که توسط خروجی پشتیبانی می شود
نوع فایل.
برای همه فایلها، اگر نوع فایل قابل تعیین نباشد، SoX با خطا خارج میشود. فرمان -
گزینه های قالب خط ممکن است نیاز به افزودن یا تغییر برای حل مشکل داشته باشد.
بازی & ضبط
La بازی و ضبط دستورات ارائه شده است به طوری که پخش و ضبط اولیه به همان سادگی است
موجود-file.wav را پخش کنید
و
rec new-file.wav
این دو دستور از نظر عملکردی معادل هستند
sox exist-file.wav -d
و
sox -d new-file.wav
البته می توان گزینه ها و افکت های بیشتری (به شرح زیر) به دستورات اضافه کرد
در هر دو شکل
* * * *
برخی از سیستم ها بیش از یک نوع درایور صوتی (سازگار با SoX) ارائه می کنند، به عنوان مثال ALSA و OSS،
یا SUNAU & AO. سیستم ها همچنین می توانند بیش از یک دستگاه صوتی (با نام مستعار "کارت صدا") داشته باشند.
اگر بیش از یک درایور صوتی در SoX تعبیه شده باشد و پیشفرض توسط SoX انتخاب شده باشد
هنگامی که ضبط یا پخش آن چیزی نیست که مورد نظر است، پس AUDIODRIVER محیط
متغیر می تواند برای لغو پیش فرض استفاده شود. به عنوان مثال (در بسیاری از سیستم ها):
تنظیم AUDIODRIVER=oss
بازی ...
La AUDIODEV متغیر محیطی را می توان برای نادیده گرفتن دستگاه صوتی پیش فرض استفاده کرد، به عنوان مثال
تنظیم AUDIODEV=/dev/dsp2
بازی ...
سوکس ... -t oss
or
تنظیم AUDIODEV=hw:soundwave,1,2
بازی ...
سوکس ... -t alsa
توجه داشته باشید که نحوه تنظیم متغیرهای محیطی از سیستمی به سیستم دیگر متفاوت است - برای برخی
مثالهای خاص، «SOX_OPTS» را در زیر ببینید.
هنگام پخش فایلی با نرخ نمونه که توسط دستگاه خروجی صدا پشتیبانی نمی شود،
SoX به طور خودکار فراخوانی می کند نرخ اثر برای انجام نرخ نمونه لازم
تبدیل. برای سازگاری با سخت افزار قدیمی، پیش فرض است نرخ سطح کیفیت تنظیم شده است
"کم". این را می توان با مشخص کردن صریح تغییر داد نرخ اثر با متفاوت
سطح کیفیت، به عنوان مثال
بازی ... نرخ -m
یا با استفاده از --play-rate-arg گزینه (به زیر مراجعه کنید).
* * * *
در برخی از سیستم ها، SoX اجازه می دهد تا صدای پخش صدا در حین استفاده تنظیم شود بازی. جایی که
پشتیبانی می شود، این با ضربه زدن روی کلیدهای "v" و "V" در حین پخش به دست می آید.
برای کمک به تنظیم سطح ضبط مناسب، SoX دارای یک پیکسنج است که میتواند
به صورت زیر فراخوانی شود (قبل از انجام ضبط واقعی):
rec -n
سطح ضبط باید تنظیم شود (با استفاده از برنامه میکسر ارائه شده توسط سیستم، نه SoX)
به طوری که متر است at اکثر گاه و بیگاه در مقیاس کامل، و هرگز «در قرمز» (یک
علامت تعجب نشان داده شده است). همچنین ببینید -S زیر کلیک کنید.
دقت
بسیاری از فرمتهای فایلی که صدا را فشرده میکنند، برخی از اطلاعات سیگنال صوتی را کنار میگذارند
انجام این کار تبدیل به چنین قالبی و سپس تبدیل مجدد دوباره باعث ایجاد یک فرمت نمی شود
کپی دقیق صوت اصلی این مورد برای بسیاری از فرمت های مورد استفاده در تلفن است
(به عنوان مثال A-law، GSM) که در آن پهنای باند سیگنال کم مهمتر از وفاداری صوتی بالا است،
و برای بسیاری از فرمت های مورد استفاده در پخش کننده های موسیقی قابل حمل (مانند MP3، Vorbis) در صورت کافی
وفاداری را می توان حتی با نسبت تراکم بزرگی که برای ساخت مورد نیاز است حفظ کرد
پخش کننده های قابل حمل کاربردی
فرمت هایی که اطلاعات سیگنال صوتی را دور می اندازند، "کاهشی" نامیده می شوند. فرمت هایی که نیستند
"بی ضرر" نامیده می شود. اصطلاح "کیفیت" به عنوان معیاری برای سنجش نزدیکی به اصل استفاده می شود
سیگنال صوتی را می توان در هنگام استفاده از فرمت با اتلاف بازتولید کرد.
تبدیل فایل های صوتی با SoX در صورت عدم استفاده بدون ضرر است
فشرده سازی، زمانی که نرخ نمونه برداری یا تعداد کانال ها کاهش نمی یابد، و زمانی که
تعداد بیت های استفاده شده در قالب مقصد کمتر از قالب مبدأ نیست. به عنوان مثال
تبدیل از فرمت PCM 8 بیتی به فرمت PCM 16 بیتی بدون تلفات است اما تبدیل از
فرمت PCM 8 بیتی به (8 بیتی) A-قانون نیست.
NB SoX تمام فایل های صوتی را قبل از اجرا به فرمت داخلی غیر فشرده تبدیل می کند
هر گونه پردازش صوتی این بدان معنی است که دستکاری فایلی که در قالبی با اتلاف ذخیره شده است
می تواند باعث کاهش بیشتر در وفاداری صدا شود. به عنوان مثال با
sox long.mp3 short.mp3 trim 10
SoX ابتدا فایل MP3 ورودی را از حالت فشرده خارج می کند، سپس آن را اعمال می کند تر و تمیز اثر، و در نهایت
فایل MP3 خروجی را با فشرده سازی مجدد صدا ایجاد می کند - با کاهش احتمالی
وفاداری بالاتر از آنچه هنگام ایجاد فایل ورودی رخ داده است. از این رو، اگر چیست
در نهایت مطلوب صدای فشرده شده با اتلاف است، به شدت توصیه می شود که همه را اجرا کنید
پردازش صدا با استفاده از فرمت های فایل بدون اتلاف و سپس تبدیل به فرمت با اتلاف فقط در
مرحله نهایی
NB اعمال افکت های متعدد با یک فراخوانی SoX به طور کلی نتیجه خواهد داد
نتایج دقیق تر از نتایجی که با استفاده از فراخوان های متعدد SoX تولید می شوند.
تمیز کردن
Dithering تکنیکی است که برای به حداکثر رساندن محدوده دینامیکی صدای ذخیره شده در a استفاده می شود
عمق بیت خاص هر گونه اعوجاج ایجاد شده توسط کوانتیزه کردن، با افزودن همبستگی دارد
مقدار کمی نویز سفید به سیگنال. در بیشتر موارد، SoX می تواند تعیین کند که آیا
پردازش انتخاب شده نیاز به دود دارد و در صورت فرمت خروجی آن را اضافه می کند
مناسب است.
به طور خاص، به طور پیش فرض، SoX زمانی که عمق بیت خروجی است، به طور خودکار TPDF dither را اضافه می کند.
کمتر از 24 و هر یک از موارد زیر درست است:
· کاهش عمق بیت به صراحت با استفاده از گزینه خط فرمان مشخص شده است
فرمت فایل خروجی فقط از عمق بیت کمتر از فایل ورودی پشتیبانی می کند
قالب
· یک اثر باعث افزایش عمق بیت موثر در زنجیره پردازش داخلی شده است
به عنوان مثال، تنظیم صدا با حجم 0.25 نیاز به دو بیت اضافی دارد که در آن به
نتایج خود را بدون ضرر ذخیره کنید (زیرا 0.25 اعشاری برابر با 0.01 باینری است). بنابراین اگر ورودی
عمق بیت فایل 16 است، سپس نمایش داخلی SoX از 18 بیت استفاده می کند.
پردازش این تغییر حجم به منظور ذخیره خروجی در همان عمق با
ورودی، dithering برای حذف بیت های اضافی استفاده می شود.
استفاده از -V گزینه ای برای مشاهده اینکه SoX به طور خودکار چه پردازشی را اضافه کرده است. در -D گزینه ممکن است
برای نادیده گرفتن دیترینگ خودکار داده شده است. برای فراخوانی dithering به صورت دستی (مثلاً برای انتخاب a
منحنی شکل دهی نویز) را ببینید هیجان اثر.
کلیپ کردن
Clipping اعوجاج است که زمانی رخ می دهد که یک سطح سیگنال صوتی (یا "ولوم") از آن بیشتر شود
محدوده نمایندگی انتخاب شده در بیشتر موارد، بریدن نامطلوب است و همینطور باید باشد
با تنظیم سطح قبل از نقطه (در زنجیره پردازش) که در آن قرار دارد، اصلاح شود
رخ می دهد.
در SoX، همانطور که انتظار دارید، هنگام استفاده از آن، برش ممکن است رخ دهد حجم or سود اثرات به
افزایش حجم صدا Clipping همچنین می تواند با بسیاری از اثرات دیگر رخ دهد، زمانی که
تبدیل یک فرمت به فرمت دیگر، و حتی هنگام پخش صوت.
پخش یک فایل صوتی اغلب شامل نمونه برداری مجدد است و پردازش توسط اجزای آنالوگ می تواند
یک افست و/یا تقویت DC کوچک را معرفی کنید که همگی می توانند باعث ایجاد اعوجاج شوند
سطح سیگنال صوتی در ابتدا خیلی نزدیک به نقطه قطع بود.
به این دلایل، معمول است که مطمئن شوید که سطح سیگنال یک فایل صوتی دارای مقداری است
فضای سر، یعنی از یک سطح خاص زیر حداکثر سطح ممکن تجاوز نمی کند
برای نمایندگی داده شده برخی از استانداردها فضای سر تا 9 دسی بل را توصیه می کنند.
اما در بیشتر موارد، 3dB (≈ 70٪ خطی) کافی است. توجه داشته باشید که به نظر می رسد این حکمت بوده است
از دست رفته در تولید موسیقی مدرن؛ در واقع، بسیاری از سی دی ها، MP3 ها و غیره در حال حاضر در سطوح تسلط دارند
بالاتر 0dBFS یعنی صدا همانطور که تحویل داده شده قطع می شود.
SoX آمار و آمار افکت ها می توانند به تعیین سطح سیگنال در یک فایل صوتی کمک کنند.
La سود or حجم می توان از افکت برای جلوگیری از بریدن استفاده کرد، به عنوان مثال
sox dull.wav روشن.wav افزایش -6 سه برابر +6
تضمین می کند که افزایش سه برابری قطع نمی شود.
اگر برش در هر نقطه از پردازش اتفاق بیفتد، SoX یک پیام اخطار نمایش می دهد
آن اثر
همچنین مشاهده کنید -G و سود و هنجار اثرات.
ورودی پرونده ترکیب
ترکیب کننده ورودی SoX را می توان پیکربندی کرد (به گزینه های زیر مراجعه کنید) برای ترکیب چندین فایل با استفاده از
یکی از روشهای زیر: «پیوستگی»، «توالی»، «میکس»، «میکس قدرت»، «ادغام»، یا
"ضرب". روش پیشفرض 'sequence' برای است بازی، و "پیوستن" برای ضبط و جورابها.
برای همه روشهای غیر از «توالی»، چندین فایل ورودی باید نمونهبرداری یکسانی داشته باشند
نرخ. در صورت لزوم، میتوان از فراخوانهای جداگانه SoX برای انجام تنظیمات نرخ نمونهبرداری استفاده کرد
قبل از ترکیب
اگر روش ترکیبی "concatenate" انتخاب شده باشد (معمولاً این به طور پیش فرض خواهد بود).
فایل های ورودی نیز باید دارای همان تعداد کانال باشند. صدا از هر ورودی
به ترتیب داده شده برای تشکیل فایل خروجی به هم متصل می شود.
روش ترکیب "توالی" به طور خودکار برای آن انتخاب می شود بازی. شبیه به
'concatenate' به این معنا که صدا از هر فایل ورودی به صورت سریال به فایل خروجی ارسال می شود.
با این حال، در اینجا فایل خروجی ممکن است بسته شود و در انتقال مربوطه دوباره باز شود
بین فایل های ورودی این ممکن است همان چیزی باشد که هنگام ارسال انواع مختلف صدا مورد نیاز است
به یک دستگاه خروجی، اما به طور کلی زمانی که خروجی یک فایل معمولی است مفید نیست.
اگر روش ترکیبی «میکس» یا «میکس توان» انتخاب شده باشد، دو یا چند ورودی
فایل ها باید داده شوند و با هم مخلوط می شوند تا فایل خروجی تشکیل شود. تعداد
کانال های موجود در هر فایل ورودی نباید یکسان باشند، اما SoX در صورت وجود یک اخطار صادر می کند
نه و برخی از کانال های موجود در فایل خروجی حاوی صدای هر فایل ورودی نیستند. آ
فایل صوتی ترکیبی را نمیتوان بدون ارجاع به فایلهای ورودی اصلی، میکس کرد.
اگر روش ترکیب «ادغام» انتخاب شده باشد، باید دو یا چند فایل ورودی داده شود و
با هم ادغام می شوند تا فایل خروجی را تشکیل دهند. تعداد کانال ها در هر ورودی
فایل لازم نیست یکسان باشد. یک فایل صوتی ادغام شده شامل همه کانال ها از همه است
فایل های ورودی لغو ادغام با استفاده از فراخوانی های متعدد SoX با ریمیکس
اثر به عنوان مثال، دو فایل مونو را می توان با هم ادغام کرد تا یک فایل استریو را تشکیل دهد. اولین
و فایل های مونو دوم به کانال های چپ و راست فایل استریو تبدیل می شوند.
روش ترکیبی "ضرب" مقادیر نمونه کانال های مربوطه را ضرب می کند
(به عنوان اعداد در بازه 1- تا 1+ در نظر گرفته می شود). اگر تعداد کانال در ورودی
فایل ها یکسان نیستند، کانال های از دست رفته حاوی همه صفر در نظر گرفته می شوند.
هنگام ترکیب فایل های ورودی، SoX هر گونه افکت مشخص شده را اعمال می کند (از جمله، برای مثال،
حجم اثر تنظیم صدا) پس از ترکیب صدا. با این حال، اغلب است
برای اینکه بتوانید حجم ورودی ها را به صورت جداگانه تنظیم کنید (به عنوان مثال "تعادل") مفید است
ترکیب صورت می گیرد.
برای همه روش های ترکیبی، تنظیمات حجم فایل ورودی را می توان به صورت دستی با استفاده از -v
گزینه (زیر) که می تواند برای یک یا چند فایل ورودی داده شود. اگر فقط برای آن داده شود
برخی از فایل های ورودی و سپس بقیه هیچ تنظیم حجم دریافت نمی کنند. در برخی
در شرایط، تنظیم خودکار صدا ممکن است اعمال شود (به زیر مراجعه کنید).
La -V از گزینه (زیر) می توان برای نمایش تنظیمات حجم فایل ورودی که انجام شده است استفاده کرد
انتخاب شده (به صورت دستی یا خودکار).
هنگام مخلوط کردن فایلهای ورودی، ملاحظات خاصی باید رعایت شود:
برخلاف روشهای دیگر، ترکیب «مخلوط» این پتانسیل را دارد که باعث بریدن در آن شود
اگر تعادلی انجام نشود ترکیب کننده در این مورد، اگر تنظیم دستی صدا نیست
با توجه به این موضوع، SoX سعی می کند با تنظیم خودکار، اطمینان حاصل کند که برش اتفاق نمی افتد
حجم (دامنه) هر سیگنال ورودی با ضریب ¹/n که n تعداد ورودی است
فایل ها. اگر این باعث می شود صدایی خیلی بی صدا یا نامتعادل باشد، ورودی
حجم فایل ها را می توان به صورت دستی همانطور که در بالا توضیح داد تنظیم کرد. با استفاده از هنجار اثر بر روی مخلوط است
جایگزین دیگر
اگر صدای ترکیبی در برخی نقاط به اندازه کافی بلند است اما در برخی دیگر بسیار آرام به نظر می رسد، محدوده دینامیکی
برای اصلاح آن باید فشرده سازی اعمال شود - به قسمت مراجعه کنید شرکت اثر.
با روش ترکیبی «قدرت مخلوط»، حجم مخلوط تقریباً برابر است
یکی از سیگنال های ورودی این امر با متعادل کردن با استفاده از ضریب ¹/√n بهجای آن به دست میآید
¹/n توجه داشته باشید که این عامل متعادل کننده تضمین نمی کند که برش اتفاق نمی افتد، اما
تعداد کلیپ ها معمولا کم خواهد بود و اعوجاج حاصل به طور کلی است
نامحسوس
تولید فایل ها
رفتار پیشفرض SoX این است که یک یا چند فایل ورودی را بگیرد و آنها را در یک واحد بنویسد
فایل خروجی.
این رفتار را می توان با تعیین شبه جلوه "newfile" در جلوه ها تغییر داد
فهرست سپس SoX وارد حالت خروجی چندگانه می شود.
در حالت خروجی چندگانه، یک فایل جدید زمانی ایجاد میشود که جلوههای قبل از «فایل جدید» باشد.
نشان می دهد که آنها انجام شده اند. سپس زنجیره افکت های فهرست شده پس از «فایل جدید» راه اندازی می شود و
خروجی آن در فایل جدید ذخیره می شود.
در حالت چند خروجی، یک عدد منحصر به فرد به طور خودکار به انتهای همه اضافه می شود
نام فایل ها اگر نام فایل دارای پسوند باشد، شماره قبل از درج می شود
افزونه. این رفتار را می توان با قرار دادن %n در هر جایی از نام فایل سفارشی کرد
جایی که شماره باید جایگزین شود. یک عدد اختیاری را می توان بعد از % to قرار داد
حداقل عرض ثابت را برای عدد مشخص کنید.
حالت خروجی چندگانه چندان مفید نیست مگر اینکه افکتی باشد که زنجیره افکت ها را متوقف کند
early قبل از "newfile" مشخص شده است. اگر به پایان فایل قبل از اثرات رسیده است
زنجیره به خودی خود متوقف می شود و سپس هیچ فایل جدیدی ایجاد نخواهد شد زیرا خالی است.
در زیر نمونه ای از تقسیم 60 ثانیه اول یک فایل ورودی به دو 30 آورده شده است
فایل های دوم و نادیده گرفتن بقیه.
sox song.wav%1n.wav trim 0 30 : newfile : trim 0 30
توقف SoX
معمولاً SoX پس از خواندن همه، پردازش خود را کامل می کند و به طور خودکار خارج می شود
داده های صوتی موجود از فایل های ورودی
در صورت تمایل، می توان آن را زودتر با ارسال یک سیگنال وقفه به فرآیند خاتمه داد
(معمولاً با فشار دادن کلید وقفه صفحه کلید که معمولاً Ctrl-C است). این یک است
نیاز طبیعی در برخی شرایط، به عنوان مثال هنگام استفاده از SoX برای ضبط. توجه داشته باشید
که هنگام استفاده از SoX برای پخش چندین فایل، Ctrl-C کمی متفاوت عمل می کند: فشار دادن
یک بار باعث می شود که SoX به فایل بعدی پرش کند. دو بار فشار دادن متوالی سریع باعث می شود
SoX برای خروج.
گزینه دیگر برای توقف زودهنگام پردازش، استفاده از اثری است که دارای یک دوره زمانی یا
تعداد نمونه برای تعیین نقطه توقف افکت trim نمونه ای از این موارد است. یک بار
تمام زنجیره های افکت متوقف شده اند، سپس SoX نیز متوقف می شود.
FILENAMES
نام فایل ها می توانند نام فایل های ساده، نام مسیرهای مطلق یا نسبی، یا آدرس های اینترنتی (فایل های ورودی) باشند
فقط). توجه داشته باشید که پشتیبانی URL به این نیاز دارد دستور wget(1) موجود است.
توجه: دادن نام فایل ورودی یا خروجی به SoX که همان نام اثر SoX است
کار نمی کند زیرا SoX آن را به عنوان یک ویژگی افکت در نظر می گیرد. تنها راه حل برای این
اجتناب از چنین نام فایل است. از آنجایی که اکثر نام فایل های صوتی معمولاً این کار دشواری نیست
یک نام فایل "پسوند" داشته باشید، در حالی که نام های افکت ندارند.
ویژه نام پرونده ها
نام فایل های ویژه زیر ممکن است در شرایط خاصی به جای نام عادی استفاده شود
نام فایل در خط فرمان:
- SoX را می توان در عملیات ساده خط لوله با استفاده از نام فایل خاص «-» استفاده کرد.
که اگر به عنوان نام فایل ورودی استفاده شود، باعث می شود SoX داده های صوتی را از آن بخواند
"ورودی استاندارد" (stdin)، و اگر به عنوان نام فایل خروجی استفاده شود، باعث SoX می شود
داده های صوتی را به "خروجی استاندارد" (stdout) ارسال می کند. توجه داشته باشید که هنگام استفاده از این
گزینه ای برای فایل خروجی، و گاهی اوقات هنگام استفاده از آن برای فایل ورودی،
نوع فایل (نگاه کنید به -t زیر) نیز باید داده شود.
"|برنامه [گزینه های]..."
این را می توان به جای نام فایل ورودی برای تعیین نام فایل مورد نظر استفاده کرد
خروجی استاندارد (stdout) به عنوان فایل ورودی استفاده شود. بر خلاف - (بالا)، این می تواند باشد
برای چندین ورودی به یک دستور SoX استفاده می شود. برای مثال، اگر «genw» مونو تولید کند
فرمت WAV به خروجی استاندارد خود سیگنال می دهد، سپس دستور زیر a را می سازد
فایل استریو از دو سیگنال تولید شده:
sox -M "|genw --imd -" "|genw --thd -" out.wav
برای صدای بدون هدر (خام)، -t (و شاید دیگر گزینه های قالب) باید باشد
داده شده، قبل از دستور ورودی.
"wildcard-filename"
مشخص میکند که نام فایل «globbing» (تطبیق با کارتهای وحشی) باید توسط SoX انجام شود
به جای پوسته این اجازه می دهد تا یک مجموعه واحد از گزینه های فایل را اعمال کنید
گروهی از فایل ها به عنوان مثال، اگر دایرکتوری فعلی حاوی سه «وکس» باشد
فایلها، file1.vox، file2.vox، و file3.vox، سپس
play --rate 6k *.vox
توسط "پوسته" (در اکثر محیط ها) به گسترش می یابد
پخش --rate 6k file1.vox file2.vox file3.vox
که فقط اولین فایل vox را با نرخ نمونه 6k در نظر می گیرد. با
play --rate 6k "*.vox"
گزینه نرخ نمونه داده شده برای هر سه فایل vox اعمال خواهد شد.
-p, --Sox-pipe
این می تواند به جای نام فایل خروجی برای تعیین دستور SoX استفاده شود
باید مانند لوله ورودی به دستور SoX دیگر استفاده شود. برای مثال دستور:
بازی "| sox -n -p synth 2" "|sox -n -p synth 2 tremolo 10" آمار
دو فایل را پشت سر هم اجرا می کند که هر کدام دارای افکت های متفاوتی هستند.
-p در واقع نام مستعار برای ` است-t جورابها -'.
-d, -- پیش فرض دستگاه
این را می توان به جای نام فایل ورودی یا خروجی برای تعیین اینکه
دستگاه صوتی پیش فرض (اگر در SoX تعبیه شده باشد) باید استفاده شود. این شبیه است
به استناد کردن ضبط or بازی (همانطور که در بالا توضیح داده شد).
-n, --خالی
این را می توان به جای یک نام فایل ورودی یا خروجی برای مشخص کردن «تهی» استفاده کرد
file' استفاده می شود. توجه داشته باشید که در اینجا، «فایل تهی» به یک SoX خاص اشاره دارد
مکانیزم و به هیچ مکانیزم سیستم عاملی با نام مشابه مرتبط نیست.
استفاده از یک فایل پوچ برای ورود صدا معادل استفاده از یک فایل صوتی معمولی است
حاوی مقدار بی نهایت سکوت است و به این ترتیب عموماً مفید نیست مگر اینکه
با افکتی استفاده می شود که مدت زمان محدودی را مشخص می کند (مانند تر و تمیز or مصنوعی).
استفاده از یک فایل پوچ برای خروجی صدا به معنای دور انداختن صدا است و مفید است
عمدتاً با افکت هایی که به جای تأثیرگذاری، اطلاعات مربوط به صدا را تولید می کنند
آن (مانند سر و صدا or آمار).
نرخ نمونه برداری مرتبط با یک فایل پوچ به طور پیش فرض 48 کیلوهرتز است، اما مانند a
فایل معمولی، در صورت تمایل با استفاده از گزینههای قالب خط فرمان میتوان آن را لغو کرد
(به زیر مراجعه کنید)
پشتیبانی پرونده & دستگاه انواع
دیدن soxformat(7) برای لیست و شرح فرمت های فایل پشتیبانی شده و دستگاه صوتی
رانندگان
OPTIONS
جهانی گزینه
این گزینه ها را می توان در خط فرمان در هر نقطه قبل از اولین اثر مشخص کرد
نام.
La SOX_OPTS متغیر محیطی می تواند برای ارائه مقادیر پیش فرض جایگزین برای
گزینه های جهانی SoX. مثلا:
SOX_OPTS="--buffer 20000 --play-rate-arg -hs --temp /mnt/temp"
توجه داشته باشید که تنظیم SOX_OPTS به طور بالقوه می تواند تغییرات ناخواسته ای در رفتار ایجاد کند
اسکریپت ها یا سایر برنامه هایی که SoX را فراخوانی می کنند. SOX_OPTS ممکن است برای مواردی (مانند
مانند مثال داده شده) که منعکس کننده محیطی هستند که SoX در آن اجرا می شود. را قادر می سازد
گزینه هایی مانند -- بدون کلوخ بهعنوان پیشفرض ممکن است با استفاده از نام مستعار پوسته از آن زمان بهتر مدیریت شود
نام مستعار پوسته بر عملکرد در اسکریپت ها و غیره تأثیر نمی گذارد.
یکی از راههای اطمینان از اینکه یک اسکریپت تحت تأثیر SOX_OPTS نیست، پاک کردن SOX_OPTS در
شروع اسکریپت، اما این البته مزیت حمل SOX_OPTS را از دست می دهد
گزینه های پیش فرض در سراسر سیستم یک رویکرد جایگزین، فراخوانی صریح SoX با است
مقادیر گزینه پیش فرض، به عنوان مثال
SOX_OPTS="-V --no-clobber"
...
sox -V2 --clobber $ورودی $خروجی ...
توجه داشته باشید که روش تنظیم متغیرهای محیطی از سیستمی به سیستم دیگر متفاوت است. در اینجا برخی از
مثال ها:
یونیکس bash:
صادرات SOX_OPTS="-V --no-clobber"
یونیکس csh:
setenv SOX_OPTS "-V --no-clobber"
MS-DOS/MS-Windows:
تنظیم SOX_OPTS=-V --no-clobber
رابط کاربری گرافیکی MS-Windows: از طریق کنترل پنل: سیستم: پیشرفته: متغیرهای محیطی
Mac OS X GUI: به سند QA1067 پرسش و پاسخ فنی اپل مراجعه کنید.
-- بافر BYTES, --input-buffer BYTES
اندازه بافرهای مورد استفاده برای پردازش صدا را بر حسب بایت تنظیم کنید (پیشفرض 8192).
-- بافر برای پردازش ورودی، اثرات و خروجی اعمال می شود. --input-buffer اعمال میشود
فقط برای پردازش ورودی (که برای آن لغو می شود -- بافر اگر هر دو داده شود).
توجه داشته باشید که مقادیر بزرگ برای -- بافر باعث می شود SoX دیر پاسخ دهد
برای درخواست خاتمه یا رد کردن فایل ورودی فعلی.
--کلوبگر
قبل از بازنویسی یک فایل موجود با همان نام، درخواست نکنید
برای فایل خروجی این رفتار پیش فرض است.
--ترکیب کردن پیوستن|ادغام کردن|مخلوط|مخلوط قدرت|تکثیر|دنباله
روش ترکیب فایل ورودی را انتخاب کنید. برای برخی از این موارد، گزینه های کوتاه هستند
در دسترس: -m "میکس" را انتخاب می کند، -M "ادغام" و را انتخاب می کند -T "ضرب" را انتخاب می کند.
دیدن ورودی پرونده ترکیب در بالا برای توضیح ترکیب های مختلف
مواد و روشها.
-D, -----------
دیتر خودکار را غیرفعال کنید - به "Dithering" در بالا مراجعه کنید. مثالی از این که چرا این ممکن است
گاهی اوقات مفید است اگر یک فایل از 16 به 24 بیت با تبدیل شده است
قصد انجام برخی پردازش ها بر روی آن، اما در واقع هیچ پردازشی پس از آن مورد نیاز نیست
همه و فایل 16 بیتی اصلی از بین رفته است، بنابراین، به طور دقیق، هیچ دوشی وجود ندارد
در صورت تبدیل مجدد فایل به 16 بیت مورد نیاز است. را نیز ببینید آمار اثر برای چگونه
برای تعیین عمق بیت واقعی صدا در یک فایل.
--effects-file نام فایل
از FILENAME برای به دست آوردن تمام افکت ها و آرگومان های آنها استفاده کنید. فایل به گونه ای تجزیه می شود که انگار
مقادیر در خط فرمان مشخص شد. یک خط جدید می تواند به جای استفاده شود
خاص : نشانگر برای جدا کردن زنجیره های اثر. برای راحتی، چنین نشانگرها در
انتهای فایل معمولا نادیده گرفته می شود. اگر می خواهید یک آخرین خالی مشخص کنید
زنجیره اثرات، از یک صریح استفاده کنید : به تنهایی در آخرین خط فایل. این
گزینه باعث می شود هر اثری که در خط فرمان مشخص شده است کنار گذاشته شود.
-G, --نگهبان
فراخوانی خودکار سود اثری برای محافظت در برابر بریده شدن. به عنوان مثال
sox -G infile -b 16 outfile rate 44100 dither -s
برای کوتاه است
sox infile -b 16 outfile gain -h rate 44100 gain -rh dither -s
همچنین مشاهده کنید -V، -- هنجار، و سود اثر.
-h, --کمک
نمایش شماره نسخه و اطلاعات استفاده
---اثر کمکی نام
نمایش اطلاعات استفاده در اثر مشخص شده. نام تمام می توان برای نشان دادن استفاده کرد
استفاده در تمام افکت ها
- فرمت کمک نام
اطلاعات مربوط به فرمت فایل مشخص شده را نشان دهید. نام تمام می توان برای نشان دادن استفاده کرد
اطلاعات در مورد تمام فرمت ها
--من, -- اطلاعات
فقط در صورتی که به عنوان اولین پارامتر به جورابها، رفتار کنید سوکسی(1).
-m|-M معادل با --ترکیب کردن مخلوط و --ترکیب کردن ادغام کردنبود.
--شعبده بازي
اگر SoX با کتابخانه اختیاری "libmagic" ساخته شده باشد، این گزینه می تواند باشد
برای فعال کردن استفاده از آن در کمک به تشخیص انواع فایل های صوتی داده شده است.
--چند رشته ای | -- تک رشته ای
به طور پیش فرض، SoX «تک رشته ای» است. اگر --چند رشته ای گزینه داده شده است
با این حال، SoX کانال های صوتی را برای اکثر جلوه های چند کاناله پردازش می کند
موازی در معماری هایپر رشته/چند هسته ای. این ممکن است پردازش را کاهش دهد
زمان، اگرچه گاهی اوقات ممکن است لازم باشد از این گزینه در رابطه با a استفاده شود
اندازه بافر بزرگتر از اندازه پیش فرض برای به دست آوردن هر گونه مزیتی از چند رشته ای
پردازش (به عنوان مثال 131072؛ نگاه کنید به -- بافر در بالا).
-- بدون کلوخ
قبل از بازنویسی یک فایل موجود با همان نامی که برای آن داده شده است، درخواست کنید
فایل خروجی.
NB بازنویسی ناخواسته یک فایل ساده تر از چیزی است که فکر می کنید
به عنوان مثال، اگر به طور تصادفی وارد شوید
sox file1 file2 effect1 effect2 ...
وقتی واقعا منظورت این بود
پخش فایل 1 فایل 2 افکت 1 افکت 2 ...
سپس بدون این گزینه، file2 رونویسی می شود. از این رو استفاده از این گزینه می باشد
توصیه شده. SOX_OPTS (بالا)، یک نام مستعار پوسته، اسکریپت یا فایل دسته ای ممکن است یک
راه مناسب برای فعال کردن دائمی آن
-- هنجار[=سطح دسی بل]
فراخوانی خودکار سود اثر محافظت در برابر قطع شدن و عادی سازی
سمعی. به عنوان مثال
sox --norm infile -b 16 outfile rate 44100 dither -s
برای کوتاه است
sox infile -b 16 outfile gain -h rate 44100 gain -nh dither -s
به صورت اختیاری، صدا را می توان به سطح معینی (معمولا) زیر 0 dBFS عادی کرد:
sox --norm=-3 infile outfile
همچنین مشاهده کنید -V، -G، و سود اثر.
--play-rate-arg ARG
یک گزینه کیفیت را انتخاب می کند تا در هنگام فراخوانی خودکار اثر «نرخ» استفاده شود
در حین پخش صدا این گزینه معمولاً از طریق SOX_OPTS محیط
متغیر (به بالا مراجعه کنید).
--طرح gnuplot|نت های هشتگانه موسیقی|خاموش
اگر تنظیم نشده باشد خاموش (پیش فرض اگر --طرح داده نمی شود)، در حالتی اجرا شود که می تواند باشد
در ارتباط با برنامه gnuplot یا برنامه GNU Octave برای کمک استفاده می شود
با انتخاب و پیکربندی بسیاری از تابع انتقال مبتنی بر
اثرات برای اولین اثر داده شده که از برنامه ترسیم انتخاب شده پشتیبانی می کند،
SoX دستوراتی را برای رسم تابع انتقال افکت صادر می کند و سپس خارج می شود
بدون پردازش صدا به عنوان مثال
sox --plot octave input-file -n highpass 1320 > highpass.plt
اکتاو highpass.plt
-q, --عدم نمایش-پیشرفت
در حالت بی صدا اجرا کنید در حالی که SoX در غیر این صورت این کار را نمی کند. این برعکس است
-S گزینه.
-R در حالت «تکرارپذیر» اجرا کنید. هنگامی که این گزینه داده می شود، در صورت لزوم، SoX این کار را انجام می دهد
یک مهر زمانی ثابت در فایل خروجی جاسازی کنید (مثلا AIFF) و شبه "بذر" خواهد شد
مولد اعداد تصادفی (مثلا هیجان) با یک عدد ثابت، بنابراین اطمینان حاصل شود که
فراخوانی های پی در پی SoX با ورودی های یکسان و پارامترهای یکسان نتیجه را به دست می دهد
همان خروجی
--بازپخش-به دست آوردن مسیر|البوم|خاموش
انتخاب کنید که آیا تنظیم بازپخش در فایل های ورودی اعمال شود یا خیر. پیشفرض
is خاموش برای جورابها و ضبط, البوم برای بازی جایی که (حداقل) دو فایل ورودی اول
با همان نام هنرمند و آلبوم تگ شده اند و مسیر برای بازی در غیر این صورت.
-S, --نمایش-پیشرفت
نمایش فرمت فایل ورودی/اطلاعات هدر، و پیشرفت پردازش به عنوان ورودی
درصد کامل فایل، زمان سپری شده و زمان باقیمانده (در صورت شناخته شدن، نشان داده شده در
براکت ها) و تعداد نمونه های نوشته شده در فایل خروجی. همچنین نشان داده شده است
اوج سنج، و نشانه ای که آیا بریده شدن رخ داده است. متر سطح اوج
حداکثر دو کانال را نشان می دهد و برای صدای دیجیتال به صورت زیر کالیبره شده است (سمت راست
کانال نشان داده شده):
dB FSD نمایش دادن dB FSD نمایش دادن
-25 - -11 ====
-23 = -9 ====-
-21 =- -7 =====
-19 == -5 =====-
-17 ==- -3 ======
-15 === -1 =====!
-13 ===-
یک مقدار حداکثر سه ثانیه ای از فضای سر به دسی بل در سمت راست نشان داده می شود.
متر اگر کمتر از 6 دسی بل باشد.
این گزینه به طور پیش فرض در هنگام استفاده از SoX برای پخش یا ضبط صدا فعال است.
-T معادل با --ترکیب کردن تکثیر.
-- دما دایرکتوری
مشخص کنید که هر فایل موقتی باید در داده شده ایجاد شود دایرکتوری. این
در صورت وجود مشکلات مجوز یا فضای آزاد با پیش فرض می تواند مفید باشد
محل. در این حالت با استفاده از `-- دما .' (برای استفاده از دایرکتوری فعلی) اغلب a است
راه حل خوب
- نسخه
شماره نسخه SoX را نشان دهید و از آن خارج شوید.
-V[سطح]
پرحرفی را تنظیم کنید این به ویژه برای دیدن چگونگی تأثیرات خودکار مفید است
توسط SoX فراخوانی شده اند.
SoX پیام ها را بر روی کنسول (stderr) با توجه به پرحرفی زیر نمایش می دهد
سطح:
0 هیچ پیامی نمایش داده نمی شود. از وضعیت خروج برای تعیین خطا استفاده کنید
اتفاق افتاده.
1 فقط پیام های خطا نشان داده می شود. اگر SoX نتواند تکمیل شود، اینها تولید می شوند
دستورات درخواستی
2 پیام های هشدار نیز نشان داده می شوند. اگر SoX بتواند تکمیل شود، اینها تولید می شوند
دستورات درخواستی، اما دقیقا مطابق دستور درخواستی نیست
پارامترها، یا اگر بریده شدن رخ دهد.
3 توصیف از مراحل پردازش SoX نیز نشان داده شده است. برای دیدن مفید است
دقیقاً چگونه SoX صدای شما را پردازش می کند.
4 و بالاتر
پیام هایی برای کمک به اشکال زدایی SoX نیز نشان داده شده است.
به طور پیش فرض، سطح پرحرفی روی 2 تنظیم شده است (خطاها و هشدارها را نشان می دهد). هر یک
وقوع -V گزینه سطح پرحرفی را 1 افزایش می دهد
سطح پرحرفی را می توان با تعیین یک عدد مطلق بلافاصله بعد از آن تنظیم کرد
la -V، به عنوان مثال -V0 آن را روی 0 قرار می دهد.
ورودی پرونده گزینه
این گزینهها فقط برای فایلهای ورودی اعمال میشوند و ممکن است فقط قبل از نام فایلهای ورودی در آن قرار بگیرند
خط فرمان.
--نادیده گرفتن-طول
طول صوتی (نادرست) داده شده در سرصفحه فایل صوتی را لغو کنید. اگر این
گزینه داده می شود، سپس SoX به خواندن صدا ادامه می دهد تا زمانی که به انتهای آن برسد
فایل ورودی.
-v, --جلد عامل
این گزینه برای استفاده در هنگام ترکیب چندین فایل ورودی در نظر گرفته شده است
حجم فایلی که آن را در خط فرمان با ضریب دنبال می کند عامل. این
به آن اجازه می دهد تا با فایل های ورودی دیگر "متعادل" شود. این یک خطی است
تنظیم (دامنه)، بنابراین عدد کمتر از 1 حجم و عدد را کاهش می دهد
بزرگتر از 1 آن را افزایش می دهد. اگر یک عدد منفی داده شود، علاوه بر عدد
تنظیم صدا، سیگنال صوتی معکوس خواهد شد.
همچنین ببینید هنجار, حجمو سود اثرات، و ببینید ورودی پرونده تعادل در بالا.
ورودی & تولید پرونده قالب گزینه
این گزینه ها برای فایل ورودی یا خروجی که نام آنها بلافاصله قبل از آن قرار می گیرد اعمال می شود
خط فرمان و عمدتاً هنگام کار با فرمت های فایل بدون هدر یا زمانی که استفاده می شود
تعیین فرمتی برای فایل خروجی که با فایل ورودی متفاوت است.
-b بیت, -- بیت ها بیت
تعداد بیت ها (معروف به عمق بیت یا گاهی اوقات طول کلمه) در هر کدگذاری شده
نمونه. برای رمزگذاری های پیچیده مانند MP3 یا GSM قابل استفاده نیست. لازم نیست
با رمزگذاری هایی که تعداد بیت های ثابتی دارند، به عنوان مثال A/μ-law، ADPCM.
برای یک فایل ورودی، رایج ترین استفاده از این گزینه اطلاع رسانی به SoX است
تعداد بیت ها در هر نمونه در یک فایل صوتی «خام» («بی سرصفحه»). مثلا
sox -r 16k -e signed -b 8 input.raw output.wav
یک فایل "خام" خاص را به یک فایل "WAV" که خود توصیف می کند تبدیل می کند.
برای یک فایل خروجی، می توان از این گزینه استفاده کرد (شاید همراه با -e) برای تنظیم
اندازه کدگذاری خروجی به طور پیش فرض (یعنی اگر این گزینه داده نشده باشد)، خروجی
اندازه رمزگذاری (به شرط پشتیبانی از نوع فایل خروجی) روی تنظیم می شود
اندازه رمزگذاری ورودی مثلا
sox input.cdda -b 24 output.wav
صدای دیجیتال خام سی دی (16 بیت، عدد صحیح امضا شده) را به 24 بیت (اعداد صحیح امضا شده) تبدیل می کند.
فایل "WAV".
-1/-2/-3/-4/-8
تعداد بایت ها در هر نمونه کدگذاری شده. نام مستعار منسوخ شده برای -b 8, -b 16, -b
24, -b 32, -b 64 بود.
-c کانال ها, -- کانال ها کانال ها
تعداد کانال های صوتی در فایل صوتی. این می تواند هر عددی بزرگتر از آن باشد
صفر
برای یک فایل ورودی، رایج ترین استفاده از این گزینه اطلاع رسانی به SoX است
تعداد کانالها در یک فایل صوتی «خام» («بدون هدر»). گاهی ممکن است اینطور باشد
استفاده از این گزینه با فایل "هدر" به منظور نادیده گرفتن آن مفید است
مقدار (احتمالاً نادرست) در هدر - توجه داشته باشید که فقط با آن پشتیبانی می شود
انواع فایل های خاص مثال ها:
sox -r 48k -e float -b 32 -c 2 input.raw output.wav
یک فایل "خام" خاص را به یک فایل "WAV" که خود توصیف می کند تبدیل می کند.
play -c 1 music.wav
داده های فایل را به عنوان متعلق به یک کانال واحد بدون توجه به آنچه که هست تفسیر می کند
در هدر فایل مشخص شده است. توجه داشته باشید که اگر فایل در واقع دارای دو است
کانالها، این باعث میشود فایل با سرعت نصف پخش شود.
برای یک فایل خروجی، این گزینه مختصری برای تعیین اینکه
کانال برای تغییر (در صورت لزوم) تعداد باید از اثر فراخوانی شود
کانال در سیگنال صوتی به شماره داده شده است. به عنوان مثال، دو مورد زیر
دستورات معادل هستند:
sox input.wav -c 1 output.wav bass -b 24
sox input.wav output.wav bass -b 24 کانال 1
اگرچه شکل دوم انعطاف پذیرتر است زیرا امکان سفارش افکت ها را فراهم می کند
خودسرانه
-e رمزگذاری, - رمزگذاری رمزگذاری
نوع رمزگذاری صدا گاهی اوقات با انواع فایل هایی که بیشتر از آن را پشتیبانی می کنند مورد نیاز است
یک نوع رمزگذاری به عنوان مثال، با خام، WAV، یا AU (اما نه، برای مثال، با
MP3 یا FLAC). انواع رمزگذاری موجود به شرح زیر است:
عدد صحیح امضا شده
داده های PCM به صورت اعداد صحیح امضا شده («مکمل دو») ذخیره می شوند. معمولا با استفاده می شود
اندازه کدگذاری 16 یا 24 بیتی. مقدار 0 نشان دهنده حداقل سیگنال است
قدرت.
بدون علامت - عدد صحیح
داده های PCM به صورت اعداد صحیح بدون علامت ذخیره می شوند. معمولاً با رمزگذاری 8 بیتی استفاده می شود
اندازه. مقدار 0 نشان دهنده حداکثر قدرت سیگنال است.
نقطه شناور
داده های PCM ذخیره شده به صورت IEEE 753 تک دقیق (32 بیتی) یا دقت دوگانه
اعداد ممیز شناور (واقعی) (64 بیتی). مقدار 0 نشان دهنده حداقل است
قدرت سیگنال
قانون استاندارد بین المللی تلفن برای رمزگذاری لگاریتمی تا 8 بیت در هر
نمونه. دقتی معادل تقریباً 13 بیت PCM دارد و می باشد
گاهی اوقات با ترتیب بیت معکوس کدگذاری می شود (به -X گزینه).
قانون یو، قانون
استاندارد تلفن آمریکای شمالی برای رمزگذاری لگاریتمی تا 8 بیت در هر
نمونه. مستعار μ-قانون. دقتی معادل تقریباً 14 بیت PCM دارد
و گاهی اوقات با ترتیب بیت معکوس کدگذاری می شود (نگاه کنید به -X گزینه).
oki-adpcm
OKI (با نام مستعار VOX، Dialogic یا Intel) ADPCM 4 بیتی؛ دقت دارد
معادل تقریباً 12 بیت PCM. ADPCM نوعی فشرده سازی صدا است که
سازش خوبی بین کیفیت صدا و سرعت رمزگذاری/رمزگشایی دارد.
ima-adpcm
IMA (معروف به DVI) ADPCM 4 بیتی؛ دقتی معادل تقریبا دارد
PCM 13 بیتی
ms-adpcm
مایکروسافت 4 بیتی ADPCM؛ دقتی معادل تقریباً 14 بیت PCM دارد.
gsm-full-rate
GSM در حال حاضر برای اکثریت قریب به اتفاق بی سیم دیجیتال جهان استفاده می شود
تماس های تلفنی از چندین فرمت صوتی با نرخ بیت مختلف استفاده می کند
و کیفیت گفتار مرتبط SoX از 13kbps اصلی GSM پشتیبانی می کند
فرمت صوتی «نرخ کامل». معمولاً کار با GSM به CPU نیاز دارد
سمعی.
اسامی رمزگذاری را می توان به اختصار در جایی که مبهم نباشد، مخفف کرد. به عنوان مثال
«عدد صحیح بدون علامت» را میتوان «un» داد، اما «u» را نمیتوان داد (مبهم با «u-law»).
برای یک فایل ورودی، رایج ترین استفاده از این گزینه اطلاع رسانی به SoX است
رمزگذاری یک فایل صوتی خام (بدون سرصفحه) (به مثالهای موجود مراجعه کنید -b و -c
در بالا).
برای یک فایل خروجی، می توان از این گزینه استفاده کرد (شاید همراه با -b) برای تنظیم
برای مثال نوع کدگذاری خروجی
sox input.cdda -e float output1.wav
sox input.cdda -b 64 -e float output2.wav
تبدیل صدای دیجیتال خام سی دی (16 بیت، عدد صحیح امضا شده) به فایل های WAV با ممیز شناور
(به ترتیب تک و دوتایی دقت).
به طور پیش فرض (یعنی اگر این گزینه داده نشود)، نوع کدگذاری خروجی خواهد بود
(به شرط اینکه توسط نوع فایل خروجی پشتیبانی شود) روی رمزگذاری ورودی تنظیم شود
تایپ کنید
-s/-u/-f/-A/-U/-o/-i/-a/-g
نام مستعار منسوخ برای تعیین انواع رمزگذاری عدد صحیح امضا شده, بدون امضا-
عدد صحیح, نقطه شناور, قانون, قانون, oki-adpcm, ima-adpcm, ms-adpcm, gsm-full-
نرخ به ترتیب (نگاه کنید به -e در بالا).
--بدون گلوب
مشخص میکند که نام فایل «globbing» (تطابق با کارتهای وحشی) نباید توسط آن انجام شود
SoX در نام فایل زیر. به عنوان مثال، اگر دایرکتوری فعلی شامل
سپس دو فایل 'five-seconds.wav' و 'five*.wav'
پخش --no-glob "five*.wav"
می توان از آن برای پخش تنها یک فایل «پنج*.wav» استفاده کرد.
-r، --نرخ نرخ[k]
نرخ نمونه را بر حسب هرتز (یا کیلوهرتز در صورت ضمیمه «k») فایل میدهد.
برای یک فایل ورودی، رایج ترین استفاده از این گزینه اطلاع رسانی به SoX است
نرخ نمونه فایل صوتی «خام» («بدون هدر») (به مثالهای موجود مراجعه کنید -b و -c
در بالا). گاهی اوقات ممکن است استفاده از این گزینه با فایل "هدر" مفید باشد.
به منظور لغو مقدار (احتمالاً نادرست) در هدر - توجه داشته باشید که
این فقط با انواع فایل های خاصی پشتیبانی می شود. مثلاً اگر صدا ضبط شده باشد
با نرخ نمونه مثلاً 48k از منبعی که کمی پخش میکند، مثلاً 1.5%
پس خیلی آهسته
sox -r 48720 input.wav output.wav
به طور موثر سرعت را فقط با تغییر هدر فایل تصحیح می کند (اما به
سرعت اثر برای راه حل معمول تر برای این مشکل).
برای یک فایل خروجی، این گزینه مختصری برای تعیین اینکه نرخ
برای تغییر (در صورت لزوم) نرخ نمونه برداری باید از اثر فراخوانی شود
سیگنال صوتی به مقدار داده شده به عنوان مثال، دو دستور زیر هستند
معادل:
sox input.wav -r 48k output.wav bass -b 24
sox input.wav output.wav bass -b 24 rate 48k
هر چند شکل دوم تا آنجا که اجازه می دهد انعطاف پذیرتر است نرخ گزینه هایی که داده می شود، و
اجازه می دهد تا اثرات خودسرانه سفارش داده شوند.
-t, --نوع نوع فایل
نوع فایل صوتی را می دهد. برای هر دو فایل ورودی و خروجی، این گزینه است
معمولاً برای اطلاع رسانی به SoX از نوع فایل صوتی بدون سرصفحه (به عنوان مثال خام، mp3) استفاده می شود.
که در آن نوع واقعی/دلخواه را نمی توان از پسوند نام فایل مشخص تعیین کرد.
مثلا:
فرمان دیگری | sox -t mp3 - output.wav
sox input.wav -t raw output.bin
همچنین می توان از آن برای نادیده گرفتن نوع دلالت شده توسط پسوند نام فایل ورودی استفاده کرد.
اما اگر با یک نوع هدر بازنویسی شود، SoX با یک مناسب خارج می شود
اگر چنین هدر واقعاً وجود نداشته باشد، پیام خطا می دهد.
دیدن soxformat(7) برای لیستی از انواع فایل های پشتیبانی شده.
-L, -- اندیان کوچک
-B, -- اندیان بزرگ
-x, -- اندیان مبادله
این گزینه ها مشخص می کنند که آیا ترتیب بایت داده های صوتی به ترتیب،
«اندیان کوچک»، «اندیان بزرگ» یا برعکس سیستمی که SoX روی آن قرار دارد
در حال استفاده است. Endianness فقط برای داده هایی که به صورت ممیز شناور یا به عنوان کدگذاری شده اند اعمال می شود
اعداد صحیح امضا شده یا بدون علامت 16 بیتی یا بیشتر. اغلب لازم است که مشخص شود
یکی از این گزینه ها برای فایل های بدون هدر، و گاهی اوقات برای (در غیر این صورت) ضروری است
فایل های خود توصیفی یک گزینه edian-setting داده شده ممکن است برای یک ورودی نادیده گرفته شود
فایلی که هدر آن حاوی یک شناسه endianness خاص یا برای یک فایل خروجی است
که در واقع یک دستگاه صوتی است.
NB بر خلاف سایر ویژگی های قالب، endianness (بایت، نیبل، و بیت
ترتیب) فایل ورودی به طور خودکار برای فایل خروجی استفاده نمی شود. بنابراین برای
به عنوان مثال، زمانی که موارد زیر بر روی یک سیستم کمی اندین اجرا می شود:
sox -B audio.s16 trimmed.s16 trim 2
trimmed.s16 به صورت little-endian ایجاد خواهد شد.
sox -B audio.s16 -B trimmed.s16 trim 2
باید برای حفظ بزرگ بودن در فایل خروجی استفاده شود.
La -V می توان از گزینه برای بررسی سفارشات انتخاب شده استفاده کرد.
-N, -- نوک زدن معکوس
مشخص می کند که ترتیب نیبل (یعنی 2 نیمه بایت) نمونه ها
باید معکوس شود؛ گاهی اوقات با فرمت های مبتنی بر ADPCM مفید است.
NB همچنین به NB در بخش در مراجعه کنید -x در بالا.
-X, - بیت های معکوس
مشخص می کند که ترتیب بیت نمونه ها باید معکوس شود. گاهی اوقات مفید
با چند فرمت (بیشتر بدون هدر).
NB همچنین به NB در بخش در مراجعه کنید -x در بالا.
تولید پرونده قالب گزینه
این گزینه ها فقط برای فایل خروجی اعمال می شود و ممکن است فقط قبل از نام فایل خروجی موجود باشد
خط فرمان
--افزودن-نظر TEXT
یک نظر در هدر فایل خروجی (در صورت لزوم) اضافه کنید.
--اظهار نظر TEXT
متن نظر را برای ذخیره در هدر فایل خروجی (در صورت لزوم) مشخص کنید.
SoX در صورتی که این گزینه (یا --comment-file) داده نمی شود.
برای تعیین اینکه هیچ نظری در فایل خروجی ذخیره نشود، از استفاده کنید --اظهار نظر "" .
--comment-file نام فایل
یک فایل حاوی متن نظر را برای ذخیره در هدر فایل خروجی مشخص کنید
(در صورت لزوم)
-C, -- فشرده سازی عامل
ضریب فشرده سازی برای فشرده سازی متغیر فرمت های فایل خروجی. اگر این
گزینه داده نمی شود سپس یک ضریب فشرده سازی پیش فرض اعمال می شود. فشرده سازی
فاکتور برای فرمت های مختلف فایل فشرده سازی متفاوت تفسیر می شود. را ببینید
شرح فرمت های فایلی که از این گزینه استفاده می کنند soxformat(7) برای اطلاعات بیشتر
اطلاعات.
اثرات
علاوه بر تبدیل، پخش و ضبط فایل های صوتی، می توان از SoX برای فراخوانی a استفاده کرد
تعداد جلوه های صوتی چندین افکت ممکن است با مشخص کردن آنها یکی بعد اعمال شود
دیگری در انتهای خط فرمان SoX، که یک «زنجیره افکت ها» را تشکیل می دهد. توجه داشته باشید که
اعمال چندین افکت در زمان واقعی (یعنی هنگام پخش صدا) احتمالاً به یک نیاز دارد
کامپیوتر با کارایی بالا توقف برنامه های دیگر ممکن است مشکلات عملکرد را کاهش دهد
باید رخ دهند.
برخی از جلوههای SoX عمدتاً برای اعمال بر روی یک ابزار منفرد یا
"صدا". برای تسهیل این امر، ریمیکس اثر و گزینه جهانی SoX -M را می توان به استفاده
جداسازی کنید و سپس آهنگهای یک ضبط چند آهنگی را دوباره ترکیب کنید.
چندین اثرات زنجیر
یک زنجیره افکت منفرد از یک یا چند افکت تشکیل شده است. صدا از ورودی اجرا می شود
از طریق زنجیره تا زمانی که یا به انتهای فایل ورودی رسیده یا اثری در
درخواست های زنجیره ای برای پایان دادن به زنجیره.
SoX از اجرای زنجیره افکت های متعدد بر روی صدای ورودی پشتیبانی می کند. در این مورد، زمانی که یکی
زنجیره نشان می دهد که پردازش صدا انجام شده است، سپس داده های صوتی از طریق بعدی ارسال می شود
زنجیره اثرات این تا زمانی ادامه مییابد که یا زنجیرههای افکت دیگری وجود نداشته باشد یا ورودی وجود نداشته باشد
به پایان پرونده رسید.
یک زنجیره اثرات با قرار دادن a خاتمه می یابد : (کولون) پس از اثر. هر دنبال کننده ای
افکت ها بخشی از زنجیره افکت های جدید هستند.
مهم است که اثری را که زنجیره را متوقف می کند به عنوان اولین اثر در آن قرار دهید
زنجیر. این به این دلیل است که هر نمونه ای که توسط افکت های سمت چپ بافر می شود
اثر خاتمه نادیده گرفته خواهد شد. مقدار نمونه های دور ریخته شده مربوط به
-- بافر گزینه و باید کوچک نگه داشته شود، نسبت به نرخ نمونه، اگر
اثر خاتمه نمی تواند اول باشد. اطلاعات بیشتر در مورد اثرات توقف را می توان یافت
در توقف SoX بخش.
چند شبه افکت وجود دارد که به استفاده از زنجیره افکت های چندگانه کمک می کند. این شامل
فایل جدید که قبل از رفتن به جلوه های بعدی شروع به نوشتن در یک فایل خروجی جدید می کند
زنجیره ای و شروع دوباره که به زنجیره جلوه های اول برمی گردد. اثرات شبه باید باشد
به عنوان اولین اثر در یک زنجیره و به عنوان تنها اثر در یک زنجیره مشخص شده است (باید داشته باشند
a : قبل و بعد از آن مشخص شده است).
در زیر نمونه ای از زنجیره های افکت های چندگانه آورده شده است. این فایل ورودی را به تقسیم می کند
چندین فایل با طول 30 ثانیه هر نام فایل خروجی دارای شماره منحصر به فرد خواهد بود
نام آن به عنوان مستند در تولید فایل ها بخش.
sox infile.wav output.wav trim 0 30: newfile: restart
مشترک نشانه گذاری و پارامترهای
در توضیحات بعدی، از براکت [ ] برای نشان دادن پارامترهایی که هستند استفاده می شود
اختیاری، پرانتزهای { } را برای نشان دادن مواردی که هم اختیاری و هم قابل تکرار هستند، و زاویه نشان می دهد
براکت < > برای نشان دادن مواردی که قابل تکرار هستند اما اختیاری نیستند. در صورت لزوم،
مقادیر پیش فرض برای پارامترهای اختیاری در پرانتز ( ) نشان داده شده است.
پارامترهای زیر با چندین اثر استفاده میشوند و معنی یکسانی برای آن دارند:
مرکز[k]
دیدن فرکانس.
فرکانس[k]
فرکانس بر حسب هرتز، یا، اگر با «k» اضافه شود، کیلوهرتز.
سود افزایش توان بر حسب دسی بل صفر هیچ سودی نمی دهد. کمتر از صفر تضعیف می دهد.
عرض[h|k|o|q]
برای تعیین پهنای باند یک فیلتر استفاده می شود. تعدادی از روش های مختلف برای
عرض را مشخص کنید (البته نه همه آنها برای هر افکت). یکی از
کاراکترهای نشان داده شده ممکن است برای انتخاب روش مورد نظر به صورت زیر اضافه شوند:
روش یادداشت
h Hz
k کیلوهرتز
o اکتاوها
q Q-factor را ببینید [2]
برای هر افکتی که از این پارامتر استفاده میکند، روش پیشفرض (یعنی اگر کاراکتری وجود نداشته باشد
ضمیمه شده است) موردی است که در اولین خط افکت فهرست شده است
شرح.
برای مشاهده اینکه آیا SoX از یک افکت اختیاری پشتیبانی میکند، وارد شوید جورابها -h و نام آن را در زیر جستجو کنید
فهرست: "اثرات".
پشتیبانی اثرات
توجه: یک لیست طبقه بندی شده از افکت ها را می توان در فایل "README" همراه یافت.
گذر فرکانس[k] عرض[h|k|o|q]
اعمال یک فیلتر همه گذر دو قطبی با فرکانس مرکزی (بر حسب هرتز) فرکانسو
عرض فیلتر عرض. یک فیلتر تمام گذر فرکانس صدا را به فاز تغییر می دهد
رابطه بدون تغییر فرکانس آن به رابطه دامنه. فیلتر
به تفصیل در [1] توضیح داده شده است.
این اثر پشتیبانی می کند --طرح گزینه جهانی
باند [-n] مرکز[k] [عرض[h|k|o|q]]
یک فیلتر باند گذر اعمال کنید. پاسخ فرکانس به صورت لگاریتمی در اطراف کاهش می یابد
مرکز فرکانس. در عرض پارامتر شیب افت را نشان می دهد. را
فرکانس ها در مرکز + عرض و مرکز - عرض نصف اصل خود خواهند بود
دامنه ها باند به طور پیشفرض روی حالتی قرار میگیرد که بر روی صدای زیر و بم است، به عنوان مثال، صدا،
آواز یا موسیقی دستگاهی در -n گزینه (برای نویز) از حالت جایگزین استفاده می کند
برای صدای بی تن (مثلاً سازهای کوبه ای). هشدار: -n افزایش قدرت را معرفی می کند
حدود 11 دسی بل در فیلتر، بنابراین مراقب قطع شدن خروجی باشید. باند نویز را وارد می کند
شکل فیلتر، یعنی اوج گرفتن در مرکز فرکانس و استقرار در اطراف
آن است.
این اثر پشتیبانی می کند --طرح گزینه جهانی
همچنین مشاهده کنید گناه برای یک فیلتر باند گذر با شانه های تندتر.
گذرگاه باند|باندریجکت [-c] فرکانس[k] عرض[h|k|o|q]
یک فیلتر دو قطبی Butterworth باند گذر یا رد باند با فرکانس مرکزی اعمال کنید
فرکانس، و پهنای باند (نقطه 3dB). عرض. -c گزینه فقط برای
گذرگاه باند و یک افزایش دامن ثابت (پیک افزایش = Q) را به جای پیش فرض انتخاب می کند:
افزایش پیک ثابت 0dB فیلترها با سرعت 6 دسی بل در هر اکتاو (20 دسی بل در هر دهه) کار می کنند.
و به تفصیل در [1] توضیح داده شده است.
این اثرات پشتیبانی می کند --طرح گزینه جهانی
همچنین مشاهده کنید گناه برای یک فیلتر باند گذر با شانه های تندتر.
باندریجکت فرکانس[k] عرض[h|k|o|q]
فیلتر رد باند را اعمال کنید. توضیحات را ببینید گذرگاه باند اثر برای
جزئیات.
باس|سه برابر کردن سود [فرکانس[k] [عرض[s|h|k|o|q]]]
فرکانس باس (پایین) یا سه برابر (بالا) صدا را با استفاده از
فیلتر قفسهبندی دو قطبی با پاسخی شبیه به یک Hi-Fi استاندارد
کنترل های تن این نیز به عنوان یکسان سازی قفسه (EQ) شناخته می شود.
سود بهره را در 0 هرتز (برای باس) یا هر کدام کمتر از ~22 کیلوهرتز و
فرکانس Nyquist (برای سه برابر کردن). محدوده مفید آن در حدود -20 است (برای بزرگ
برش) تا 20+ (برای افزایش زیاد). مراقب باشید کلیپ کردن هنگام استفاده از مثبت سود.
در صورت تمایل، فیلتر را می توان با استفاده از پارامترهای اختیاری زیر به خوبی تنظیم کرد:
فرکانس فرکانس مرکزی فیلتر را تنظیم می کند و بنابراین می توان از آن برای گسترش یا استفاده کرد
محدوده فرکانسی را که باید تقویت یا قطع شود را کاهش دهید. مقدار پیش فرض 100 هرتز است (برای
باس) یا 3 کیلوهرتز (برای سه برابر کردن).
عرض تعیین می کند که انتقال قفسه فیلتر چقدر شیب دارد. علاوه بر
روشهای مشخصسازی عرض رایج که در بالا توضیح داده شد، «شیب» (پیشفرض، یا اگر
پیوست با `s') ممکن است استفاده شود. محدوده مفید "شیب" حدود 0.3 است، برای a
شیب ملایم، به 1 (حداکثر)، برای شیب تند. مقدار پیش فرض 0.5 است.
فیلترها به تفصیل در [1] توضیح داده شده اند.
این اثرات پشتیبانی می کند --طرح گزینه جهانی
همچنین مشاهده کنید اکولایزر برای اوج اثر برابری.
خم [-f نرخ فریم(25)] [-o بیش از حد نمونه(16)] { تاخیر,سنت,مدت }
گام را با مقادیر مشخص در زمانهای مشخص تغییر میدهد. هر سه گانه داده شده:
تاخیر,سنت,مدت یک خم را مشخص می کند. تاخیر مقدار زمان پس از
شروع جریان صوتی، یا انتهای خم قبلی، که در آن شروع می شود
خم شدن زمین؛ سنت تعداد سنت هایی است (100 سنت = 1 نیم صدا) که توسط آن
برای خم کردن زمین، و مدت مدت زمانی که زمین در آن خواهد بود
خم شده
الگوریتم Pitch-Bending از تبدیل فوریه گسسته (DFT) در
نرخ فریم خاص و نرخ نمونه برداری بیش از حد. در -f و -o ممکن است از پارامترها استفاده شود
برای تنظیم این پارامترها و در نتیجه کنترل نرمی تغییرات در گام.
به عنوان مثال، یک تون اولیه تولید می شود، سپس سه بار خم می شود و چهار بار ایجاد می شود
نت های مختلف در مجموع:
play -n synth 2.5 sin 667 gain 1 \
bend .35,180,.25 .15,740,.53 0,-520,.3
توجه داشته باشید که بریده ای که در این مثال تولید می شود عمدی است. برای حذف
آن، استفاده کنید سود -5 در محل سود 1.
همچنین مشاهده کنید گام.
دو طرفه b0 b1 b2 a0 a1 a2
یک فیلتر IIR دوطرفه با ضرایب داده شده اعمال کنید. جایی که b* و a* هستند
ضرایب صورت و مخرج به ترتیب.
دیدن http://en.wikipedia.org/wiki/Digital_biquad_filter (که در آن a0 = 1).
این اثر پشتیبانی می کند --طرح گزینه جهانی
کانال کانال ها
از یک الگوریتم ساده برای تغییر تعداد کانال های سیگنال صوتی استفاده کنید
عدد داده شده کانال ها: مخلوط کردن در صورت کاهش تعداد کانال ها یا
در صورت افزایش تعداد کانال ها کپی می شود.
La کانال اگر SoX باشد، اثر به طور خودکار فراخوانی می شود -c گزینه یک عدد را مشخص می کند
از کانال هایی که با فایل(های) ورودی متفاوت است. متناوبا، اگر این
اثر به صراحت داده می شود، سپس SoX -c گزینه لازم نیست داده شود مثلا،
دو دستور زیر معادل هستند:
sox input.wav -c 1 output.wav bass -b 24
sox input.wav output.wav bass -b 24 کانال 1
اگرچه شکل دوم انعطاف پذیرتر است زیرا امکان سفارش افکت ها را فراهم می کند
خودسرانه
همچنین مشاهده کنید ریمیکس برای اثری که اجازه می دهد کانال ها به طور دلخواه مخلوط/انتخاب شوند.
گروه کر به دست آوردن به دست آوردن <تاخیر پوسیدگی سرعت عمق -s|-t>
افکت کر را به صدا اضافه کنید. این می تواند صدای تک آوازی مانند a ایجاد کند
کر، اما همچنین می تواند برای ابزار دقیق استفاده شود.
کر شبیه افکت اکو با تاخیر کوتاه است، در حالی که با اکو با تاخیر
ثابت است، با کر، با مدولاسیون سینوسی یا مثلثی تغییر می کند.
عمق مدولاسیون محدوده ای را که تاخیر مدوله شده قبل از یا پخش می شود را مشخص می کند
بعد از تاخیر از این رو صدای تاخیری آهسته تر یا سریعتر به نظر می رسد
صدای تاخیری که در اطراف صدای اصلی تنظیم شده است، مانند یک گروه کر که برخی از آوازها هستند
کلید کمی خاموش برای بحث بیشتر در مورد افکت کر [3] را ببینید.
هر چهار پارامتر تاخیر/فروپاشی/سرعت/عمق تاخیر را بر حسب میلی ثانیه نشان می دهد.
و واپاشی (نسبت به افزایش ورودی) با سرعت مدولاسیون در هرتز با استفاده از عمق در
میلی ثانیه مدولاسیون یا سینوسی است (-s) یا مثلثی (-t). کسب کردن-
out حجم خروجی است.
تاخیر معمولی حدود 40 تا 60 میلی ثانیه است. سرعت مدولاسیون نزدیک به 0.25 هرتز بهترین است
و عمق مدولاسیون حدود 2 میلی ثانیه است. به عنوان مثال، یک تاخیر واحد:
play guitar1.wav chorus 0.7 0.9 55 0.4 0.25 2 -t
دو تاخیر از نمونه های اصلی:
play guitar1.wav chorus 0.6 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 1.3 -s
یک کر با صدای کاملتر (با سه تاخیر اضافی):
play guitar1.wav chorus 0.5 0.9 50 0.4 0.25 2 -t \
60 0.32 0.4 2.3 -t 40 0.3 0.3 1.3 -s
شرکت حمله1,پوسیدگی 1{,حمله2,پوسیدگی 2}
[نرم زانو-dB:]in-dB1[,خارج از dB1]{,in-dB2,خارج از dB2}
[سود [حجم اولیه-دسی بل [تاخیر]]]
محدوده دینامیکی صدا را فشرده (فشرده یا گسترش دهید).
La حمله و پوسیدگی پارامترها (در ثانیه) مدت زمانی را تعیین می کنند که
سطح لحظه ای سیگنال ورودی برای تعیین حجم آن به طور متوسط تعیین می شود.
حملات به افزایش حجم و پوسیدگی به کاهش اشاره دارد. برای بیشتر
در شرایط، زمان حمله (پاسخ به بلندتر شدن موسیقی) باید باشد
کوتاه تر از زمان پوسیدگی است زیرا گوش انسان به صدای ناگهانی حساس تر است
موسیقی نسبت به موسیقی ملایم ناگهانی جایی که بیش از یک جفت پارامتر حمله/واپاشی وجود دارد
مشخص شده است، هر کانال ورودی به طور جداگانه و تعداد جفت ها ترکیب می شود
باید با تعداد کانال های ورودی موافق باشد. مقادیر معمولی هستند 0.3,0.8 ثانیه صورت گرفت.
پارامتر دوم لیستی از نقاط تابع انتقال compander است
در دسی بل نسبت به حداکثر دامنه سیگنال ممکن مشخص شده است. ورودی
مقادیر باید کاملاً به ترتیب افزایشی باشند اما تابع انتقال اینطور نیست
باید یکنواخت در حال افزایش باشد. اگر حذف شود، مقدار خارج از dB1 به طور پیش فرض به
همان مقدار in-dB1; سطوح زیر in-dB1 با هم همراه نیستند (اما ممکن است سود داشته باشند
برای آنها اعمال می شود). نکته 0,0 فرض می شود اما ممکن است لغو شود (توسط 0,خارج از dBn).
اگر لیست قبل از a نرم زانو-dB مقدار، سپس نقاط مجاور
بخش های خط در تابع انتقال با مقدار داده شده گرد خواهند شد.
مقادیر معمولی برای تابع انتقال هستند 6:-70،-60،-20.
سومین پارامتر (اختیاری) یک بهره اضافی در دسی بل است که به طور کلی اعمال می شود
بر روی عملکرد انتقال امتیاز می دهد و امکان تنظیم آسان بهره کلی را فراهم می کند.
پارامتر چهارم (اختیاری) یک سطح اولیه است که برای هر کانال در نظر گرفته می شود
وقتی ترکیب شروع می شود این به کاربر اجازه می دهد در ابتدا یک سطح اسمی را ارائه کند،
به طوری که به عنوان مثال، یک بهره بسیار بزرگ به سطوح سیگنال اولیه اعمال نمی شود
قبل از اینکه عمل ترکیبی شروع به کار کند: کاملاً محتمل است که در
در چنین رویدادی، خروجی به شدت بریده می شود در حالی که کامپاندر افزایش می یابد
خود را به درستی تنظیم می کند. یک مقدار معمولی (برای صوتی که در ابتدا بی صدا است) است
-90 دسی بل
پارامتر پنجم (اختیاری) تاخیر در ثانیه است. سیگنال ورودی تجزیه و تحلیل می شود
بلافاصله برای کنترل کامپاندر، اما قبل از تغذیه به تاخیر می افتد
تنظیم کننده صدا تعیین تاخیر تقریباً برابر با زمان حمله/فروپاشی
به compander اجازه می دهد تا به طور موثر در یک "پیش بینی" به جای یک عمل کند
حالت واکنشی یک مقدار معمولی است 0.2 ثانیه صورت گرفت.
* * * *
مثال زیر ممکن است برای ساخت یک قطعه موسیقی با هر دو حالت آرام و بی صدا استفاده شود
آهنگ های پر سر و صدا مناسب برای گوش دادن در محیط های پر سر و صدا مانند حرکت
وسیله نقلیه:
sox asz.wav asz-car.wav compand 0.3,1،6 70:-60،-20،-5 -90 -0.2 XNUMX
تابع انتقال ('6:-70,...') می گوید که صداهای بسیار ملایم (زیر -70 دسی بل)
بدون تغییر باقی می ماند. این باعث میشود که کامپاندر صدا را افزایش ندهد
گذرهای «ساکت» مانند بین حرکات. با این حال، برای تلفن های موبایل در محدوده -60dB تا
0dB (حداکثر حجم) افزایش می یابد تا محدوده دینامیکی 60dB نسخه اصلی
موسیقی 3 به 1 در محدوده 20 دسی بل فشرده می شود که برای لذت بردن به اندازه کافی گسترده است
موسیقی اما به اندازه کافی باریک برای دور زدن سر و صدای جاده. '6:' 6dB را انتخاب می کند
فشرده سازی نرم زانو بهره خروجی -5 (dB) برای جلوگیری از قطع شدن مورد نیاز است
عدد نادقیق است و با آزمایش به دست آمده است). -90 (dB) برای
حجم اولیه برای کلیپی که با سکوت تقریباً شروع می شود خوب کار می کند
تأخیر 0.2 (ثانیه) باعث می شود که کماندر کمی بیشتر واکنش نشان دهد.
به سرعت به تغییرات ناگهانی حجم.
در مثال بعدی، از compand به عنوان یک دروازه نویز برای زمانی که نویز در آن است استفاده می شود
سطح پایین تر از سیگنال:
بازی infile compand .1,.2 -inf,-50.1,-inf,-50,-50 0 -90 .1
در اینجا یک دروازه نویز دیگر وجود دارد، این بار برای زمانی که نویز در سطح بالاتری قرار دارد
سیگنال (که آن را از جهاتی شبیه Squelch می کند):
بازی infile compand .1,.1 -45.1,-45,-inf,0,-inf 45 -90 .1
این اثر پشتیبانی می کند --طرح گزینه جهانی (برای تابع انتقال).
همچنین مشاهده کنید mcompand برای اثر ترکیبی چند باندی.
کنتراست [افزایش - مقدار(75)]
این افکت که با فشرده سازی قابل مقایسه است، سیگنال صوتی را تغییر می دهد تا به صدا درآید
بلندتر افزایش - مقدار مقدار افزایش را کنترل می کند و یک عدد است
در محدوده 0-100 توجه داشته باشید که افزایش - مقدار = 0 هنوز یک مقدار قابل توجه می دهد
افزایش کنتراست
همچنین ببینید شرکت و mcompand اثرات.
dcshift تغییر [محدود کننده]
شیفت DC را روی صدا اعمال کنید. این می تواند برای حذف یک افست DC (ناشی از
شاید به دلیل مشکل سخت افزاری در زنجیره ضبط) از صدا. تاثیر
یک افست DC فضای سر و در نتیجه حجم را کاهش می دهد. را آمار or آمار اثر می تواند
برای تعیین اینکه آیا سیگنال دارای افست DC است یا خیر، استفاده شود.
داده شده dcshift مقدار یک عدد ممیز شناور در محدوده 2± است که
میزان جابجایی صدا را نشان می دهد (که در محدوده 1± است).
اختیاری است محدود کننده را نیز می توان مشخص کرد. باید ارزش بسیار کمتری داشته باشد
از 1 (به عنوان مثال 0.05 یا 0.02) و فقط در قله ها برای جلوگیری از بریدن استفاده می شود.
* * * *
یک روش جایگزین برای حذف افست DC (البته با تاخیری کوتاه) این است که
با استفاده از مرتفع اثر فیلتر در فرکانس مثلاً 10 هرتز، همانطور که در نشان داده شده است
مثال زیر:
sox -n dc.wav synth 5 sin %0 50
sox dc.wav fixed.wav highpass 10
عمیق کردن دیسک فشرده (IEC 60908) را بیتأکید کنید (فیلتر قفسهبندی کاهش سه برابری).
در مسترینگ برخی از سی دی هایی که در اوایل دهه 1980 منتشر شد، از قبل تاکید شد.
اینها شامل بسیاری از آلبومهای موسیقی کلاسیک و همچنین شمارههای مورد تقاضای کنونی بود
آلبوم های بیتلز، پینک فلوید و دیگران. پیش تاکید باید در حذف شود
زمان پخش توسط یک فیلتر بدون تاکید در دستگاه پخش. با این حال، نه همه
پخش کننده های سی دی مدرن این فیلتر را دارند و تعداد کمی از درایوهای سی دی PC آن را دارند. بازی قبل از
صدای تاکید شده بدون فیلتر بدون تاکید صحیح منجر به صدا می شود که
خشن به نظر می رسد و از آنچه سازندگان آن در نظر داشتند دور است.
با عمیق کردن این امکان وجود دارد که تاکیدات لازم را روی صدا اعمال کنید
که از یک سی دی از قبل تاکید شده استخراج شده است و سپس آن را رایت کنید
بر روی یک سی دی جدید (که در هر سی دی پلیر به درستی پخش می شود)، یا
به سادگی فایل های صوتی بدون تاکید را به درستی بر روی کامپیوتر پخش کنید. مثلا:
sox track1.wav track1-deemph.wav deemph
و سپس track1-deemph.wav را در سی دی یا رایت کنید
بازی track1-deemph.wav
و یا به سادگی
بازی track1.wav deemph
فیلتر عدم تاکید به صورت دوطرفه اجرا می شود. حداکثر انحراف آن از
پاسخ ایده آل فقط 0.06dB (تا 20 کیلوهرتز) است.
این اثر پشتیبانی می کند --طرح گزینه جهانی
همچنین ببینید باس و سه برابر کردن اثرات یکسان سازی قفسه بندی
تاخیر {طول}
یک یا چند کانال صوتی را به تاخیر بیندازید. طول می تواند یک زمان را مشخص کند یا اگر به آن اضافه شود
یک «s»، تعدادی نمونه. هم زمان و هم تاخیرهای نمونه را در قسمت مشخص نکنید
همان فرمان مثلا، تاخیر 1.5 0 0.5 کانال اول را 1.5 به تاخیر می اندازد
ثانیه، کانال سوم 0.5 ثانیه، و کانال دوم را ترک می کند (و هر
کانال های دیگری که ممکن است وجود داشته باشند) بدون تاخیر. دستور زیر (یک طولانی).
صدای زنگ را پخش می کند:
play -n synth -j 3 sin %3 sin -2 sin %-5 sin -9 \
گناه -14 گناه -21 محو شدن ساعت .01 2 1.5 تاخیر \
ریمیکس 1.3 1 - fade h 76 54 27 norm -0
و این یک آکورد گیتار را می نوازد:
play -n synth pl G2 pl B2 pl D3 pl G3 pl D4 pl G4 \
تاخیر 0 ریمیکس - محو 05 1 هنجار -15
هیجان [-S|-s|-f فیلتر] [-a] [-p دقت]
دیترینگ را روی صدا اعمال کنید. دیترینگ عمداً مقدار کمی نویز اضافه می کند
به سیگنال به منظور پوشاندن اثرات کوانتیزاسیون شنیداری که ممکن است رخ دهد اگر
اندازه نمونه خروجی کمتر از 24 بیت است. بدون هیچ گزینه ای، این افکت اضافه خواهد شد
نویز سفید مثلثی (TPDF). شکل دهی نویز (فقط برای نرخ های نمونه خاص) می تواند
با انتخاب شود -s. با -f گزینه، امکان انتخاب یک خاص وجود دارد
فیلتر شکل دهنده نویز از لیست زیر: lipshitz، f-weighted، modified-e-
وزن دار، بهبود یافته-e-weighted، gesemann، shibata، low-shibata، high-shibata. توجه داشته باشید
که اکثر انواع فیلتر فقط با نرخ نمونه 44100 هرتز در دسترس هستند. فیلتر
انواع با ویژگی های زیر متمایز می شوند: قابلیت شنیدن نویز، سطح
(نامفهوم، اما در برخی شرایط، در غیر این صورت مشکل ساز) شکل فرکانس بالا
نویز و سرعت پردازش
دیدن http://sox.sourceforge.net/SoX/NoiseShaping برای نمودارهای نویزهای مختلف
شکل دادن به منحنی ها
La -S گزینه یک TPDF کمی شیب دار را انتخاب می کند که به سمت فرکانس های بالاتر تعصب دارد.
می توان آن را با هر نرخ نمونه برداری استفاده کرد، اما کمتر از 22k، TPDF ساده احتمالا بهتر است،
و بالاتر از ≈ 37k، نویز شکل احتمالا بهتر است.
La -a گزینه حالتی را فعال می کند که در آن دیترینگ (و شکل دهی نویز در صورت وجود) وجود دارد
به طور خودکار فقط در صورت نیاز فعال می شود. محتمل ترین استفاده برای این زمانی است
اعمال محو شدن در داخل یا خارج کردن فایل از قبل پراکنده شده، به طوری که مجدداً
فقط برای قسمت های پژمرده اعمال می شود. با این حال، دیترینگ خودکار ضد احمق نیست، بنابراین
محو شدن ها باید به دقت برای هر گونه مدولاسیون نویز بررسی شوند. اگر این اتفاق بیفتد،
سپس کل فایل را مجدداً در هم ریخته یا از آن استفاده کنید تر و تمیز, محو شدن، و به هم می پیوندند.
La -p گزینه اجازه می دهد تا دقت هدف را نادیده بگیرد.
اگر گزینه SoX global -R گزینه داده نمی شود، سپس عدد شبه تصادفی
ژنراتوری که برای تولید نویز سفید استفاده میشود، مجدداً تولید میشود
نویز بین فراخوان ها متفاوت خواهد بود.
این افکت نباید با هیچ افکت دیگری که روی صدا تأثیر می گذارد دنبال شود.
همچنین به بخش "Dithering" در بالا مراجعه کنید.
نمونه پایین [عامل(2)]
سیگنال را با یک ضریب صحیح کوچک کنید: فقط اولین مورد از هر کدام عامل
نمونه ها حفظ می شوند، بقیه دور ریخته می شوند.
هیچ فیلتر decation اعمال نمی شود. اگر ورودی به درستی باند محدود نشده باشد
سیگنال باند پایه، نام مستعار رخ خواهد داد. این ممکن است مطلوب باشد، به عنوان مثال، برای فرکانس
ترجمه
برای یک اثر کلی نمونه برداری مجدد با آنتی آلیاسینگ، نگاه کنید به نرخ. همچنین ببینید نمونه بالا.
موم گوش گوش دادن به صدا را در هدفون آسان تر می کند. "نشانه" را به استریو 44.1 کیلوهرتز اضافه می کند (به عنوان مثال
فرمت CD صوتی) صوتی به طوری که هنگام گوش دادن به هدفون تصویر استریو باشد
از داخل سر شما (استاندارد هدفون) به بیرون و جلو منتقل می شود
شنونده (استاندارد برای بلندگوها).
از دست به دست آوردن به دست آوردن <تاخیر پوسیدگی>
اکو را به صدا اضافه کنید. پژواک ها صدای بازتابی هستند و می توانند به طور طبیعی رخ دهند
در میان کوه ها (و گاهی اوقات ساختمان های بزرگ) هنگام صحبت یا فریاد. دیجیتال
افکتهای اکو این رفتار را تقلید میکنند و اغلب برای کمک به پر کردن صدا استفاده میشوند
از یک ساز یا آواز. تفاوت زمانی بین سیگنال اصلی
و انعکاس "تاخیر" (زمان) و بلندی سیگنال منعکس شده است
"پوسیدگی" است. پژواک های چندگانه می تواند تاخیر و پوسیدگی متفاوتی داشته باشد.
هر داده شده تاخیر پوسیدگی جفت تاخیر را در میلی ثانیه و واپاشی (نسبی
به دست آوردن) از آن پژواک. Gain-out حجم خروجی است. به عنوان مثال: این
آن را طوری به صدا در می آورد که گویی دوبرابر تعداد سازهای واقعی وجود دارد
بازی کردن:
بازی lead.aiff echo 0.8 0.88 60 0.4
اگر تأخیر بسیار کوتاه باشد، مانند یک ربات (فلزی) در حال پخش موسیقی به نظر می رسد:
بازی lead.aiff echo 0.8 0.88 6 0.4
تاخیر بیشتر شبیه کنسرت در فضای باز در کوهستان خواهد بود:
بازی lead.aiff echo 0.8 0.9 1000 0.3
یک کوه بیشتر و:
بازی lead.aiff echo 0.8 0.9 1000 0.3 1800 0.25
پژواک به دست آوردن به دست آوردن <تاخیر پوسیدگی>
دنباله ای از اکوها را به صدا اضافه کنید. هر یک تاخیر پوسیدگی جفت تاخیر در را می دهد
میلی ثانیه و زوال (نسبت به افزایش در) آن پژواک. به دست آوردن است
حجم خروجی
مانند افکت اکو، اکوها مخفف «ECHO in Sequel» هستند، که اولین اکو است.
ورودی را می گیرد، دومی ورودی و اولی اکو، سومی ورودی و
پژواک اول و دوم، ... و غیره. با استفاده از بسیاری باید مراقب بود
پژواک یک پژواک واحد همان اثر یک اکو را دارد.
نمونه دو بار در پژواک های متقارن برگشت داده می شود:
بازی lead.aiff echos 0.8 0.7 700 0.25 700 0.3
نمونه دو بار در پژواک های نامتقارن برگشت داده می شود:
بازی lead.aiff echos 0.8 0.7 700 0.25 900 0.3
نمونه به نظر می رسد که انگار در یک گاراژ پخش می شود:
بازی lead.aiff echos 0.8 0.7 40 0.25 63 0.3
اکولایزر فرکانس[k] عرض[q|o|h|k] سود
یک فیلتر دو قطبی تساوی پیکینگ (EQ) اعمال کنید. با این فیلتر، سیگنال
سطح در فرکانس انتخابی و اطراف آن را می توان افزایش یا کاهش داد، در حالی که
(برخلاف فیلترهای band-pass و band-reject) که در تمام فرکانس های دیگر وجود دارد
بدون تغییر
فرکانس فرکانس مرکزی فیلتر را بر حسب هرتز می دهد، عرض، پهنای باند و
سود بهره یا تضعیف مورد نیاز بر حسب دسی بل. مراقب باشید کلیپ کردن هنگام استفاده از a
مثبت سود.
به منظور تولید منحنی های یکسان سازی پیچیده، این اثر را می توان چندین داد
بارها، هر کدام با فرکانس مرکزی متفاوت.
فیلتر به تفصیل در [1] توضیح داده شده است.
این اثر پشتیبانی می کند --طرح گزینه جهانی
همچنین مشاهده کنید باس و سه برابر کردن برای اثرات تساوی قفسه.
محو شدن [نوع] محو شدن در طول [زمان توقف [کم رنگ شدن طول]]
یک افکت محو شدن را در ابتدا، انتهای یا هر دو صدا اعمال کنید.
اختیاری است نوع می توان برای انتخاب شکل منحنی محو شدن مشخص کرد: q برای
یک چهارم موج سینوسی، h برای نیم موج سینوسی، t برای شیب خطی (مثلثی)،
l برای لگاریتمی، و p برای سهمی معکوس پیش فرض لگاریتمی است.
یک Fade-in از اولین نمونه شروع می شود و سطح سیگنال را از 0 به کامل افزایش می دهد
حجم بیش از محو شدن در طول ثانیه در صورت عدم نیاز به محو شدن، 0 ثانیه را مشخص کنید.
برای محو کردن، صدا در کوتاه خواهد شد زمان توقف و سطح سیگنال خواهد بود
با شروع از ولوم کامل به 0 کاهش یابد کم رنگ شدن طول ثانیه قبل از
زمان توقف. اگر کم رنگ شدن طول مشخص نشده است، به طور پیش فرض همان مقدار است
محو شدن در طول. هیچ محو شدن انجام نمی شود اگر زمان توقف مشخص نشده است. اگر
طول فایل را می توان از سربرگ فایل ورودی و تغییر طول تعیین کرد
پس اثرات موثر نیستند 0 ممکن است برای زمان توقف برای نشان دادن
حالت معمولی محو شدن که در انتهای جریان صوتی ورودی به پایان می رسد.
همه زمان ها را می توان در دوره های زمانی یا تعداد نمونه مشخص کرد. برای مشخص کردن
دوره های زمانی از فرمت hh:mm:ss.frac استفاده می کنند. برای تعیین با استفاده از تعداد نمونه،
تعداد نمونه ها را مشخص کنید و حرف 's' را به تعداد نمونه اضافه کنید (برای
به عنوان مثال "8000s").
همچنین ببینید جفت کردن اثر.
شاه درخت [coefs-file|سرآشپزها]
از موتور پیچشی FFT SoX با ضرایب فیلتر FIR داده شده استفاده کنید. اگر مجرد
آرگومان داده می شود و سپس به عنوان نام یک فایل حاوی فیلتر تلقی می شود
ضرایب (فضای سفید جدا شده است؛ ممکن است حاوی نظرات ## باشد). اگر داده شده است
نام فایل «-» است، یا اگر هیچ آرگومانی داده نشود، ضرایب از آن خوانده میشوند
"ورودی استاندارد" (stdin); در غیر این صورت، ممکن است ضرایبی بر روی دستور داده شود
خط مثال ها:
sox infile outfile fir 0.0195 -0.082 0.234 0.891 -0.145 0.043
sox infile outfile fir coefs.txt
با coefs.txt حاوی
# فیلتر اچ پی
# فرکانس=10000
1.2311233052619888e-01
-4.4777096106211783e-01
5.1031563346705155e-01
-6.6502926320995331e-02
...
این اثر پشتیبانی می کند --طرح گزینه جهانی
فلنج [تاخیر عمق رگن عرض سرعت شکل دادن به فاز تعامل]
یک افکت فلنجینگ روی صدا اعمال کنید. برای توضیحات مفصل به [3] مراجعه کنید
فلنج زدن
همه پارامترها اختیاری هستند (از راست به چپ).
محدوده به طور پیش فرض توضیحات:
تاخیر 0 - 30 0 تاخیر پایه بر حسب میلی ثانیه.
عمق 0 - 10 2 اضافه شدن تاخیر جاروب در میلی ثانیه.
رگن -95 - 95 0 درصد بازسازی (تأخیر
بازخورد سیگنال).
عرض 0 - 100 71 درصد سیگنال تاخیری مخلوط شده است
با اورجینال
سرعت 0.1 - 10 0.5 حرکت در ثانیه (هرتز).
شکل دادن به شکل موج Swept: سینوسی|مثلث.
فاز 0 - 100 25 درصد موج جابجایی تغییر فاز
برای چند کانال (به عنوان مثال استریو)
فلنج; 0 = 100 = همان فاز روشن است
هر کانال
تعامل lin درونیابی خط تاخیری دیجیتال:
خطی|درجه دوم.
سود [-e|-B|-b|-r] [-n] [-l|-h] [افزایش-dB]
تقویت یا تضعیف سیگنال صوتی، یا در برخی موارد، در برخی موارد را اعمال کنید
از کانال های آن توجه داشته باشید که استفاده از هر یک از -e, -B, -b, -r، یا -n موقتی نیاز دارد
فضای فایل برای ذخیره سازی صدا برای پردازش، بنابراین ممکن است برای استفاده نامناسب باشد
صدای "جریان شده".
بدون گزینه های دیگر، افزایش-dB برای تنظیم سطح قدرت سیگنال توسط
تعداد دسی بل داده شده: مثبت تقویت می شود (مراقب بریدن باشید)، منفی ضعیف می شود.
با گزینه های دیگر، افزایش-dB تقویت یا تضعیف (منطقی) اعمال می شود
پس از پردازش با توجه به آن گزینه ها.
با توجه به -e گزینه، سطوح کانال های صوتی یک فایل چند کاناله می باشد
«برابر شده»، یعنی سود برای همه کانالهایی غیر از کانالهایی که بالاترین را دارند اعمال میشود
سطح اوج، به طوری که همه کانال ها به یک سطح اوج می رسند (اما، بدون همچنین
دادن -n، صدا "نرمال" نشده است).
La -B (تعادل) گزینه مشابه است -e، اما با -ب، سطح RMS استفاده می شود
به جای سطح اوج -B ممکن است برای اصلاح عدم تعادل استریو ناشی از
یک کارتریج صفحه گردان ناقص. توجه داشته باشید که بر خلاف -e, -B ممکن است باعث برخی شود
بریدن
-b مشابه است -B اما دارای محافظ برش است، یعنی در صورت لزوم برای جلوگیری از
برش در حین متعادل کردن، تضعیف برای همه کانال ها اعمال می شود. با این حال توجه داشته باشید
که در ارتباط با -n, -B و -b مترادف هستند.
La -r گزینه همراه با فراخوانی قبلی استفاده می شود سود با -h
گزینه - برای جزئیات به زیر مراجعه کنید.
La -n گزینه صدا را به 0dB FSD عادی می کند. اغلب همراه با استفاده می شود
منفی افزایش-dB به این معنی که صدا به یک سطح معین عادی می شود
زیر 0dB مثلا،
sox infile outfile gain -n
به 0dB عادی می شود و
sox infile outfile gain -n -3
به -3dB عادی می شود.
La -l گزینه یک محدود کننده ساده را فرا می خواند، به عنوان مثال
سوکس infile outfile gain -l 6
افزایش 6 دسی بل اعمال می شود اما هرگز قطع نمی شود. توجه داشته باشید که محدود کردن بیش از چند دسی بل بیشتر است
از گهگاه (در یک قطعه صوتی) توصیه نمی شود زیرا می تواند باعث شنیدن شود
اعوجاج. را ببینید شرکت اثر برای یک محدود کننده توانمندتر.
La -h گزینه برای اعمال بهره برای فراهم کردن فضای سر برای پردازش های بعدی استفاده می شود.
مثلاً با
sox infile outfile gain -h bass +6
6 دسی بل تضعیف قبل از اثر تقویت کننده باس اعمال می شود و در نتیجه اطمینان حاصل می شود
که کلیپ نمیشه البته با باس مشخص است که فضای سر چقدر خواهد بود
مورد نیاز است، اما با اثرات دیگر (مثلاً سرعت، دود شدن) همیشه آنقدر واضح نیست.
یکی دیگر از مزیت استفاده از سود -h به جای تضعیف صریح، این است که اگر
فضای سر با اثرات بعدی مورد استفاده قرار نمی گیرد، می توان آن را بازسازی کرد سود -r,
برای مثال:
sox infile outfile gain -h bass +6 rate 44100 gain -r
زنجیره افکتهای فوق تضمین میکند که هرگز قطع و تقویت نمیشوند. آن را تضعیف می کند اگر
برای جلوگیری از بریدن ضروری است، اما فقط به اندازه ای که برای انجام این کار لازم است.
قالب بندی خروجی (دیترینگ و کاهش عمق بیت) نیز به فضای سر (که
را نمی توان «بازیابی» کرد)، به عنوان مثال
افزایش خروجی فایل داخلی سوکس -h بیس +6 نرخ 44100 افزایش -rh dither
اینجا، دومی سود فراخوانی، تا جایی که می تواند فضای سر را از آن پس می گیرد
جلوههای قبلی را حفظ میکند، اما به اندازهای که برای کارهای بعدی نیاز است، فضای سر را حفظ میکند
در حال پردازش. گزینه جهانی SoX -G می توان به طور خودکار فراخوانی داد سود -h
و سود -r.
همچنین ببینید هنجار و حجم اثرات.
مرتفع|پایین گذار [-1|-2] فرکانس[k] [عرض[q|o|h|k]]
یک فیلتر بالا گذر یا پایین گذر با نقطه 3dB اعمال کنید فرکانس. فیلتر می تواند باشد
یا تک قطبی (با -1، یا دو قطبی (پیش فرض، یا با -2). عرض
فقط برای فیلترهای دو قطبی اعمال می شود. پیش فرض Q = 0.707 است و a را می دهد
پاسخ باترورث فیلترها با سرعت 6 دسی بل در هر قطب در اکتاو (20 دسی بل در هر اکتاو).
قطب در هر دهه). فیلترهای دو قطبی به تفصیل در [1] توضیح داده شده است.
این اثرات پشتیبانی می کند --طرح گزینه جهانی
همچنین مشاهده کنید گناه برای فیلترهایی با رول آف تندتر.
هیلبرت [-n شیپور خاموشی]
یک فیلتر تبدیل هیلبرت با ضربه عجیب و غریب اعمال کنید، سیگنال را 90 درجه تغییر فاز دهید.
این در بسیاری از طرحهای کدگذاری ماتریسی و برای تولید سیگنال تحلیلی استفاده میشود. در
فرآیند اغلب به صورت ضرب در نوشته می شود i (و یا j) واحد خیالی.
فیلتر تبدیل هیلبرت با ضربه عجیب و غریب دارای یک مشخصه باند گذر است که باعث کاهش آن می شود
پایین ترین و بالاترین فرکانس پهنای باند آن را می توان با تعداد کنترل کرد
شیرهای فیلتر، که می توان با آن مشخص کرد -n. به طور پیش فرض، تعداد ضربه ها است
برای فرکانس قطع حدود 75 هرتز انتخاب شده است.
این اثر پشتیبانی می کند --طرح گزینه جهانی
لادسپا واحد [پلاگین] [استدلال...]
یک پلاگین LADSPA [5] (API پلاگین ساده توسعه دهنده صوتی لینوکس) را اعمال کنید. با وجود
نام، LADSPA مختص لینوکس نیست و طیف وسیعی از افکت ها به عنوان موجود است
پلاگین های LADSPA، مانند cmt [6] (Computer Music Toolkit) و Steve Harris's
مجموعه افزونه ها [7]. آرگومان اول ماژول پلاگین است و دومی نام
از افزونه (یک ماژول می تواند بیش از یک افزونه داشته باشد) و هر آرگومان دیگری
برای پورت های کنترلی افزونه هستند. آرگومان های گمشده به صورت پیش فرض ارائه می شوند
در صورت امکان مقادیر فقط پلاگین هایی با حداکثر یک ورودی صدا و یک خروجی صدا
پورت قابل استفاده است. در صورت یافتن، متغیر محیطی LADSPA_PATH به عنوان استفاده خواهد شد
مسیر جستجو برای افزونه ها
صدای بلند [سود [مرجع]]
کنترل بلندی صدا - شبیه به سود اثر، اما یکسان سازی را برای
سیستم شنوایی انسان دیدن http://en.wikipedia.org/wiki/Loudness برای جزئیات
توصیف بلندی صدا سود با داده شده تنظیم می شود سود پارامتر (معمولا
منفی) و سیگنال مطابق با ISO 226 برابر با یک سطح مرجع از
65 دسی بل، اگرچه یک جایگزین مرجع سطح ممکن است داده شود اگر صدای اصلی داشته باشد
برای یک سطح بهینه دیگر برابر شده است. بهره پیشفرض 10-dB استفاده میشود اگر a
سود ارزش داده نشده است
همچنین ببینید سود اثر.
پایین گذار [-1|-2] فرکانس[k] [عرض[q|o|h|k]]
یک فیلتر پایین گذر اعمال کنید. توضیحات را ببینید مرتفع افکت برای جزئیات
mcompand "حمله1,پوسیدگی 1{,حمله2,پوسیدگی 2}
[نرم زانو-dB:]in-dB1[,خارج از dB1]{,in-dB2,خارج از dB2}
[سود [حجم اولیه-دسی بل [تاخیر]]]" {متقاطع فرکانس[k] "attack1،..."}
کامپاندر چند باندی شبیه کامپاندر تک باندی است اما صدا دارد
ابتدا با استفاده از فیلترهای متقاطع Linkwitz-Riley و به طور جداگانه به باندها تقسیم شدند
کامپاندر مشخص روی هر باند اجرا می شود. را ببینید شرکت اثر برای تعریف
از پارامترهای آن پارامترهای Compand بین دو گیومه و
فرکانس متقاطع برای آن باند توسط داده می شود متقاطع فرکانس; اینها را می توان تکرار کرد
برای ایجاد باندهای متعدد
به عنوان مثال، دستور زیر (یک طولانی) نشان می دهد که ترکیب چند باندی چقدر است
معمولاً در رادیو FM استفاده می شود:
پخش track1.wav gain -3 sinc 8000- 29 100 mcompand \
"0.005,0.1 -47,-40,-34,-34,-17,-33" 100 \
"0.003,0.05 -47,-40,-34,-34,-17,-33" 400 \
"0.000625,0.0125 -47,-40,-34,-34,-15,-33" 1600 \
"0.0001,0.025 -47,-40,-34,-34,-31,-31,-0,-30" 6400 \
"0,0.025 -38,-31,-28,-28,-0,-25" \
افزایش 15 highpass 22 highpass 22 sinc -n 255 -b 16 -17500 \
افزایش 9 lowpass -1 17801
فایل صوتی با صدای رادیو FM شبیه سازی شده (یا سیگنال پخش شده) پخش می شود
در صورتی که فیلتر پایین گذر در انتهای آن نادیده گرفته شود). توجه داشته باشید که خط لوله است
با پیش تاکید 75us به سبک ایالات متحده راه اندازی شده است.
همچنین مشاهده کنید شرکت برای اثر ترکیبی تک باند.
سر و صدا [پروفایل-پرونده]
مشخصات صدا را برای استفاده در کاهش نویز محاسبه کنید. توضیحات را ببینید
از سر و صدا کرد افکت برای جزئیات
سر و صدا کرد [پروفایل-پرونده [مقدار]]
کاهش نویز در سیگنال صوتی با پروفایل و فیلتر کردن. این اثر است
در از بین بردن صدای مداوم پس زمینه مانند خش خش یا زمزمه نسبتاً مؤثر است.
برای استفاده از آن، ابتدا SoX را با سر و صدا اثر بر بخشی از صدا که
در حالت ایده آل حاوی سکوت است اما در واقع حاوی نویز است - چنین بخش هایی هستند
معمولاً در ابتدا یا انتهای یک ضبط یافت می شود. سر و صدا خواهد نوشت
یک نمایه نویز به پروفایل-پرونده، یا اگر نه پروفایل-پرونده یا اگر "-" باشد
داده شده. به عنوان مثال
sox speech.wav -n trim 0 1.5 noiseprof speech.noise-profile
برای حذف نویز، SoX را دوباره اجرا کنید، این بار با سر و صدا کرد اثر
سر و صدا کرد نویز را با توجه به مشخصات نویز (که توسط
سر و صدا)، از جانب پروفایل-پرونده، یا از stdin اگر نه پروفایل-پرونده یا اگر «-» داده شود.
به عنوان مثال
sox speech.wav cleaned.wav noisered speech.noise-profile 0.3
میزان نویز باید حذف شود توسط مشخص شده است مقدار-a عدد بین 0 و 1
با پیش فرض 0.5. اعداد بالاتر نویز بیشتری را حذف میکنند اما نویز بیشتری را نشان میدهند
احتمال حذف اجزای مورد نظر سیگنال صوتی. قبل از تعویض یک
ضبط اصلی با نسخه کم نویز، آزمایش با نسخه های مختلف مقدار
مقادیر برای یافتن بهینه برای صدای خود؛ از هدفون برای بررسی اینکه هستید استفاده کنید
خوشحال از نتایج، توجه ویژه به بخش های ساکت تر
سمعی.
در اکثر سیستم ها، دو مرحله - پروفایل و کاهش - می توانند با استفاده از a ترکیب شوند
لوله، به عنوان مثال
sox noisy.wav -n trim 0 1 noiseprof | پخش نویز. wav نویزدار
هنجار [سطح دسی بل]
صدا را عادی کنید هنجار فقط نام مستعار برای است سود -n؛ دیدن سود اثر برای
جزئیات.
اوه جلوه استریو خارج از فاز. هر کانال مونو استریو را به مونو دوقلو ترکیب می کند
شامل تفاوت بین کانال های استریو چپ و راست است. این هست
گاهی اوقات به عنوان اثر "کارائوکه" شناخته می شود، زیرا اغلب اثر آن را از بین می برد
یا تمام آوازهای ضبط شده. معادل است با ریمیکس 1,2i 1,2i.
بیش از حد [سود(20) [رنگ(20)]]
اعوجاج غیر خطی در رنگ پارامتر مقدار یکنواخت هارمونیک را کنترل می کند
محتوا در خروجی بیش از حد.
لایی { طول[@موقعیت] }
صدا را با سکوت، در ابتدا، انتهای یا هر نقطه مشخصی قرار دهید
از طریق صدا هر دو طول و موقعیت می تواند یک زمان یا در صورت پیوست را مشخص کند
با 's'، تعدادی نمونه. طول مقدار سکوت برای درج و
موقعیت موقعیت در جریان صوتی ورودی که در آن درج می شود. هر عددی
طول ها و موقعیت ها را می توان مشخص کرد، مشروط بر اینکه یک موقعیت مشخص باشد
نه کمتر از قبلی موقعیت برای اولین و آخرین اختیاری است
طول های مشخص شده و در صورت حذف مربوط به ابتدا و انتهای آن است
صوتی به ترتیب مثلا، لایی 1.5 1.5 1.5 ثانیه padding سکوت اضافه می کند
در هر انتهای صدا، در حالی که لایی 4000s@3:00 درج 4000 نمونه سکوت 3
دقیقه پس از صدا اگر سکوت فقط در انتهای صدا مورد نظر است، آن را مشخص کنید
یا موقعیت پایانی را مشخص کنید یا در ابتدا یک پد با طول صفر مشخص کنید.
همچنین مشاهده کنید تاخیر برای جلوه ای که می تواند سکوت را در ابتدای صدا اضافه کند
به صورت کانال به کانال
phaser به دست آوردن به دست آوردن تاخیر پوسیدگی سرعت [-s|-t]
افکت فازبندی را به صدا اضافه کنید. [3] را برای شرح دقیق مرحله بندی رجوع کنید.
تأخیر / زوال / سرعت تأخیر را در میلی ثانیه و فروپاشی (نسبت به افزایش
in) با سرعت مدولاسیون بر حسب هرتز. مدولاسیون یا سینوسی است (-s) -
برای سازهای متعدد یا مثلثی (-t) - تک ساز می دهد
یک اثر فازبندی واضح تر پوسیدگی باید کمتر از 0.5 باشد تا از بازخورد جلوگیری شود
معمولا کمتر از 0.1 نیست. Gain-out حجم خروجی است.
مثلا:
بازی Snare.flac Phaser 0.8 0.74 3 0.4 0.5 -t
ملایم تر:
بازی Snare.flac Phaser 0.9 0.85 4 0.23 1.3 -s
صدای محبوب:
بازی Snare.flac Phaser 0.89 0.85 1 0.24 2 -t
شدیدتر:
بازی Snare.flac Phaser 0.6 0.66 3 0.6 2 -t
گام [-q] تغییر [بخش [جستجو کردن [همپوشانی]]]
زیر و بمی صدا را تغییر دهید (اما نه سرعت).
تغییر تغییر گام را به صورت "سنت" مثبت یا منفی می دهد (یعنی 100م a
نیم صدا). را ببینید زمان اثر برای توصیف سایر پارامترها.
همچنین ببینید خم, سرعتو زمان اثرات.
نرخ [-q|-l|-m|-h|-v] [گزینه های لغو] نرخ[k]
نرخ نمونهگیری صوتی (یعنی نمونهگیری مجدد صدا) را به هر دادهای تغییر دهید نرخ (زوج
اگر فرمت فایل خروجی از آن پشتیبانی شود) با استفاده از یک سطح کیفیت، غیر صحیح است
به صورت زیر تعریف شده است:
کیفیت باند- رج dB معمول استفاده کنید
عرض
-q پخش سریع ≈30 @ روشن است
سخت افزار باستانی Fs/4
-l پایین 80% 100 پخش در قدیمی
سخت افزار
-m پخش صوتی متوسط 95% 100
-h مسترینگ 95 بیتی 125 16% بالا
(استفاده با دیتر)
-v بسیار بالا 95% 175 مسترینگ 24 بیتی
جایی که پهنای باند درصدی از باند فرکانس صوتی است که حفظ شده است
و رج dB سطح دفع نویز است. افزایش سطوح نمونه گیری مجدد
کیفیت به قیمت افزایش زمان برای پردازش صدا تمام می شود. اگر
هیچ گزینه کیفیتی داده نشده است، سطح کیفیت استفاده شده "بالا" است (اما به "بازی و" مراجعه کنید
ضبط صدا در بالا در مورد پخش).
الگوریتم "سریع" از درون یابی مکعبی استفاده می کند. بقیه از band-limited استفاده می کنند
درون یابی به طور پیشفرض، همه الگوریتمها یک پاسخ فاز «خطی» دارند. برای
«متوسط»، «بالا» و «بسیار زیاد»، پاسخ فاز قابل تنظیم است (به زیر مراجعه کنید).
La نرخ اگر SoX باشد، اثر به طور خودکار فراخوانی می شود -r گزینه نرخی را مشخص می کند که
با فایل(های) ورودی متفاوت است. یا اگر این اثر داده شود
به صراحت، سپس SoX -r گزینه لازم نیست داده شود به عنوان مثال، دو مورد زیر
دستورات معادل هستند:
sox input.wav -r 48k output.wav bass -b 24
sox input.wav output.wav bass -b 24 rate 48k
اگرچه فرمان دوم تا آنجا که اجازه می دهد انعطاف پذیرتر است نرخ گزینه هایی که باید داده شود،
و اجازه می دهد تا اثرات خودسرانه سفارش داده شوند.
* * * *
اخطار: بحث دقیق فنی در ادامه می آید.
انتخاب ساده کیفیتی که در بالا توضیح داده شد، تنظیماتی را فراهم میکند که این موارد را برآورده میکند
نیازهای اکثریت قریب به اتفاق وظایف نمونه گیری مجدد هرچند گاهی ممکن است اینطور باشد
مطلوب برای تنظیم دقیق پاسخ فیلتر resampler. این را می توان با استفاده از
باطل کردن گزینه های، به شرح جدول زیر:
-M/-I/-L پاسخ فاز = حداقل / متوسط / خطی
-s فیلتر شیب دار (عرض باند = 99%)
-a اجازه دادن نام مستعار/تصویربرداری در بالای باند عبور
-b 74-99.7 هر % پهنای باند
-p 0-100 هر پاسخ فاز (0 = حداقل، 25 = متوسط،
50 = خطی، 100 = حداکثر)
گزینه های NB Override را نمی توان با الگوریتم های کیفیت "سریع" یا "کم" استفاده کرد.
همه نمونههای مجدد از فیلترهایی استفاده میکنند که گاهی اوقات میتوانند «پژواک» (معروف به زنگ زدن) ایجاد کنند.
مصنوعات با سیگنالهای گذرا مانند آنهایی که با «فشیدن انگشت» یا
سایر صداهای بسیار پرکاشن چنین آثار باستانی بسیار بیشتر قابل توجه است
گوش انسان اگر قبل از گذرا («پیش اکو») اتفاق بیفتد تا زمانی که بعد از آن رخ دهد
آن ("پس از اکو"). توجه داشته باشید که فراوانی هر گونه آثار باستانی مربوط به
از نرخ نمونه برداری اولیه و جدید کمتر است، اما اگر حداقل این باشد
44.1 کیلوهرتز، پس از آن آثار باستانی خارج از محدوده شنوایی انسان قرار خواهند گرفت.
تنظیم پاسخ فاز ممکن است برای کنترل توزیع هر گذرا استفاده شود
پژواک بین "پیش" و "پست": با حداقل فاز، هیچ پیش اکو جز این وجود ندارد
طولانی ترین پس اکو؛ با فاز خطی، پژواک پیش و پس از آن به مقدار مساوی هستند (در
اصطلاحات سیگنال، اما نه شرایط قابل شنیدن)؛ تنظیم فاز میانی تلاش می کند تا
با انتخاب یک طول (و سطح) کوچک از preecho و a بهترین سازش را پیدا کنید
پس اکو با طول متوسط
پاسخ فاز حداقل، متوسط یا خطی با استفاده از گزینه انتخاب می شود -M, -I، یا -L
گزینه؛ یک پاسخ فاز سفارشی را می توان با ایجاد کرد -p گزینه. به آن مرحله توجه کنید
پاسخ های بین "خطی" و "حداکثر" (بیشتر از 50) به ندرت مفید هستند.
تنظیم پهنای باند نمونهبردار مجدد میزان محتوای فرکانس را تعیین میکند
سیگنال اصلی (میزان نمونه اولیه را در هنگام نمونه برداری بالا، یا جدید را بنویسید
نرخ نمونه در هنگام نمونه برداری پایین) در طول تبدیل حفظ می شود. اصطلاح پاس -
band' برای اشاره به تمام فرکانس ها تا نقطه پهنای باند استفاده می شود (مثلاً برای
نرخ نمونه برداری 44.1 کیلوهرتز و پهنای باند نمونه برداری مجدد 95 درصد، باند عبور نشان دهنده
فرکانس از 0 هرتز (DC) تا حدود 21 کیلوهرتز). افزایش پهنای باند نمونهبردار مجدد
منجر به تبدیل کندتر می شود و می تواند آثار هنری اکو گذرا را افزایش دهد (و معاون
بالعکس)
La -s گزینه "فیلتر شیب دار" پهنای باند نمونه برداری مجدد را از 95% پیش فرض تغییر می دهد.
(بر اساس نقطه 3dB)، به 99٪. در -b گزینه اجازه می دهد تا پهنای باند را روی آن تنظیم کنید
هر مقداری در محدوده 74-99.7٪ باشد، اما توجه داشته باشید که مقادیر پهنای باند بیشتر از 99٪ است.
برای استفاده معمولی توصیه نمی شوند زیرا می توانند باعث اکو گذرا بیش از حد شوند.
اگر -a گزینه داده می شود، سپس نام مستعار/تصویربرداری بالای باند عبور مجاز است.
برای مثال، با نرخ نمونه برداری 44.1 کیلوهرتز، و پهنای باند نمونه برداری مجدد 95 درصد، این
به این معنی که محتوای فرکانس بالای 21 کیلوهرتز می تواند تحریف شود. با این حال، از آنجایی که این است
بالای باند عبور (یعنی بالاتر از بالاترین فرکانس علاقه/شنیدن)،
این ممکن است مشکلی نباشد. مزایای اجازه دادن به aliasing/imaging کاهش می یابد
زمان پردازش و کاهش (تقریباً به نصف) آثار باستانی اکو گذرا. توجه داشته باشید که
اگر این گزینه داده شود، حداقل پهنای باند مجاز با -b افزایش می یابد به
85٪.
مثال:
sox input.wav -b 16 output.wav rate -s -a 44100 dither -s
نمونه برداری مجدد با کیفیت پیش فرض (بالا). نادیده گرفته می شود: فیلتر شیب دار، اجازه می دهد نام مستعار. به
نرخ نمونه 44.1 کیلوهرتز؛ سر و صدا شکل به فایل WAV 16 بیتی.
sox input.wav -b 24 output.aiff rate -v -I -b 90 48k
نمونه برداری مجدد با کیفیت بسیار بالا؛ لغو: فاز میانی، پهنای باند 90%؛ تا 48 هزار
نرخ نمونه؛ خروجی را در فایل AIFF 24 بیتی ذخیره کنید.
* * * *
La گام و سرعت اثرات استفاده از نرخ در هسته آنها تأثیر می گذارد.
ریمیکس [-a|-m|-p]خارج از مشخصات>
خارج از مشخصات = در مشخصات{,در مشخصات} | 0
در مشخصات = [در چان][-[in-chan2]][vol-spec]
vol-spec = p|i|v[حجم]
کانال های صوتی ورودی را با کانال های صوتی خروجی انتخاب و ترکیب کنید. هر خروجی
کانال به نوبه خود توسط یک داده مشخص می شود خارج از مشخصات: فهرستی از ورودی های کمک کننده
کانال ها و مشخصات حجم
توجه داشته باشید که این افکت روی صدا عمل می کند کانال در جلوه های SoX
زنجیره پردازش؛ نباید با آن اشتباه شود -m گزینه جهانی (که در آن
چندگانه فایل ها قبل از ورود به زنجیره افکت ها با هم ترکیب می شوند).
An خارج از مشخصات شامل اعداد کانال ورودی جدا شده با کاما و مشخص شده با خط فاصله
محدوده شماره کانال؛ متناوبا، از سوی دیگر، 0 ممکن است برای ایجاد یک خروجی بی صدا داده شود
کانال مثلا،
sox input.wav output.wav remix 6 7 8 0
یک فایل خروجی با چهار کانال ایجاد می کند که کانال های 1، 2 و 3 کپی هستند
کانال های 6، 7 و 8 در فایل ورودی و کانال 4 بی صدا است. در حالیکه
sox input.wav output.wav remix 1-3,7،3 XNUMX
یک فایل خروجی استریو (تا حدودی عجیب و غریب) ایجاد می کند که در آن کانال سمت چپ ترکیبی است.
پایین کانال های ورودی 1، 2، 3 و 7، و کانال سمت راست یک کپی از ورودی است.
کانال 3.
جایی که محدوده ای از کانال ها مشخص شده است، شماره کانال در سمت چپ و راست
خط تیره اختیاری است و به طور پیش فرض 1 و تعداد کانال های ورودی است
به ترتیب. بدین ترتیب
sox input.wav output.wav remix -
ترکیبی از تمام کانال های ورودی به مونو انجام می دهد.
به طور پیش فرض، جایی که یک کانال خروجی از چندین (n) کانال ورودی، هر کدام مخلوط می شود
کانال ورودی با ضریب ¹/n مقیاس بندی می شود. حجم های اختلاط سفارشی را می توان تنظیم کرد
با دنبال کردن یک کانال ورودی داده شده یا محدوده کانال های ورودی با a vol-spec
(مشخصات حجمی). این یکی از حروف است p, i، یا v، به دنبال یک
عدد حجمی که معنای آن به حرف داده شده بستگی دارد و به صورت تعریف می شود
به شرح زیر است:
نامه حجم عدد یادداشت
تنظیم توان p در دسی بل 0 = بدون تغییر
توان i را در دسی بل به صورت «p» تنظیم کنید، اما آن را معکوس کنید
سمعی
v ضریب ولتاژ 1 = بدون تغییر، 0.5 ≈ 6dB
میرایی، 2 ≈ 6dB
افزایش، -1 = معکوس
اگر یک خارج از مشخصات حداقل یکی را شامل می شود vol-spec سپس، به طور پیشفرض، مقیاسبندی ¹/n نیست
برای هر کانال دیگری در همان مشخصات خارجی اعمال می شود (اگرچه ممکن است در سایر کانال ها باشد
مشخصات). با این حال، گزینه -a (اتوماتیک) را می توان برای حفظ خودکار در نظر گرفت
پوسته پوسته شدن در این مورد مثلا،
sox input.wav output.wav remix 1,2 3,4v0.8
منجر به ضرب کننده های سطح کانال 0.5,0.5،1,0.8 XNUMX،XNUMX می شود، در حالی که
sox input.wav output.wav remix -a 1,2 3,4v0.8
منجر به ضرب کننده های سطح کانال 0.5,0.5،0.5,0.8 XNUMX،XNUMX می شود.
گزینه -m (دستی) تمام تنظیمات خودکار صدا را غیرفعال می کند، بنابراین
sox input.wav output.wav remix -m 1,2 3,4v0.8
منجر به ضرب کننده های سطح کانال 1,1،1,0.8 XNUMX،XNUMX می شود.
شماره حجم اختیاری است و حذف آن با عدم تغییر حجم مطابقت دارد.
با این حال، تنها موردی که در آن مفید است در رابطه با i. برای
به عنوان مثال ، اگر ورودی.wav پس استریو است
sox input.wav output.wav remix 1,2i
یک معادل تکی است اوه اثر.
اگر -p گزینه داده می شود، سپس هر مقیاس خودکار ¹/n با ¹/√n جایگزین می شود
("قدرت") مقیاس بندی; این ترکیبی بلندتر می دهد، اما ممکن است گاهی اوقات کلیپ شود.
* * * *
یکی از استفاده از ریمیکس اثر این است که یک فایل صوتی را به مجموعه ای از فایل ها تقسیم کنید
حاوی یکی از کانال های تشکیل دهنده (به منظور اجرای بعدی
پردازش در کانال های صوتی فردی). جایی که بیش از چند کانال وجود دارد
اسکریپتی مانند زیر (اسکریپت پوسته Bourne) مفید است:
#!/ بن / شل
chans=`soxi -c "$1"`
در حالی که [ $chans -ge 1 ]; انجام دادن
chans0=`printf %02i $chans` # 2 رقم از این رو تا 99 کانال
out=`echo "$1"|sed "s/\(.*\)\.\(.*\)/\1-$chans0.\2/"`
sox "$1" "$out" remix $chans
chans=`expr $chans - 1`
انجام شده
اگر یک فایل ورودی.wav شامل شش کانال صوتی داده شد، فیلمنامه خواهد شد
تولید شش فایل خروجی: input-01.wav, input-02.wav، ... ، input-06.wav.
همچنین ببینید مبادله اثر.
تکرار [تعداد دفعات مشاهده (1)]
کل صدا را تکرار کنید تعداد دفعات مشاهده بارها یا یک بار اگر تعداد دفعات مشاهده داده نمی شود. نیاز دارد
فضای فایل موقت برای ذخیره صدا برای تکرار. توجه داشته باشید که یک بار تکرار کنید
دو نسخه تولید می کند: صدای اصلی و صدای تکراری.
Reverb [-w|--فقط مرطوب] [طنین (50%) [میرایی HF (٪ 50)
[مقیاس اتاق (100%) [عمق استریو (٪ 100)
[پیش تاخیر (0ms) [خیس شدن (0dB)]]]]]]
با استفاده از الگوریتم «freeverb» طنین را به صدا اضافه کنید. یک طنین
گاهی اوقات برای سالنهای کنسرت که خیلی کوچک هستند یا دارای چنین اثری هستند مطلوب است
بسیاری از مردم که طنین طبیعی سالن کاهش یافته است. اعمال کوچک
مقدار ریورب استریو به یک سیگنال مونو (خشک) معمولاً باعث می شود صدای آن بیشتر شود
طبیعی [3] را برای شرح مفصل طنین رجوع کنید.
توجه داشته باشید که این افکت هم حجم و هم طول صدا را افزایش می دهد، بنابراین به
جلوگیری از برش در این دامنه ها، یک فراخوان معمولی ممکن است به صورت زیر باشد:
بازی dry.wav gain -3 pad 0 3 Reverb
La -w می توان گزینه ای را برای انتخاب فقط سیگنال "مرطوب" داده و بنابراین اجازه می دهد که باشد
مستقل از سیگنال "خشک" بیشتر پردازش می شود. به عنوان مثال
play -m voice.wav "|sox voice.wav -p reverse reverb -w reverse"
برای اثر ریورب معکوس
معکوس
صدا را کاملاً معکوس کنید. برای ذخیره صدا به فضای فایل موقتی نیاز دارد
معکوس شود
ریاا یکسان سازی پخش وینیل RIAA را اعمال کنید. نرخ نمونه برداری باید یکی از موارد زیر باشد: 44.1،
48، 88.2، 96 کیلوهرتز.
این اثر پشتیبانی می کند --طرح گزینه جهانی
سکوت [-l] دوره های بالاتر [مدت آستانه[d|%]
[زیر دوره ها مدت آستانه[d|%]]
سکوت را از ابتدا، وسط یا انتهای صدا حذف می کند. "سکوت" است
توسط یک آستانه مشخص تعیین می شود.
La دوره های بالاتر مقدار برای نشان دادن اینکه آیا صدا باید در قسمت کوتاه شود یا خیر استفاده می شود
ابتدای صوت مقدار صفر نشان می دهد که هیچ سکوتی نباید قطع شود
آغاز. هنگام تعیین یک غیر صفر دوره های بالاتر، صدا را تا زمانی که
عدم سکوت را می یابد. به طور معمول، هنگام کوتاه کردن سکوت از ابتدای صدا
دوره های بالاتر 1 خواهد بود، اما می توان آن را به مقادیر بالاتر افزایش داد تا تمام صداها کاهش یابد
تا تعداد خاصی از دوره های غیرسکوت. مثلاً اگر صدا داشتید
فایل با دو آهنگ که هرکدام شامل 2 ثانیه سکوت قبل از آهنگ، شما
می تواند یک را مشخص کند بالاتر از دوره از 2 برای حذف هر دو دوره سکوت و اول
ترانه.
چه زمانی دوره های بالاتر غیر صفر است، باید a را نیز مشخص کنید مدت و آستانه.
مدت زمان نشان دهنده مدت زمانی است که عدم سکوت باید قبل از آن تشخیص داده شود
قطع صدا را متوقف می کند با افزایش مدت زمان، انفجار سر و صدا را می توان به عنوان درمان کرد
سکوت و کوتاه شده
آستان برای نشان دادن اینکه چه مقدار نمونه را باید به عنوان سکوت در نظر بگیرید استفاده می شود. برای
صدای دیجیتال، مقدار 0 ممکن است خوب باشد، اما برای صدای ضبط شده از آنالوگ، ممکن است
مایل به افزایش مقدار برای در نظر گرفتن نویز پس زمینه هستند.
هنگامی که به صورت اختیاری سکوت را از انتهای صدا کوتاه می کنید، a را مشخص می کنید زیر-
دوره ها شمردن. در این مورد، زیر پریود به معنای حذف تمام صداها پس از سکوت است
تشخیص داده می شود. به طور معمول، این مقدار 1 خواهد بود، اما می توان آن را برای رد شدن افزایش داد
در طول دوره های سکوتی که مورد نظر است. مثلاً اگر آهنگی با 2 دارید
ثانیه سکوت در وسط و 2 ثانیه در پایان، می توانید در زیر تنظیم کنید-
نقطه به مقدار 2 برای رد شدن از سکوت در وسط صدا.
برای زیر دوره ها, مدت یک دوره سکوت را مشخص می کند که باید قبلا وجود داشته باشد
صدا دیگر کپی نمی شود با مشخص کردن مدت زمان بالاتر، سکوت است
خواسته را می توان در صدا گذاشت. به عنوان مثال، اگر یک آهنگ با یک مورد انتظار دارید
1 ثانیه سکوت در وسط و 2 ثانیه سکوت در پایان، مدت زمان
از 2 ثانیه می توان برای رد شدن از سکوت میانی استفاده کرد.
متأسفانه، شما باید مدت زمان سکوت در پایان صدای خود را بدانید
فایل برای قطع کردن سکوت به طور قابل اعتماد. کار در اطراف استفاده از سکوت اثر در
ترکیب با معکوس اثر ابتدا با معکوس کردن صدا، می توانید از آن استفاده کنید
دوره های بالاتر برای برش مطمئن تمام صدا از چیزی که شبیه جلوی آن است
فایل. سپس فایل را دوباره برگردانید تا به حالت عادی بازگردد.
برای حذف سکوت از وسط یک فایل، a را مشخص کنید زیر دوره ها است که
منفی. سپس این مقدار به عنوان یک مقدار مثبت در نظر گرفته می شود و همچنین از آن استفاده می شود
نشان می دهد که اثر باید پردازش را همانطور که توسط دوره های بالاتر,
آن را برای حذف دوره های سکوت در وسط صدا مناسب می کند.
گزینه -l نشان میدهد که زیر دوره ها مدت طول صدا باید باقی بماند
دست نخورده در آغاز هر دوره سکوت. مثلا اگر بخواهید
مکث های طولانی بین کلمات را حذف کنید اما نمی خواهید مکث ها را به طور کامل حذف کنید.
La دوره شمارش در واحد نمونه است. مدت زمان شمارش ممکن است در قالب باشد
hh:mm:ss.frac یا تعداد دقیق نمونهها. آستان اعداد ممکن است پسوند باشند
با d برای نشان دادن مقدار بر حسب دسی بل، یا % برای نشان دادن درصدی از
حداکثر مقدار مقدار نمونه (0% سکوت دیجیتال خالص را مشخص می کند).
مثال زیر نشان می دهد که چگونه می توان از این افکت برای شروع یک ضبط استفاده کرد
شامل تاخیر در شروع که معمولا بین "فشار دادن" رخ می دهد، نیست
دکمه ضبط و شروع اجرا:
ضبط پارامترهای نام فایل اثرات دیگر سکوت 1 5 2%
گناه [-a att|-b بتا] [-p فاز|-M|-I|-L] [-t tbw|-n شیپور خاموشی] [fqHP][-freqLP [-t tbw|-n
ضربه بزنید]]
یک فیلتر پایین گذر، بالا گذر، باند گذر یا رد باند با پنجره sinc kaiser اعمال کنید
به سیگنال در fqHP و freqLP پارامترها فرکانس های 6dB را می دهند
نقاط یک فیلتر بالاگذر و پایین گذر که ممکن است به صورت جداگانه فراخوانی شوند، یا
با یکدیگر. اگر هر دو داده شود، پس fqHP کمتر از freqLP یک باند گذر ایجاد می کند
فیلتر ، fqHP بزرگتر از freqLP یک فیلتر رد باند ایجاد می کند. به عنوان مثال
استناد
سینک 3k
سینک -4k
سینک 3k-4k
سینک 4k-3k
به ترتیب یک فیلتر بالا گذر، پایین گذر، باند گذر و باند رد ایجاد کنید.
تضعیف باند توقف پیشفرض 120 دسیبل را میتوان با آن لغو کرد -a;
به طور متناوب، پارامتر "بتا" kaiser-window را می توان مستقیماً با آن داد -b.
پهنای باند انتقال پیشفرض 5 درصد از کل باند را میتوان با آن لغو کرد -t
(و tbw در هرتز)؛ به طور متناوب، تعداد شیرهای فیلتر را می توان مستقیماً داد
با -n.
اگر هر دو fqHP و freqLP داده می شود، سپس الف -t or -n گزینه داده شده در سمت چپ
فرکانس ها برای هر دو فرکانس اعمال می شود. یکی از این گزینه ها به
حق فرکانس ها فقط برای freqLP.
La -p, -M, -Iو -L گزینه ها پاسخ فاز فیلتر را کنترل می کنند. را ببینید نرخ
افکت برای جزئیات
این اثر پشتیبانی می کند --طرح گزینه جهانی
طیف سنجی [گزینه های]
ایجاد یک طیف نگاری از صدا؛ صدا بدون تغییر از طریق SoX ارسال می شود
زنجیره پردازش این افکت اختیاری است - نوع جورابها --کمک و لیست را بررسی کنید
جلوه های پشتیبانی شده برای دیدن اینکه آیا آن را گنجانده شده است.
طیف نگار در یک فایل گرافیکی شبکه قابل حمل (PNG) ارائه می شود و نشان می دهد
زمان در محور X، فرکانس در محور Y و بزرگی سیگنال صوتی در Z-
محور. مقادیر محور Z با رنگ (یا به صورت اختیاری شدت) نشان داده می شوند
پیکسل ها در صفحه XY اگر سیگنال صوتی حاوی چندین کانال باشد، پس
اینها از بالا به پایین با شروع از کانال 1 (که سمت چپ است) نشان داده شده اند
کانال برای صدای استریو).
برای مثال، اگر «my.wav» یک فایل استریو است، با
sox my.wav -n طیف نگار
یک طیف نگاری از کل فایل در فایل 'spectrogram.png' ایجاد می شود.
اغلب اوقات، تجزیه و تحلیل بخش کوچکتری از صدا مورد نیاز است. به عنوان مثال
با
sox my.wav -n remix 2 trim 20 30 spectrogram
طیف نگار اطلاعات را فقط از کانال دوم (راست) نشان می دهد
سی ثانیه از صدا شروع از بیست ثانیه در. برای تجزیه و تحلیل کوچک
بخشی از حوزه فرکانس، نرخ اثر ممکن است استفاده شود، به عنوان مثال
طیفگرام sox my.wav -n نرخ 6k
امکان تجزیه و تحلیل دقیق فرکانسهای تا 3 کیلوهرتز (نصف نرخ نمونهبرداری) را فراهم میکند
جایی که سیستم شنوایی انسان حساس ترین است. با
sox my.wav -n trim 0 10 spectrogram -x 600 -y 200 -z 100
گزینه های داده شده اندازه محورهای X، Y و Z طیف نگار را کنترل می کنند (در این
در این حالت، ناحیه طیفگرام تصویر تولید شده 600 در 200 پیکسل خواهد بود.
و محدوده محور Z 100 دسی بل خواهد بود). توجه داشته باشید که تصویر تولید شده شامل محور است
افسانه ها و غیره و بنابراین کمی بزرگتر از اندازه طیف گرامی مشخص شده خواهد بود.
در این مثال:
sox -n -n synth 6 tri 10k:14k طیف سنجی -z 100 -w kaiser
یک "پنجره" تحلیلی با محدوده دینامیکی بالا برای نمایش بهترین گزینه انتخاب شده است
طیف نگار موج مثلثی جاروب شده برای مثال مشابه، موارد زیر را ضمیمه کنید
به دستور 'chime' در توضیحات تاخیر اثر (در بالا):
نرخ طیف 2k -X 200 -Z -10 -w kaiser
گزینه هایی نیز برای کنترل ظاهر موجود است (رنگ، روشنایی،
کنتراست و غیره) و نام فایل طیف گرا. به عنوان مثال با
sox my.wav -n طیف نگار -m -l -o print.png
یک طیف نگار مناسب برای چاپ روی چاپگر سیاه و سفید ایجاد شده است.
گزینه های ارسال:
-x تعداد پهنای (حداکثر) (محور X) طیفگرام را از پیشفرض آن تغییر دهید
مقدار 800 پیکسل به یک عدد معین بین 100 و 200000. همچنین ببینید -X
و -d.
-X تعداد پیکسل های محور X/ثانیه؛ پیش فرض به صورت خودکار محاسبه می شود تا با یا داده شده مطابقت داشته باشد
مدت زمان شناخته شده صدا به اندازه محور X یا 100 در غیر این صورت. در صورت تسلیم شدن
پیوند با -d، این گزینه بر عرض طیف گرا تأثیر می گذارد.
در غیر این صورت، مدت زمان طیف نگاری را تحت تأثیر قرار می دهد. تعداد می تواند از 1 باشد
(رزولوشن زمان کم) تا 5000 (رزولوشن بالا) و نیازی نیست که باشد
عدد صحیح SoX ممکن است یک تعدیل جزئی در عدد داده شده برای انجام دهد
پردازش دلایل کمی سازی؛ اگر چنین است، SoX عدد واقعی را گزارش خواهد کرد
استفاده می شود (قابل مشاهده با گزینه جهانی SoX -V در حال اجرا است). همچنین ببینید -x و
-d.
-y تعداد اندازه محور Y را بر حسب پیکسل (در هر کانال) تنظیم می کند. این تعداد است
سطل های فرکانس مورد استفاده در تحلیل فوریه که طیف نگار را تولید می کند.
توجه داشته باشید اگر این عدد یک نباشد، تولید طیفنگار میتواند کند باشد
بیش از توان دو (مثلاً 129). به طور پیش فرض اندازه محور Y انتخاب شده است
به صورت خودکار (بسته به تعداد کانال ها). دیدن -Y برای جایگزین
روش تنظیم ارتفاع طیف گرا
-Y تعداد ارتفاع کل هدف طیف (ها) را تنظیم می کند. مقدار پیش فرض است
550 پیکسل. با استفاده از این گزینه (و به طور پیش فرض)، SoX یک ارتفاع را انتخاب می کند
برای کانال های طیف گرا منفرد که یک بیشتر از توان دو است، بنابراین
ارتفاع کل واقعی ممکن است کمتر از عدد داده شده باشد. با این حال، وجود دارد
همچنین حداقل ارتفاع در هر کانال است، بنابراین اگر کانال های زیادی وجود دارد،
ممکن است از تعداد فراتر رود دیدن -y برای روش جایگزین تنظیم طیف نگار
قد
-z تعداد محدوده محور Z (رنگی) به دسی بل، پیش فرض 120. این محدوده دینامیکی را تنظیم می کند
طیف نگاری که باشد -تعداد dBFS تا 0 dBFS. به ممکن است از 20 تا 180 باشد.
کاهش دامنه پویا به طور موثر "کنتراست" را افزایش می دهد
نمایش طیف نگار و بالعکس.
-Z تعداد حد بالایی محور Z را در dBFS تنظیم می کند. یک منفی تعداد به طور موثر
"روشنایی" صفحه نمایش طیفگرا را افزایش می دهد و بالعکس.
-q تعداد کمیت محور Z را تنظیم می کند، یعنی تعداد رنگ های مختلف (یا
شدت) که در آن مقادیر محور Z ارائه می شود. تعداد کمی (به عنوان مثال 4) خواهد شد
یک جلوه پوستر مانند ایجاد می کند که تشخیص باندهای بزرگی را آسان تر می کند
سطح مشابه اعداد کوچک نیز معمولا منجر به فایل های PNG کوچک می شوند. در
عدد داده شده تعداد رنگ هایی را که در محدوده محور Z استفاده می شود را مشخص می کند.
دو رنگ برای نمایش مقادیر خارج از محدوده رزرو شده است.
-w نام
پنجره: هان (پیش فرض)، هامینگ، بارتلت، مستطیل یا قیصر. در
طیف نگار با استفاده از تبدیل فوریه گسسته (DFT) تولید می شود.
الگوریتم یک پارامتر مهم برای این الگوریتم، انتخاب است
"عملکرد پنجره". به طور پیش فرض، SoX از پنجره Hann استفاده می کند که همه چیز خوبی دارد
ویژگی های فرکانس گرد و محدوده دینامیکی برای بهتر
وضوح فرکانس (اما محدوده دینامیکی کمتر)، یک پنجره Hamming را انتخاب کنید. برای
محدوده دینامیکی بالاتر (اما وضوح فرکانس ضعیف تر)، یک Kaiser را انتخاب کنید
پنجره پنجره های بارتلت و مستطیلی نیز موجود است.
-W تعداد پارامتر تنظیم پنجره از این می توان برای انجام تنظیمات کوچک استفاده کرد
شکل پنجره قیصر عدد مثبت (تا ده) آن را افزایش می دهد
محدوده دینامیکی، یک عدد منفی آن را کاهش می دهد.
-s اجازه همپوشانی شل پنجره های DFT را بدهید. این می تواند در برخی موارد افزایش یابد
وضوح تصویر و پایبندی بیشتر به -x ارزش، اما در
هزینه کمی از دست دادن طیفی.
-m یک طیف نگار تک رنگ ایجاد می کند (پیش فرض رنگی است).
-h یک پالت با رنگ بالا را انتخاب می کند - از نظر بصری کمتر از حالت پیش فرض
پالت رنگی، اما ممکن است تمایز سطوح مختلف را آسانتر کند.
اگر این گزینه همراه با -m، نتیجه ترکیبی خواهد بود
پالت تک رنگ/رنگ.
-p تعداد رنگ ها را در یک پالت رنگی یا ترکیبی تغییر دهید. در تعداد پارامتر، از
1 (پیش فرض) به 6، جایگشت را انتخاب می کند.
-l یک طیفنگار سازگار با چاپگر با پسزمینه روشن ایجاد میکند
پیش فرض دارای پس زمینه تیره است).
-a نمایش خطوط محور را سرکوب کنید. این گاهی اوقات برای کمک مفید است
برای تشخیص مصنوعات در لبه های طیف گرا.
-r طیف نگار خام: نمایش محورها و افسانه ها را سرکوب می کند.
-A یک مجموعه رنگ ثابت و جایگزین را انتخاب می کند. این فقط برای
سازگاری با طیف نگارهای تولید شده توسط بسته دیگری. نباید
معمولاً استفاده می شود زیرا مشکلاتی دارد، از جمله کمبود
تمایز در انتهای پایین که منجر به پوشاندن سطح پایین می شود
مصنوعات
-t متن
عنوان تصویر - متن را برای نمایش در بالای طیف نگار تنظیم کنید.
-c متن
نظر تصویر - متن را برای نمایش در زیر و سمت چپ تنظیم کنید (یا پاک کنید).
طیف نگار
-o متن
نام فایل PNG خروجی طیفگرام، «spectrogram.png» پیشفرض.
بیشتر گزینه های ارسال:
به منظور پردازش بخش کوچکتری از صدا بدون تأثیر سایر افکت ها یا
سیگنال خروجی (برخلاف زمانی که تر و تمیز اثر استفاده می شود)، گزینه های زیر ممکن است
استفاده شود
-d مدت
این گزینه رزولوشن محور X را طوری تنظیم می کند که صدا با داده شده باشد
مدت ([[HH:]MM:]SS) با عرض محور X انتخاب شده (یا پیشفرض) مطابقت دارد. برای
مثال،
sox input.mp3 output.wav -n طیفنگار -d 1:00 آمار
یک طیف نگاری ایجاد می کند که اولین دقیقه صدا را نشان می دهد، در حالی که
la آمار افکت به کل سیگنال صوتی اعمال می شود.
همچنین مشاهده کنید -X برای یک روش جایگزین برای تنظیم وضوح محور X.
-S زمان
طیف نگار را در نقطه داده شده در جریان صوتی شروع کنید. مثلا
sox input.aiff output.wav spectrogram -S 1:00
یک طیف نگاری ایجاد می کند که همه صدا را به جز دقیقه اول نشان می دهد
با این حال، فایل خروجی، کل جریان صوتی را دریافت می کند).
برای توانایی انجام پردازش آفلاین داده های طیفی، به بخش مراجعه کنید آمار
اثر.
سرعت عامل[c]
سرعت صدا را تنظیم کنید (بلندی و سرعت با هم). عامل یا نسبت است
سرعت جدید به سرعت قدیمی: بیش از 1 سرعت افزایش، کمتر از 1 کاهش سرعت،
یا اگر با حرف «c» ضمیمه شود، تعداد سنت (یعنی صدم یک
Semitone) که با آن گام (و سرعت) باید تنظیم شود: بزرگتر از 0
افزایش می یابد، کمتر از 0 کاهش می یابد.
از نظر فنی، اثر سرعت فقط اطلاعات نرخ نمونه را تغییر میدهد و از آن خارج میشود
خود نمونه ها دست نخورده در نرخ اثر به طور خودکار برای نمونه گیری مجدد فراخوانی می شود
به نرخ نمونه خروجی، با استفاده از کیفیت/سرعت پیشفرض آن. برای کیفیت بالاتر یا
سرعت بالاتر نمونه برداری مجدد، علاوه بر سرعت اثر، مشخص کنید نرخ اثر
با گزینه کیفیت مطلوب
همچنین ببینید خم, گامو زمان اثرات.
جفت کردن [-h|-t|-q] { موقعیت[,مازاد[,آزادی عمل]]}
بخش های صوتی را به هم متصل کنید. این افکت دو چیز را نسبت به صدای ساده ارائه می دهد
الحاق: یک محو شدن متقاطع (معمولاً کوتاه) در محل اتصال اعمال می شود و یک موج
مقایسه شباهت برای کمک به تعیین بهترین مکان برای ساختن انجام شده است
پیوستن.
یکی از گزینه ها -h, -t، یا -q ممکن است داده شود تا پاکت محو شده را به عنوان نیمه انتخاب کنید
موج کسینوس (پیش فرض)، مثلثی (معروف به خطی)، یا موج ربع کسینوس
بود.
نوع محو شدن سطح گذار
t افزایش ناگهانی ثابت مرتبط
h همبسته افزایش ثابت صاف
q توان ثابت ناهمبسته صاف
برای انجام اسپلایس ابتدا از تر و تمیز افکت برای انتخاب بخش های صوتی مورد نظر
به هم متصل شده. همانطور که در هنگام انجام اتصال نوار، انتهای بخش می شود
بر روی آن متصل شده باید با یک کوچک بریده شود مازاد (پیشفرض 0.005 ثانیه) صدا
پس از نقطه اتصال ایده آل ابتدای بخش صوتی برای اتصال
باید با همان کوتاه شود مازاد (قبل از نقطه اتصال ایده آل)، به اضافه یک
اضافی آزادی عمل (پیشفرض 0.005 ثانیه). سپس SoX باید با این دو فراخوانی شود
بخش های صوتی به عنوان فایل های ورودی و جفت کردن اثر داده شده با موقعیت در
که برای انجام اتصال - این طول اولین بخش صوتی است (از جمله
مازاد).
نمودار زیر از تشبیه نوار برای نشان دادن عملیات اتصال استفاده می کند.
این افکت برش های مورب را شبیه سازی می کند و دو قطعه را به هم متصل می کند:
طول 1 اضافی
-----------><--->
_________ : : _________________
\ : : :\ `
\ : : : \ `
\: : : \ `
* : : * - - *
\ : : :\ `
\ : : : \ `
_______________\: : : \_____`____
::::
<---> <----->
آزادی عمل بیش از حد
که در آن * نقاط اتصال را نشان می دهد.
به عنوان مثال، یک آهنگ طولانی با دو بیت شروع می شود که شروع می شود (مثلاً توسط
با استفاده از بازی فرمان با تر و تمیز (شروع) اثر) در زمان های 0:30.125 و
1:03.432. دستورات زیر آیه اول را قطع می کنند:
sox too-long.wav part1.wav trim 0 30.130
(5 میلی ثانیه بیش از حد، بعد از شروع آیه اول)
sox too-long.wav part2.wav trim 1:03.422
(5 میلیثانیه بیش از حد به اضافه 5 میلیثانیه آزادی عمل، قبل از شروع بیت دوم)
sox part1.wav part2.wav just-right.wav splice 30.130
برای مثال دیگر، دستور SoX
بازی "|sox -n -p synth 1 sin %1" "|sox -n -p synth 1 sin %3"
دو نت تولید می کند و می نوازد، اما یک کلیک بد در انتقال وجود دارد. را
کلیک را می توان با اتصال به جای الحاق صدا حذف کرد
ضمیمه کردن جفت کردن 1 به فرمان (در ابتدا و انتهای صدا کلیک کنید
می تواند توسط حذف شود ماقبل اثر اتصال با محو شدن q .01 2 .01).
به شرطی که محاسبات شما به اندازه کافی خوب باشد، می توان چند اتصال را با a انجام داد
تنها جفت کردن فراخوانی مثلا:
#!/ بن / شل
# صوتی کپی و جایگذاری کنید
# acpo infile کپی-شروع کپی-توقف چسباندن-بر-شروع outfile
# همه زمان ها در نمونه ها اندازه گیری می شود.
rate=`soxi -r "$1"`
e=`expr $rate '*' 5 / 1000` # استفاده از مازاد پیش فرض
l=$e # و آزادی عمل.
sox "$1" piece.wav trim `expr $2 - $e - $l`s \
`expr $3 - $2 + $e + $l + $e`s
sox "$1" part1.wav trim 0 `expr $4 + $e`s
sox "$1" part2.wav trim `expr $4 + $3 - $2 - $e - $l`s
sox part1.wav piece.wav part2.wav "$5" splice \
`expr $4 + $e`s \
`expr $4 + $e + $3 - $2 + $e + $l + $e`s
در اسکریپت پوسته Bourne بالا، از دو splice برای "کپی و چسباندن" صدا استفاده می شود.
* * * *
همچنین می توان از این افکت برای اجرای متقاطع فایدهای عمومی، به عنوان مثال برای اتصال استفاده کرد
دو آهنگ در این مورد، مازاد معمولاً چند ثانیه خواهد بود -q
گزینه معمولا داده می شود (برای انتخاب یک "قدرت برابر" متقاطع محو شدن)، و آزادی عمل
باید صفر باشد (که پیش فرض اگر -q داده شده است). مثلا اگر f1.wav و
f2.wav فایل های صوتی هستند که باید متقاطع محو شوند
sox f1.wav f2.wav out.wav splice -q $(soxi -D f1.wav),3
فایل هایی را که در آن نقطه بلندی برابر 3 ثانیه قبل از پایان است، متقاطع محو می کند
از f1.wav، یعنی طول کل کراس فاید 2 × 3 = 6 ثانیه است (توجه:
علامت $(...) پوسته POSIX است.
آمار [-s مقیاس] [- اسلحه] [- فرکانس] [-v] [-d]
نمایش اطلاعات آماری دامنه زمان و فرکانس در مورد صدا. سمعی
بدون تغییر از طریق زنجیره پردازش SoX منتقل می شود.
اطلاعات به جریان "خطای استاندارد" (stderr) خروجی می شود و می باشد
محاسبه شده، کجا n مدت زمان صدا در نمونه ها است، c تعداد است
کانال های صوتی، r نرخ نمونه صوتی است و xk نشان دهنده مقدار PCM (در
محدوده -1 تا +1 به طور پیش فرض) از هر نمونه متوالی در صدا، به شرح زیر است:
نمونه ها خواندن n×c
طول (ثانیه) n÷r
مقیاس by -های زیر را ببینید.
بیشترین دامنه حداکثر(xk) حداکثر مقدار نمونه
در صوت؛ معمولا
این یک نکته مثبت خواهد بود
عدد.
کمترین دامنه دقیقه(xk) حداقل مقدار نمونه
در صوت؛ معمولا
این یک منفی خواهد بود
عدد.
خط مقدم دامنه ½ دقیقه (xk)+½ حداکثر(xk)
منظور داشتن هنجار ¹/nΣ│xk│ میانگین از
قدر مطلق هر کدام
نمونه در فایل صوتی
منظور داشتن دامنه ¹/nΣxk میانگین هر کدام
نمونه در فایل صوتی اگر
این رقم غیر صفر است،
سپس آن را نشان می دهد
وجود DC
افست (که می تواند باشد
با استفاده از
dcshift اثر)
RMS دامنه √(¹/nΣxkXNUMX) سطح یک DC
سیگنالی که خواهد داشت
همان قدرتی که
قدرت متوسط صدا
بیشترین دلتا حداکثر (│xk-xk-1│)
کمترین دلتا دقیقه (│xk-xk-1│)
منظور داشتن دلتا ¹/n-1Σ│xk-xk-1│
RMS دلتا √(¹/n-1Σ(xk-xk-1)²)
خشن فرکانس در هرتز
حجم تنظیم پارامتر به حجم
اثری که ایجاد می کند
صدا به همان اندازه بلند
بدون
بریدن توجه: ببینید
بحث در مورد کلیپ کردن
در بالا به دلایلی
به ندرت ایده خوبی است
در واقع برای انجام این کار
توجه داشته باشید که اندازه گیری های دلتا برای صدای چند کاناله قابل اجرا نیستند.
La -s می توان از گزینه برای مقیاس بندی داده های ورودی بر اساس یک عامل معین استفاده کرد. پیشفرض
ارزش مقیاس 2147483647 است (یعنی حداکثر مقدار یک عدد صحیح امضا شده 32 بیتی).
جلوه های داخلی همیشه با داده های PCM طولانی امضا شده کار می کنند و بنابراین مقدار باید
به این واقعیت مربوط می شود.
La - اسلحه گزینه تمام مقادیر میانگین خروجی را به "ریشه میانگین مربع" تبدیل می کند
فرمت.
La -v گزینه فقط مقدار "تنظیم صدا" را نمایش می دهد.
La - فرکانس گزینه به جای محاسبه، طیف توان ورودی (4096 نقطه DFT) را محاسبه می کند
آمار ذکر شده در بالا این فقط باید با یک کانال صوتی استفاده شود
فایل.
La -d گزینه یک هگزا دیپ از صدای داده PCM امضا شده 32 بیتی در SoX را نشان می دهد
بافر داخلی این عمدتا برای کمک به ردیابی مشکلات اندین استفاده می شود
گاهی اوقات در نسخه های چند پلتفرمی SoX رخ می دهد.
همچنین ببینید آمار اثر.
آمار [-b بیت|-x بیت|-s مقیاس] [-w زمان پنجره]
نمایش اطلاعات آماری دامنه زمانی در مورد کانال های صوتی. صوتی است
بدون تغییر از طریق زنجیره پردازش SoX عبور کرد. آمار محاسبه شده و
برای هر کانال صوتی نمایش داده می شود و در صورت لزوم، یک رقم کلی نیز نمایش داده می شود
داده شده.
به عنوان مثال، برای یک فایل موسیقی استریو که به خوبی تسلط دارد:
به طور کلی چپ راست
DC offset 0.000803 -0.000391 0.000803
حداقل سطح -0.750977 -0.750977 -0.653412
حداکثر سطح 0.708801 0.708801 0.653534
Pk lev dB -2.49 -2.49 -3.69
RMS lev dB -19.41 -19.13 -19.71
RMS Pk dB -13.82 -13.82 -14.38
RMS Tr dB -85.25 -85.25 -82.66
ضریب تاج - 6.79 6.32
ضریب تخت 0.00 0.00 0.00
تعداد Pk 2 2 2
عمق بیت 16/16 16/16 16/16
تعداد نمونه 7.72 میلیون
طول s 174.973
مقیاس حداکثر 1.000000
ویندوز s 0.050
DC چاپ افست, دقیقه سطحو حداکثر سطح به طور پیش فرض در محدوده 1± نشان داده می شوند. اگر
-b (بیت) گزینه ها داده می شود، سپس این سه اندازه گیری به a مقیاس می شوند
عدد صحیح امضا شده با تعداد بیت معین. به عنوان مثال، برای 16 بیت، مقیاس
32768- تا 32767+ خواهد بود. در -x گزینه به همان صورت عمل می کند -b غیر از آن
مقادیر عدد صحیح امضا شده به صورت هگزادسیمال نمایش داده می شوند. در -s گزینه مقیاس می کند
سه اندازه گیری توسط یک عدد ممیز شناور معین.
Pk لو dB و RMS لو dB پیک استاندارد و سطح RMS با dBFS اندازه گیری می شوند.
RMS Pk dB و RMS Tr dB مقادیر اوج و پایین برای سطح RMS هستند که بیش از a اندازه گیری می شوند
پنجره کوتاه (پیش فرض 50 میلی ثانیه).
تاج عامل نسبت استاندارد پیک به سطح RMS است (توجه داشته باشید که بر حسب دسی بل نیست).
صاف عامل معیاری برای مسطح بودن است (یعنی نمونه های متوالی با همان
مقدار) سیگنال در سطوح اوج خود (یعنی هر دو دقیقه سطح، یا حداکثر سطح).
Pk تعداد دفعات مشاهده تعداد دفعات (نه تعداد نمونه ها) است که سیگنال می دهد
به دست آورد دقیقه سطح، یا حداکثر سطح.
دست راست عمق بیت شکل تعریف استاندارد عمق بیت است یعنی بیت ها
کمتر از عدد داده شده، روی صفر ثابت می شوند. شکل سمت چپ است
تعداد مهم ترین بیت هایی که روی صفر (یا یک برای منفی) ثابت شده اند
اعداد) از شکل سمت راست کم می شود (عدد تفریق شده مستقیم است
مربوط به Pk لو dB).
برای صدای چند کاناله، یک رقم کلی برای هر یک از اندازهگیریهای بالا است
ارقام کانال به شرح زیر ارائه و برگرفته شده است: DC چاپ افست: بیشترین
اندازه؛ حداکثر سطح, Pk لو dB, RMS Pk dB, عمق بیت: بیشترین؛ دقیقه سطح,
RMS Tr dB: کمترین؛ RMS لو dB, صاف عامل, Pk تعداد دفعات مشاهده: میانگین؛ تاج عامل: نه
مناسب.
طول s مدت زمان صدا بر حسب ثانیه است و به نمونه ها برابر است با
نرخ نمونه ضرب شده در طول. مقیاس حداکثر مقیاس بندی اعمال شده برای اولین است
سه اندازه گیری؛ به طور خاص، این حداکثر مقداری است که می تواند اعمال شود
حداکثر سطح. پنجره s طول پنجره ای است که برای پیک و پایین RMS استفاده می شود
اندازه گیری.
همچنین ببینید آمار اثر.
مبادله تعویض کانال های استریو همچنین ببینید ریمیکس برای اثری که اجازه کانال دلخواه را می دهد
انتخاب و سفارش (و اختلاط).
بسط عامل [پنجره محو شدن تغییر محو شدن]
مدت زمان صدا را تغییر دهید (اما نه زیر و بم آن). این اثر به طور کلی معادل است
به زمان اثر با (عامل وارونه و) جستجو کردن روی صفر تنظیم کنید، بنابراین به طور کلی،
نتایج آن نسبتا ضعیف است. حفظ می شود زیرا گاهی اوقات می تواند عملکرد بهتری داشته باشد
زمان برای کوچک عاملs.
عامل از کشش: > 1 طول، <1 کوتاه مدت. پنجره اندازه بر حسب ms می باشد
پیش فرض 20 میلی ثانیه است. در محو شدن گزینه، می تواند 'lin' باشد. تغییر نسبت، در [0 1]. پیش فرض
بستگی به عامل کشش دارد 1 برای کوتاه کردن، 0.8 برای بلند کردن. در محو شدن نسبت، در [0
0.5]. مقدار پیش فرض محو شدن بستگی به عامل و تغییر.
همچنین ببینید زمان اثر.
مصنوعی [-j KEY] [-n] [لن [خاموش [ph [p1 [p2 [p3]]]]]] {[نوع] [ترکیب]
[[%]فرق[k][:|+|/|-[%]فرکانس 2[k]]] [خاموش [ph [p1 [p2 [p3]]]]]}
از این افکت می توان برای تولید آهنگ های صوتی با فرکانس ثابت یا جارو شده استفاده کرد
اشکال موج های مختلف، یا ایجاد نویز باند وسیع از «رنگ های» مختلف. چندگانه
جلوه های مصنوعی را می توان برای تولید شکل موج های پیچیده تر آبشاری کرد. در هر مرحله آن را
این امکان وجود دارد که انتخاب کنید آیا شکل موج تولید شده با یا مخلوط می شود
بر روی خروجی مرحله قبل مدوله شده است. صدا برای هر کانال در یک
فایل صوتی چند کاناله را می توان به طور مستقل سنتز کرد.
اگرچه از این افکت برای تولید صدا استفاده می شود، یک فایل ورودی هنوز باید داده شود.
که از ویژگی های آن برای تنظیم طول صوتی سنتز شده استفاده می شود
تعداد کانال ها و نرخ نمونه برداری؛ با این حال، از آنجایی که صدای فایل ورودی است
به طور معمول مورد نیاز نیست، یک "فایل تهی" (با نام خاص -n) اغلب داده می شود
در عوض (و طول مشخص شده به عنوان پارامتر به مصنوعی یا توسط دیگری داده شده است
اثری که می تواند طول مرتبطی داشته باشد).
برای مثال، فایل صوتی 3 ثانیهای با فرکانس 48 کیلوهرتز حاوی الف را تولید میکند
موج سینوسی از 300 تا 3300 هرتز:
sox -n output.wav synth 3 sine 300-3300
و این یک نسخه 8 کیلوهرتز تولید می کند:
خروجی sox -r 8000 -n.wav synth 3 sine 300-3300
با تعیین مجموعه ای از پارامترهای نشان داده شده می توان چندین کانال را سنتز کرد
بین بریس ها چندین بار؛ زیر صدای جاروب شده را در سمت چپ قرار می دهد
کانال و نویز قهوه ای را در سمت راست اضافه می کند:
sox -n output.wav synth 3 sine 300-3300 brownnoise
مثال زیر نشان میدهد که چگونه میتوان دو افکت مصنوعی را برای ایجاد یک افکت بیشتر آبشاری کرد
شکل موج پیچیده:
play -n synth 0.5 sine 200-500 synth 0.5 sine fmod 700-100
فرکانسها را میتوان در نماد یادداشت «علمی» یا با پیشوند «%» نشان داد.
کاراکتر، بهعنوان تعدادی نیمتون نسبت به «A وسط» (440 هرتز). مثلا،
میتوان از موارد زیر برای کمک به کوک کردن سیم «E» پایین گیتار استفاده کرد:
play -n synth 4 pluck %29
یا با یک حلقه (پوسته بورن)، کل گیتار:
برای n در E2 A2 D3 G3 B3 E4; انجام دادن
play -n synth 4 pluck $n تکرار 2; انجام شده
مشاهده تاخیر افکت (بالا) و ارجاع به «نمونههای برنامهنویسی SoX» (زیر)
برای اطلاعات بیشتر مصنوعی مثال ها.
NB این افکت صدا را با حداکثر ولوم (0dBFS) تولید میکند، به این معنی که وجود دارد
در هنگام استفاده از صوت متعاقبا، شانس زیادی برای کلیپ کردن وجود دارد، بنابراین در بسیاری از موارد،
شما می خواهید این اثر را با سود اثر برای جلوگیری از این
اتفاق می افتد. (همچنین ببینید کلیپ کردن در بالا.) توجه داشته باشید که به طور پیش فرض، مصنوعی اثر
شامل عملکرد سود -h (نگاه کنید به سود اثر برای جزئیات)؛
مصنوعی's -n ممکن است گزینه ای برای غیرفعال کردن این رفتار داده شود.
شرح مفصل هر کدام مصنوعی پارامتر به شرح زیر است:
لن طول صدا برای سنتز است که به صورت زمان یا تعداد بیان می شود
نمونه ها؛ 0 = طول ورودی، پیش فرض = 0.
قالب برای تعیین طول در زمان hh:mm:ss.frac است. فرمت برای
تعیین تعداد نمونه تعداد نمونه هایی است که حرف 's' به آن اضافه شده است
آن است.
نوع یکی از سینوس، مربع، مثلث، دندان اره، ذوزنقه، exp، [سفید] نویز است،
tpdfnoise pinknoise, brownnoise, pluck; پیش فرض = سینوسی.
ترکیب یکی از create، mix، amod (مدولاسیون دامنه)، fmod (فرکانس) است
مدولاسیون)؛ پیش فرض = ایجاد
فرق/فرکانس 2 فرکانسهای ابتدای/پایان سنتز بر حسب هرتز یا اگر
قبل از "%"، نیم صداهای نسبت به A (440 هرتز). در عوض، "علمی"
ممکن است از نماد یادداشت (به عنوان مثال E2) استفاده شود. فرکانس پیش فرض 440 هرتز است. به صورت پیش فرض،
تنظیمی که با نمادهای نت استفاده میشود، "خلق و خوی برابر" است. را -j KEY انتخاب
"فقط لحن" را انتخاب می کند، جایی که KEY عدد صحیحی از نیم صداها نسبت به
A (به عنوان مثال، 9- یا 3 کلید C را انتخاب می کند)، یا یک یادداشت با نماد علمی.
If فرکانس 2 داده می شود، سپس لن همچنین باید داده شده باشد و لحن تولید شده خواهد بود
بین فرکانس های داده شده جارو شود. دو فرکانس داده شده باید باشد
با یکی از کاراکترهای «:»، «+»، «/» یا «-» از هم جدا شده است. این کاراکتر استفاده می شود
برای تعیین تابع Sweep به صورت زیر:
: خطی: آهنگ با تعداد ثابتی هرتز در ثانیه تغییر می کند.
+ مربع: یک تابع مرتبه دوم برای تغییر آهنگ استفاده می شود.
/ نمایی: لحن با تعداد ثابتی نیمتون در ثانیه تغییر میکند.
- نمایی: به صورت «/»، اما فاز اولیه همیشه صفر، و پله شده (کمتر
صاف) تغییرات فرکانس.
برای نویز استفاده نمی شود.
خاموش بایاس (DC-offset) سیگنال بر حسب درصد است. پیش فرض = 0.
ph تغییر فاز در درصد 1 سیکل است. پیش فرض = 0. برای نویز استفاده نمی شود.
p1 درصدی از هر چرخه است که «روشن» (مربع)، یا «بالا» (مثلث،
exp, trapezium)؛ default=50 (مربع، مثلث، exp)، پیش فرض=10 (ذوزنقه)، یا
حفظ (چیدن)؛ پیش فرض = 40.
p2 (ذوزنقه): درصد هر چرخه ای که در آن "سقوط" شروع می شود.
پیش فرض = 50. exp: دامنه در مضرب 2dB. پیش فرض = 50، یا tone-1 (Pluck);
پیش فرض = 20.
p3 (ذوزنقه): درصد هر چرخه ای که در آن «سقوط» به پایان می رسد.
پیشفرض=60، یا tone-2 (Pluck); پیش فرض = 90.
زمان [-q] [-m|-s|-l] عامل [بخش [جستجو کردن [همپوشانی]]]
سرعت پخش صدا را تغییر دهید اما سرعت آن را تغییر دهید. این افکت از WSOLA استفاده می کند
الگوریتم صدا به بخش هایی تقسیم می شود که سپس در زمان جابجا می شوند
دامنه و در نقاطی که شکل موج آنها بیشتر است همپوشانی دارند (محو متقاطع).
مشابه با اندازه گیری «حداقل مربع» تعیین می شود.
به طور پیش فرض، از جستجوهای خطی برای یافتن بهترین نقاط همپوشانی استفاده می شود. اگر
اختیاری -q پارامتر داده شده است، به جای آن از جستجوهای درختی استفاده می شود. این باعث می شود
اثر سریعتر کار می کند، اما نتیجه ممکن است به نظر خوب نباشد. با این حال، اگر شما
باید سرعت پردازش را بهبود بخشد، این به طور کلی کیفیت صدا را کمتر کاهش می دهد
از کاهش مقادیر جستجو یا همپوشانی.
La -m گزینه برای بهینه سازی مقادیر پیش فرض بخش، جستجو و همپوشانی برای استفاده می شود
پردازش موسیقی
La -s گزینه برای بهینه سازی مقادیر پیش فرض بخش، جستجو و همپوشانی برای استفاده می شود
پردازش گفتار
La -l گزینه برای بهینه سازی مقادیر پیش فرض بخش، جستجو و همپوشانی برای استفاده می شود
پردازش «خطی» که تمایل به ایجاد اعوجاج محسوستری دارد، اما ممکن است
زمانی مفید است که فاکتور نزدیک به 1 باشد.
اگر -m، -s، یا -l مشخص شده باشد، مقدار پیش فرض قطعه محاسبه خواهد شد
بر اساس فاکتور، در حالی که مقادیر جستجو و همپوشانی پیشفرض بر اساس بخش هستند. هر
مقادیری که ارائه می کنید همچنان این مقادیر پیش فرض را نادیده می گیرند.
عامل نسبت سرعت جدید به سرعت قدیمی را می دهد، بنابراین به عنوان مثال 1.1 سرعت را افزایش می دهد
سرعت 10٪ و 0.9 آن را 10٪ کاهش می دهد.
اختیاری بخش پارامتر اندازه بخش الگوریتم را انتخاب می کند
میلی ثانیه اگر هیچ پرچم دیگری مشخص نشده باشد، مقدار پیش فرض 82 است و می باشد
معمولاً برای ایجاد تغییرات کوچک در سرعت موسیقی مناسب است. برای تغییرات بزرگتر
(به عنوان مثال ضریب 2)، 41 میلی ثانیه ممکن است نتیجه بهتری ارائه دهد. پرچم های -m، -s و -l
باعث می شود پیش فرض بخش به طور خودکار بر اساس فاکتور تنظیم شود. برای
به عنوان مثال استفاده از -s (برای گفتار) با سرعت 1.25 یک بخش پیش فرض را محاسبه می کند
مقدار 32
اختیاری جستجو کردن پارامتر طول صدا را بر حسب میلی ثانیه می دهد که طول آن طول می کشد
الگوریتم نقاط همپوشانی را جستجو می کند. اگر هیچ پرچم دیگری مشخص نشده باشد،
مقدار پیش فرض 14.68 است. مقادیر بزرگتر از زمان پردازش بیشتری استفاده می کنند و ممکن است یا نه
نتایج بهتری تولید کند. حداکثر عملی نصف مقدار بخش است. جستجو کردن
را می توان به کاهش زمان پردازش با خطر کاهش کیفیت خروجی کاهش داد. در
پرچم های -m، -s و -l باعث می شود که پیش فرض جستجو به طور خودکار تنظیم شود
بر اساس بخش
اختیاری همپوشانی پارامتر طول همپوشانی قطعه را بر حسب میلی ثانیه می دهد.
مقدار پیشفرض 12 است، اما پرچمهای -m، -s یا -l بهطور خودکار همپوشانی را بر اساس تنظیم میکنند.
اندازه بخش افزایش همپوشانی زمان پردازش را افزایش می دهد و ممکن است افزایش یابد
کیفیت حداکثر عملی برای همپوشانی، مقدار جستجو، با همپوشانی است
معمولاً (حداقل) کمی کوچکتر از جستجو.
همچنین مشاهده کنید سرعت برای اثری که سرعت و زیر و بم را با هم تغییر می دهد، گام و خم
برای افکت هایی که فقط گام را تغییر می دهند و بسط برای اثری که سرعت را تغییر می دهد
با استفاده از یک الگوریتم متفاوت
سه برابر کردن سود [فرکانس[k] [عرض[s|h|k|o|q]]]
افکت کنترل تون سه برابری را اعمال کنید. توضیحات را ببینید باس اثر برای
جزئیات.
ترمولو سرعت [عمق]
افکت ترمولو (مدولاسیون دامنه فرکانس پایین) را روی صدا اعمال کنید. در
فرکانس لرزش در هرتز توسط سرعت، و عمق به صورت درصد توسط عمق
(پیش فرض 40).
تر و تمیز {[=|-]موقعیت}
بخش هایی از صدا را قطع می کند. هر تعداد از موقعیتs ممکن است داده شود. صوتی نیست
تا اول به خروجی ارسال می شود موقعیت رسیده است. سپس اثر متناوب می شود
بین کپی کردن و حذف صدا در هر کدام موقعیت.
اگر یک موقعیت قبل از علامت مساوی یا منهای است، نسبت به تفسیر می شود
به ترتیب ابتدا یا انتهای صدا. (طول صدا باید باشد
شناخته شده برای مکان های نسبی پایانی برای کار.) در غیر این صورت، آن را جبران در نظر گرفته
از آخرین موقعیت، یا از شروع صدا برای پارامتر اول. استفاده كردن
مقدار 0 برای اولین موقعیت پارامتر اجازه می دهد تا از ابتدا کپی کنید
صدا
همه پارامترها را می توان با استفاده از مقدار زمان یا شمارش دقیق مشخص کرد
نمونه ها. فرمت تعیین طول در زمان hh:mm:ss.frac است. یک ارزش از
1:30.5 برای پارامتر اول تا 1 دقیقه و سی و ½ ثانیه شروع نمی شود
به صوت فرمت تعیین تعداد نمونه، تعداد نمونه است
با حرف "s" که به آن ضمیمه شده است. مقدار 8000s برای اولین پارامتر خواهد بود
صبر کنید تا 8000 نمونه قبل از شروع پردازش صدا خوانده شود.
به عنوان مثال،
برش داخلی فایل سوکس 0 10
در حالی که ده ثانیه اول را کپی می کند
پخش تریم فایل 12:34 = 15:00 -2:00
از 12 دقیقه و 34 ثانیه در صدا تا 15 دقیقه پس از صدا پخش می شود
(یعنی 2 دقیقه و 26 ثانیه طول می کشد)، سپس دو دقیقه قبل از بازی، بازی را از سر بگیرید
پایان صدا
نمونه بالا [عامل]
سیگنال را با یک ضریب صحیح نمونه برداری کنید: عامل-1 نمونه با ارزش صفر درج شده است
بین هر جفت نمونه ورودی در نتیجه، طیف اصلی است
در فضای فرکانس جدید (الایاسینگ) تکثیر شده و ضعیف شده است. این
میرایی را می توان با اضافه کردن جبران کرد حجم عامل بعد از هر چیز دیگری
در حال پردازش. افکت upsamp معمولا در ترکیب با فیلتر کردن استفاده می شود
اثرات.
برای یک اثر کلی نمونه برداری مجدد با آنتی آلیاسینگ، نگاه کنید به نرخ. همچنین ببینید نمونه پایین.
واد [گزینه های]
آشکارساز فعالیت صوتی تلاش برای کوتاه کردن سکوت و صداهای پس زمینه آرام از
انتهای ضبط های گفتار (با وضوح نسبتاً بالا یعنی 16 بیتی، 44-48 کیلوهرتز).
این الگوریتم در حال حاضر از یک اندازه گیری ساده قدرت مغزی برای تشخیص صدا استفاده می کند.
بنابراین ممکن است فریب چیزهای دیگر، به ویژه موسیقی را بخورید. اثر را می توان فقط از
جلوی صدا، بنابراین به منظور برش از پشت، معکوس اثر باید
نیز استفاده شود. به عنوان مثال
پخش سخنرانی.wav norm vad
برای کوتاه کردن از جلو،
پخش سخنرانی.wav هنجار معکوس واد معکوس
برای کوتاه کردن از پشت، و
پخش سخنرانی.wav هنجار واد معکوس واد معکوس
برای بریدن از هر دو انتها استفاده از هنجار اثر توصیه می شود، اما به یاد داشته باشید
که نه معکوس نه هنجار برای استفاده با صدای پخش شده مناسب است.
گزینه های ارسال:
مقادیر پیش فرض در پرانتز نشان داده شده است.
-t تعداد (7)
سطح اندازه گیری مورد استفاده برای شروع تشخیص فعالیت. این ممکن است نیاز داشته باشد
بسته به سطح نویز، سطح سیگنال و موارد دیگر تغییر می کند
ویژگی های صدای ورودی
-T تعداد (0.25)
ثابت زمانی (بر حسب ثانیه) که برای کمک به نادیده گرفتن انفجارهای کوتاه صدا استفاده می شود.
-s تعداد (1)
میزان صدا (در ثانیه) برای جستجوی رگبارهای ساکتتر/کوتاهتر
صوتی که باید قبل از نقطه ماشه شناسایی شده درج شود.
-g تعداد (0.25)
فاصله مجاز (بر حسب ثانیه) بین صداهای آرامتر/کوتاهتر برای گنجاندن
قبل از نقطه ماشه شناسایی شده
-p تعداد (0)
میزان صدا (در ثانیه) برای حفظ قبل از نقطه ماشه و
هر انفجار ساکتتر/کوتاهتری پیدا شد.
بیشتر گزینه های ارسال:
اینها امکان تنظیم دقیق پارامترهای داخلی الگوریتم را فراهم می کند.
-b تعداد الگوریتم (داخلی) به ترتیب از تخمین/کاهش نویز تطبیقی استفاده می کند
برای تشخیص شروع صدای مورد نظر. این گزینه زمان را برای
برآورد اولیه نویز
-N تعداد ثابت زمانی که توسط برآوردگر نویز تطبیقی برای زمانی که سطح نویز استفاده می شود
در حال افزایش است.
-n تعداد ثابت زمانی که توسط برآوردگر نویز تطبیقی برای زمانی که سطح نویز استفاده می شود
در حال کاهش است.
-r تعداد مقدار کاهش نویز برای استفاده در الگوریتم تشخیص (به عنوان مثال 0، 0.5،
...).
-f تعداد فرکانس پردازش/اندازه گیری الگوریتم.
-m تعداد مدت زمان اندازه گیری؛ به طور پیش فرض، دو برابر دوره اندازه گیری؛ یعنی با
همپوشانی
-M تعداد ثابت زمانی برای صاف کردن اندازهگیریهای طیفی استفاده میشود.
-h تعداد فرکانس "دیوار آجری" فیلتر بالاگذر اعمال شده در ورودی به
الگوریتم آشکارساز
-l تعداد فرکانس "آجر دیوار" فیلتر پایین گذر اعمال شده در ورودی به
الگوریتم آشکارساز
-H تعداد فرکانس "دیوار آجری" بالابر بالاگذر مورد استفاده در الگوریتم آشکارساز.
-L تعداد فرکانس "دیوار آجری" بالابر پایین گذر مورد استفاده در الگوریتم آشکارساز.
همچنین ببینید سکوت اثر.
حجم سود [نوع [محدود کننده]]
یک تقویت یا تضعیف سیگنال صوتی را اعمال کنید. بر خلاف -v انتخاب
(که برای متعادل کردن چندین فایل ورودی هنگام ورود به جلوه های SoX استفاده می شود
زنجیره پردازش)، حجم یک افکت مانند هر اثر دیگری است که می تواند در هر جایی اعمال شود و
در صورت لزوم چندین بار در طول زنجیره پردازش.
مقدار تغییر حجم توسط داده می شود سود که تفسیر می شود، با توجه به
داده شده نوع، به شرح زیر است: اگر نوع is دامنه (یا حذف شده است)، سپس سود است
نسبت دامنه (یعنی ولتاژ یا خطی)، اگر قدرت، سپس یک توان (یعنی وات یا
نسبت ولتاژ به مربع) و اگر dB، سپس یک تغییر توان در دسی بل.
چه زمانی نوع is دامنه or قدرت، یک سود از 1 حجم را بدون تغییر باقی می گذارد، کمتر از
1 آن را کاهش می دهد و بزرگتر از 1 آن را افزایش می دهد. یک منفی سود صدا را معکوس می کند
سیگنال علاوه بر تنظیم صدای آن.
چه زمانی نوع is dB، یک سود از 0 حجم را بدون تغییر می گذارد، کمتر از 0 آن را کاهش می دهد،
و بزرگتر از 0 آن را افزایش می دهد.
برای بحث مفصل در مورد ولتاژ الکتریکی (و بنابراین سیگنال صوتی) به [4] مراجعه کنید
و نسبت های قدرت
مراقب باشید کلیپ کردن هنگام افزایش حجم
La سود و نوع در صورت تمایل می توان پارامترها را به هم متصل کرد، به عنوان مثال حجم 10dB.
اختیاری است محدود کننده مقدار را می توان مشخص کرد و باید مقداری بسیار کمتر از آن باشد
1 (به عنوان مثال 0.05 یا 0.02) و فقط در قله ها برای جلوگیری از بریدن استفاده می شود. نه
تعیین این پارامتر باعث می شود از هیچ محدود کننده ای استفاده نشود. در حالت کلامی، این
افکت درصدی از صدایی که باید محدود شود را نمایش می دهد.
همچنین مشاهده کنید سود برای افکت تغییر حجم با قابلیت های مختلف و شرکت
برای یک اثر فشرده سازی / گسترش / محدود کننده برد دینامیکی.
منسوخ اثرات
افکتهای زیر تغییر نام دادهاند یا عملکرد آنها در دیگری گنجانده شده است
اثر آنها در این نسخه از SoX به کار خود ادامه می دهند اما ممکن است در آینده حذف شوند.
مخلوط کن [ -l|-r|-f|-b|-1|-2|-3|-4|n{,n} ]
تعداد کانالهای صوتی را با میکس کردن یا انتخاب کانالها کاهش دهید یا افزایش دهید
تعداد کانال ها با کپی کردن کانال ها توجه: این اثر بر روی
سمعی کانال در زنجیره پردازش اثرات SoX. نباید آن را اشتباه گرفت
با -m گزینه جهانی (که در آن چندگانه است فایل ها قبل از ورود با هم ترکیب می شوند
زنجیره اثرات).
هنگام کاهش تعداد کانال ها می توان از آن استفاده کرد -l, -r, -f, -b, -1,
-2, -3, -4، گزینه هایی برای انتخاب فقط کانال(های) چپ، راست، جلو، پشت یا
کانال خاص برای خروجی به جای میانگین گیری کانال ها. در -lو -r
گزینهها میانگینگیری را در فایلهای چهار کاناله انجام میدهند، بنابراین کانال دقیق را انتخاب کنید
جلوگیری از این
La مخلوط کن افکت را می توان با حداکثر 16 عدد که با کاما از هم جدا شده اند فراخوانی کرد.
که نسبت (0 = 0% و 1 = 100%) از هر کانال ورودی را مشخص می کند که به
در هر کانال خروجی مخلوط شود. در حالت دو کاناله، 4 عدد داده می شود: l →
l، l → r، r → l، و r → r به ترتیب. در حالت چهار کانال، 4 اول
اعداد نسبت های کانال خروجی جلوی چپ را به شرح زیر نشان می دهد: lf →
lf، rf → lf، lb → lf، و rb → rf. 4 بعدی خروجی سمت راست را در
به همین ترتیب، سپس دفاع چپ و دفاع راست.
همچنین می توان از 16 شماره برای گسترش یا کاهش تعداد کانال استفاده کرد.
فقط برای کانال های استفاده نشده 0 را مشخص کنید.
در نهایت، ترکیب کاهش یافته معینی از اعداد را می توان به طور مشخص مشخص کرد
ترکیب کانال ورودی/خروجی
In Ch خارج Ch به نگاشت
2 1 2 l → l، r → l
2 2 1 تعادل را تنظیم کنید
4 1 4 lf → l، rf → l، lb → l، rb → l
4 2 2 lf → l&rf → r، lb → l&rb → r
4 4 1 تعادل را تنظیم کنید
4 4 2 تعادل جلو، تعادل عقب
این اثر جایگزین شده است ریمیکس اثری که به هر تعداد از
کانال ها
عیب یابی
وضعیت خروج بدون خطا 0 است، اگر مشکلی در پارامترهای خط فرمان وجود دارد، 1 است.
یا 2 اگر در حین پردازش فایل خطایی رخ دهد.
با استفاده از خدمات onworks.net از بازی آنلاین استفاده کنید