これは、Ubuntu Online、Fedora Online、Windows オンライン エミュレーター、または MAC OS オンライン エミュレーターなどの複数の無料オンライン ワークステーションの XNUMX つを使用して、OnWorks 無料ホスティング プロバイダーで実行できるコマンド adintool です。
プログラム:
NAME
アドインツール
- オーディオストリームを録音/分割/送信/受信するツール
SYNOPSIS
アドインツール {-の 入力デバイス} {-外 出力開発} [オプション...]
DESCRIPTION
アドインツール 音声入力を分析し、沈黙をスキップする音声セグメントを見つけて、
さまざまな方法でセグメントを検出します。 ゼロクロス番号に基づいて音声検出を実行します
およびパワー(レベル)を検出し、検出された部分をファイルまたは他の出力デバイスに記録します
続けて。
アドインツール 様々な機能を備えたadinrecの上位版です。 サポートされている入力デバイスは次のとおりです。
マイク入力、音声ファイル、標準 tty 入力、およびネットワーク ソケット (adin-net と呼ばれる)
サーバーモード)。 Juliusプラグインも利用可能です。 検出された音声セグメントは次の場所に保存されます。
出力デバイス: 音声ファイル、標準 tty 出力、およびネットワーク ソケット (adin-net と呼ばれる)
クライアントモード)。 たとえば、受信音声をセグメントに分割して送信できます。
認められるユリウス。
出力フォーマットはWAV、16bit(signed short)、モノラルです。 ファイルがすでに存在する場合は、
オーバーライドされました。
OPTIONS
Julius のすべてのオプションを設定できます。 オーディオ入力関連のオプションのみが処理され、その他は処理されません。
黙ってスキップした。 以下はオプションのリストです。
アドインツール 特定の オプション
-周波数 Hz
サンプリングレートをHz単位で設定します。 (デフォルト: 16,000)
-に 入力デバイス
オーディオ入力デバイス。 マイク入力経由でキャプチャする場合は「mic」、オーディオ ファイル入力の場合は「file」、
「stdin」は標準入力から生データを読み取ります。 ファイル入力の場合、ファイル名プロンプトが表示されます。
起動後に表示されます。 「adinnet」を使用して作成します アドインツール 「adinnetサーバー」として受信
ネットワークソケット経由でクライアントからのデータ。 デフォルトのポート番号は 5530 ですが、変更可能です
オプションで「-インポート".
または、入力デバイスを「」で設定することもできます。-入力" オプション。この場合、使用できます
プラグイン入力。
-でる 出力開発
音声出力デバイスはデータを保存します。 ファイルに保存するには「file」を指定します。出力はそこに保存されます。
ファイル名は「」で指定する必要があります-ファイル名"。標準出力には "stdout" を使用します。"adinnet" は
make アドインツール adinnet クライアントとなり、tcp/ip 経由で音声データをサーバーに送信します。
ソケット。 「adinnet」出力を使用する場合、データを送信するサーバー名を指定する必要があります
沿って "-サーバ"。デフォルトのポート番号は 5530 ですが、これは "-港"オプション。
-インポート NUM
adintoolがadinnetサーバーとなってデータを受信する場合(-in adinnet)、ポート番号を設定します
聞くこと。 (デフォルト: 5530)
-サーバ [ホスト] [,ホスト...]
adinnetサーバーに出力する場合(-out adinnet)、ホスト名を設定します。 に送信できます
複数のホストを指定するには、次のようにホスト名をカンマ区切りのリストとして指定します。
「ホスト1、ホスト2、ホスト3」。
-港 [数字] [,数字...]
adintool が adinnet サーバーにデータを送信するとき (-out adinnet)、ポート番号を次のように設定します。
接続。 (デフォルト: 5530) 複数のサーバーの場合、すべてのサーバーのポート番号を指定します。
「5530,5530,5531」のように。
-ファイル名 file
ファイルに出力する場合(-でる file)、出力ファイル名を設定します。 実際のファイル名は次のようになります。
"としてファイル.0000.wav"、"ファイル.0001.wav" など、XNUMX 桁の数字が増加します。
検出された音声セグメントとして。 初期数値はデフォルトで 0 に設定されます。
「によって変えられる」-開始ID「オプション。」を使用する場合-ワンショット" 最初のものだけを保存するオプション
セグメントの場合、入力は「」として保存されます。file".
-開始ID 数
ファイル出力時に初期ファイル番号を設定します。 (デフォルト: 0)
-ワンショット
最初のスピーチセグメントの終了後に終了します。
-ノーズセグメント
入力に対して音声検出を実行せず、すべての入力を単一の有効な入力として扱います。
セグメント。
-生
RAW ファイル(ヘッダーなし)として出力します。
-自動一時停止
adinnetサーバーに出力すると、 アドインツール スピーチが終わるたびに一時停止状態に入る
セグメント。 宛先の adinnet サーバーが再開信号を送信すると、再起動します。
-ルーズシンク
複数のadinnetサーバーに出力した場合、再起動時に厳密な同期を行わないようにしました。
デフォルトでは、 アドインツール 一時停止状態に入ったため、再開するまで再起動されません
コマンドはすべてのサーバーから受信されます。 このオプションにより、少なくとも XNUMX つの再起動が可能になります
再起動コマンドが到着しました。
-巻き戻し ミリ秒
入力がライブ マイク デバイスで、継続的な入力があった場合
瞬間 アドインツール 再開すると、指定されたミリ秒単位でバックトラックの記録が開始されます。
に関する ジュリアス オプション
-入力 {mic|rawfile|adinnet|stdin|netaudio|esd|alsa|oss}
音声入力ソースを選択します。 波形ファイルには「file」または「rawfile」を指定します。 ファイル上
を入力すると、ユーザーは標準入力からファイル名を入力するように求められます。
「mic」はデフォルトのライブマイクデバイスから音声入力を取得することを意味し、「adinnet」はそれを意味します
adinnet クライアントから tcpip ネットワーク経由で波形データを受信します。 「ネットオーディオ」は
DatLink/NetAudio 入力、および「stdin」は標準入力からのデータ入力を意味します。
Linux では、alsa、oss、esd を指定することで実行時に API を選択できます。
-chunk_size サンプル
サンプル数で表したオーディオフラグメントサイズ。 (デフォルト: 1000)
-lv スレス
音声入力検出のレベルしきい値。 値の範囲は 0 ~ 32767 である必要があります。
(デフォルト:2000)
-zc スレス
XNUMX 秒あたりのゼロクロスしきい値。 レベルしきい値を超える入力のみ (-lv)
カウントされます。 (デフォルト: 60)
-ヘッドマージン ミリ秒
音声セグメントの開始時の無音マージン (ミリ秒単位)。 (デフォルト: 300)
-テールマージン ミリ秒
音声セグメントの終わりの無音マージン (ミリ秒単位)。 (デフォルト: 400)
-z平均
このオプションにより、DC オフセットの除去が有効になります。
-smpFreq Hz
サンプリングレートをHz単位で設定します。 (デフォルト: 16,000)
-48
入力を 48kHz サンプリングで記録し、オンザフライで 16kHz にダウンサンプリングします。 このオプション
16kHzモデルのみ有効です。 ダウンサンプリング ルーチンは sptk から移植されました。 (Rev.
4.0)
-NA 装置名
DatLink サーバー入力のホスト名 (-入力 ネットオーディオ).
-アドポート ポート番号
-入力 アディネット、リッスンする adinnet ポート番号を指定します。 (デフォルト: 5530)
-ノストリップ
Julius はデフォルトで、入力音声データ内の連続するゼロ サンプルを削除します。 このオプション
やめて
-C jconffile
ここで jconf ファイルをロードします。 jconffile の内容はこの時点で展開されます。
-プラグインディレクトリ ディレクトリリスト
プラグインをロードするディレクトリを指定します。 複数のディレクトリが存在する場合は、次のように指定します。
コロンで区切られたリスト。
ENVIRONMENT 変数
アルサデフ
(ALSA デバイスでマイク入力を使用) キャプチャ デバイス名を指定します。 指定がない場合は、
「デフォルト」が使用されます。
オーディオデバイス
(OSS デバイスでマイク入力を使用) キャプチャ デバイスのパスを指定します。 指定がない場合は、
"/ dev / dsp」が使用されます。
LATENCY_MSEC
マイク入力の入力遅延をミリ秒単位で設定してみてください。 値が小さいほど、
レイテンシーは短縮されますが、プロセスが不安定になる場合があります。 デフォルト値は、
実行中のOS。
例
マイク入力をファイルに記録します: "データ.0000.wav""データ.0001.wav" 等々:
長い音声ファイルを分割する」foobar.raw" の中へ "foobar.1500.wav""foobar.1501.wav「 ...:
ネットワークソケット経由でオーディオファイル全体をコピーします。
音声セグメントを検出し、ネットワーク経由で Julius に送信し、認識します。
onworks.net サービスを使用してオンラインで adintool を使用する