GoGPT Best VPN GoSearch

Biểu tượng yêu thích OnWorks

Pocketphinx_batch - Trực tuyến trên đám mây

Chạy Pocketphinx_batch trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh Pocketphinx_batch có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


Pocketphinx_batch - Chạy nhận dạng giọng nói ở chế độ hàng loạt

SYNOPSIS


túiphinx_batch -ừm hmmdir -bản án tập tin dict [ lựa chọn ] ...

MÔ TẢ


Chạy nhận dạng giọng nói trên danh sách các cách phát âm ở chế độ hàng loạt. Danh sách các đối số
sau:

-adchdr
Kích thước của tiêu đề tệp âm thanh tính bằng byte (tiêu đề bị bỏ qua)

-adcin Đầu vào là dữ liệu âm thanh thô

-agc Điều khiển độ lợi tự động cho c0 ('max', 'emax', 'noise' hoặc 'none')

-agcthresh
Ngưỡng ban đầu để kiểm soát độ lợi tự động

-điện thoại
giải mã âm vị với phiên âm lm

-allphone_ci
Chỉ thực hiện giải mã âm vị với lm ngữ âm và các đơn vị độc lập với ngữ cảnh

-alpha Tham số nhấn mạnh

-argfile
tệp đưa ra các đối số bổ sung.

-cale
Nghịch đảo của thang mô hình âm học để tính điểm tin cậy

-ôi Trọng số nghịch đảo được áp dụng cho điểm âm thanh.

-quay lại
In kết quả và dấu vết vào tệp nhật ký.

-chùm tia Chiều rộng chùm tia áp dụng cho mọi khung hình trong tìm kiếm Viterbi (giá trị nhỏ hơn có nghĩa là rộng hơn
chùm tia)

-mặt đường
Chạy tìm kiếm bestpath (Dijkstra) qua mạng từ (pass thứ 3)

-bestpathlw
Trọng số xác suất của mô hình ngôn ngữ cho tìm kiếm đường dẫn tốt nhất

-build_outdirs
Tạo các thư mục con bị thiếu trong thư mục đầu ra

-cedir
thư mục tệp (tiền tố là tệppec trong tệp điều khiển)

-ceext
Phần mở rộng tệp đầu vào (được nối với tệp tinpec trong tệp điều khiển)

-celen
Số lượng thành phần trong vectơ đặc điểm đầu vào

-cmn Cepstral có nghĩa là lược đồ chuẩn hóa ('hiện tại', 'trước đó' hoặc 'không có')

-cmninit
Giá trị ban đầu (được phân tách bằng dấu phẩy) cho giá trị trung bình khi sử dụng 'trước'

-compallsen
Tính toán tất cả các điểm số senone trong mọi khung hình (có thể nhanh hơn khi có nhiều
senon)

-ctl tập tin liệt kê các câu nói sẽ được xử lý

-ctlcount
Số phát ngôn được xử lý (sau khi bỏ qua -ctloffset mục)

-ctlincr
Thực hiện mọi dòng thứ N trong tệp điều khiển

-ctloffset
Số câu nói ở đầu -ctl tập tin bị bỏ qua

-ctm đầu ra ở định dạng tệp CTM (có thể yêu cầu phân loại sau)

-gỡ lỗi cấp độ để gỡ lỗi tin nhắn

-bản án tập tin đầu vào từ điển phát âm (lexicon)

-bánh án
Từ điển phân biệt chữ hoa chữ thường (LƯU Ý: phân biệt chữ hoa chữ thường áp dụng cho các ký tự ASCII
chỉ)

-run lên
Thêm tiếng ồn 1/2 bit

-nhân đôi
Sử dụng bộ lọc băng thông kép (cùng tần số trung tâm)

-ds Khung giảm tỷ lệ lấy mẫu tính toán GMM

-bản án tập tin nhập từ điển phát âm từ

-fat Loại luồng tính năng, phụ thuộc vào kiểu âm thanh

-featparams
chứa các tham số trích xuất tính năng.

-fillprob
Xác suất chuyển đổi từ điền

-trao đổi Tỷ lệ khung hình

-fsg định dạng tệp ngữ pháp trạng thái hữu hạn

-fsgctl
tệp danh sách tệp FSG để sử dụng cho mỗi câu nói

-fgdir
thư mục cho các tệp FSG

-fsgext
phần mở rộng cho các tệp FSG (bao gồm cả dấu chấm ở đầu)

-fsgusealtpron
Thêm các cách phát âm thay thế vào FSG

-fgusefiller
Chèn các từ điền vào mỗi trạng thái.

-fwdflat
Chạy về phía trước tìm kiếm từ điển phẳng qua mạng từ (lượt thứ 2)

-fwdflatbeam
Chiều rộng chùm tia áp dụng cho mọi khung hình trong tìm kiếm phẳng vượt qua thứ hai

-fwdflatefwid
Số khung kết thúc tối thiểu cho một từ được tìm kiếm trong tìm kiếm fwdflat

-fwdflatlw
Trọng số xác suất của mô hình ngôn ngữ để giải mã từ vựng phẳng (vượt qua thứ 2)

-fwdflatsfwin
Cửa sổ khung trong mạng tinh thể để tìm kiếm các từ kế thừa trong tìm kiếm fwdflat

-fwdflatwbeam
Chiều rộng chùm tia áp dụng cho các lối thoát từ trong tìm kiếm phẳng qua thứ hai

-fwdtree
Chạy tìm kiếm từ vựng-cây về phía trước (lượt đầu tiên)

-ừm chứa các tệp mô hình âm thanh.

-hyp tên tệp xuất ra

-hypseg
đầu ra với tên tệp phân đoạn

-input_endian
Độ bền của dữ liệu đầu vào, lớn hay ít, bị bỏ qua nếu NIST hoặc MS Wav

-jsgf tệp ngữ pháp

-cụm từ khoá
phát hiện

-kws tệp với các cụm từ khóa cần phát hiện, một cụm từ trên mỗi dòng

-kws_delay
Trì hoãn để đợi điểm phát hiện tốt nhất

-kws_plp
Xác suất vòng lặp điện thoại để phát hiện từ khóa

-kws_threshold
Ngưỡng cho tỷ lệ p (hyp) / p (lựa chọn thay thế)

-latsize
Kích thước bảng backpointer ban đầu

-lda chứa ma trận chuyển đổi được áp dụng cho các đối tượng (các đối tượng đơn dòng
chỉ)

-ldadim
Kích thước đầu ra của phép biến đổi đặc trưng (0 để sử dụng toàn bộ ma trận)

-người nâng
Độ dài của đường cong sin để có sự sống động hoặc 0 đối với không có sự sống động.

-lm tệp đầu vào mô hình ngôn ngữ trigram

-lmctl một bộ mô hình ngôn ngữ

-ừm-bản án các đối số luôn được yêu cầu. Một trong hai -lm or -fsg bắt buộc,
tùy thuộc vào việc bạn đang sử dụng mô hình ngôn ngữ thống kê hay ngữ pháp trạng thái hữu hạn.
Để thực hiện nhận dạng batchmode, bạn sẽ cần chỉ định tệp điều khiển, sử dụng -ctl Đây là một
tệp văn bản đơn giản chứa một mục nhập trên mỗi dòng. Mỗi mục là tên của một tập tin đầu vào
liên quan đến -cedir thư mục và không có phần mở rộng tên tệp (được đưa ra trong
các -ceext lý lẽ).

Nếu bạn đang sử dụng các tệp tính năng âm thanh làm đầu vào (xem nhân sư_fe(1) để biết thông tin về cách
để tạo những thứ này), bạn cũng có thể chỉ định một phần con của tệp, sử dụng định dạng sau:

TÊN TỆP KHUNG BẮT ĐẦU KHUNG KẾT THÚC UTTERANCE-ID

Sử dụng Pocketphinx_batch trực tuyến bằng dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad




×
quảng cáo
❤️Mua sắm, đặt phòng hoặc mua tại đây — không mất phí, giúp duy trì các dịch vụ miễn phí.