ภาษาอังกฤษภาษาฝรั่งเศสสเปน

Ad


ไอคอน Fav ของ OnWorks

จูเลียส - ออนไลน์ในคลาวด์

เรียกใช้ Julius ในผู้ให้บริการโฮสต์ฟรีของ OnWorks ผ่าน Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

นี่คือคำสั่งจูเลียสที่สามารถเรียกใช้ในผู้ให้บริการโฮสต์ฟรีของ OnWorks โดยใช้เวิร์กสเตชันออนไลน์ฟรีของเรา เช่น Ubuntu Online, Fedora Online, โปรแกรมจำลองออนไลน์ของ Windows หรือโปรแกรมจำลองออนไลน์ของ MAC OS

โครงการ:

ชื่อ


จูเลียส
- โอเพ่นซอร์สเอ็นจิ้น LVCSR อเนกประสงค์

เรื่องย่อ


จูเลียส [-ค jconfffile] [ตัวเลือก... ]

DESCRIPTION


จูเลียส เป็นเอ็นจิ้นการรู้จำคำพูดโอเพนซอร์ซประสิทธิภาพสูงอเนกประสงค์สำหรับ
นักวิจัยและนักพัฒนา มันสามารถดำเนินการรับรู้เกือบเรียลไทม์ของ
พูดต่อเนื่องด้วยรูปแบบภาษา 60 กรัมมากกว่า 3 คำและรุ่น HMM แบบ Triphone ส่วนใหญ่
พีซีปัจจุบัน จูเลียส สามารถทำการจดจำไฟล์เสียง, อินพุตไมโครโฟนสด,
อินพุตเครือข่ายและไฟล์พารามิเตอร์คุณสมบัติ

โมดูลการรับรู้หลักถูกนำมาใช้เป็นไลบรารี C ที่เรียกว่า "JuliusLib" นอกจากนี้ยังสามารถ
ขยายโดยสิ่งอำนวยความสะดวกปลั๊กอิน

ที่สนับสนุน Models
จูเลียส ต้องการโมเดลภาษาและโมเดลอะคูสติกเพื่อเรียกใช้เป็นตัวจดจำเสียงพูด จูเลียส
รองรับรุ่นต่อไปนี้

อะคูสติก แบบ
คำย่อย HMM (แบบจำลอง Markov ที่ซ่อนอยู่) ในรูปแบบ HTK ascii ได้รับการสนับสนุน ฟอนิม
โมเดล (โมโนโฟน) โมเดลฟอนิมที่ขึ้นกับบริบท (triphone) แบบผูกและ
สามารถใช้แบบจำลองเสียงผูกผสมของหน่วยใดก็ได้ เมื่อใช้บริบทขึ้นอยู่กับ
โมเดล การพึ่งพาบริบทระหว่างคำก็ได้รับการจัดการเช่นกัน คุณสมบัติมัลติสตรีมและ
รองรับ MSD-HMM คุณสามารถใช้เครื่องมือเพิ่มเติม mkbinhmm เพื่อแปลง ascii
HMM เป็นรูปแบบไบนารีขนาดกะทัดรัดเพื่อการโหลดที่เร็วขึ้น

โปรดทราบว่า จูเลียส ตัวเองสามารถดึงคุณลักษณะ MFCC ออกจากข้อมูลคำพูดเท่านั้น ถ้าคุณใช้
อะคูสติก HMM ได้รับการฝึกฝนสำหรับคุณสมบัติอื่น ๆ คุณควรให้อินพุตในพารามิเตอร์ HTK
ไฟล์ประเภทคุณลักษณะเดียวกัน

ภาษา รูปแบบ: word N-กรัม
รองรับรูปแบบภาษา Word N-gram สูงสุด 10 กรัม จูเลียสใช้ต่างกัน
N-gram สำหรับแต่ละรอบ: ซ้ายไปขวา 2 กรัมในรอบแรกและ N-gram จากขวาไปซ้าย
ครั้งที่ 2 ขอแนะนำให้ใช้ทั้ง LR 2-gram และ RL N-gram สำหรับ Julius
อย่างไรก็ตาม คุณสามารถใช้ได้เพียง LR N-gram หรือ RL N-gram เดียวเท่านั้น ในกรณีเช่นนี้ ค่าประมาณ
LR 2 กรัมที่คำนวณจาก N-gram ที่กำหนดจะถูกนำไปใช้ในการผ่านครั้งแรก

รองรับรูปแบบ ARPA มาตรฐาน นอกจากนี้ รูปแบบไบนารียังเป็น
รองรับประสิทธิภาพ เครื่องมือ เอ็มเคบิงแกรม(1) สามารถแปลงรูปแบบ ARPA N-gram เป็น
รูปแบบไบนารี

ภาษา รูปแบบ: ไวยากรณ์
รูปแบบไวยากรณ์เป็นรูปแบบดั้งเดิมและเครื่องมือในการสร้างการรับรู้ grammar
รวมอยู่ในการแจกจ่าย ไวยากรณ์ประกอบด้วยสองไฟล์: หนึ่งคือ a
ไฟล์ 'grammar' ที่อธิบายโครงสร้างประโยคในรูปแบบ BNF โดยใช้ word
ชื่อ 'หมวดหมู่' เป็นสัญลักษณ์ยุติ อีกไฟล์หนึ่งคือไฟล์ 'voca' ที่กำหนดคำ
ด้วยการออกเสียง (เช่น ลำดับฟอนิม) สำหรับแต่ละหมวดหมู่ พวกเขาควรจะ
แปลงโดย mkdfa(1) ไปยังไฟล์ออโตมาตันที่มีขอบเขตจำกัด (.dfa) และ a
ไฟล์พจนานุกรม (.dict) ตามลำดับ คุณยังสามารถใช้หลายไวยากรณ์ได้

ภาษา รูปแบบ: เปลี่ยว word
คุณสามารถดำเนินการรู้จำคำศัพท์แบบแยกส่วนได้โดยใช้พจนานุกรมคำศัพท์เท่านั้น ด้วยสิ่งนี้
ประเภทของแบบจำลอง Julius จะดำเนินการจดจำครั้งเดียวอย่างรวดเร็วด้วยบริบทแบบคงที่
การจัดการ ระบบจะเพิ่มโมเดลความเงียบที่ส่วนหัวและส่วนท้ายของแต่ละคำ คุณสามารถ
ยังใช้พจนานุกรมหลายเล่มในกระบวนการ

ค้นหา ขั้นตอนวิธี
อัลกอริทึมการรับรู้ของ จูเลียส ขึ้นอยู่กับกลยุทธ์สองรอบ Word 2 กรัมและย้อนกลับ
มีการใช้คำ 3-gram ในการผ่านตามลำดับ อินพุตทั้งหมดถูกประมวลผลในครั้งแรก
ผ่าน และอีกครั้ง กระบวนการค้นหาขั้นสุดท้ายจะดำเนินการอีกครั้งสำหรับอินพุตโดยใช้
ผลลัพธ์ของการผ่านครั้งแรกเพื่อจำกัดพื้นที่การค้นหาให้แคบลง โดยเฉพาะการรับรู้
อัลกอริธึมขึ้นอยู่กับการค้นหาแบบฮิวริสติกแบบทรีทรีรวมกับซ้ายไปขวา
การค้นหาลำแสงเฟรมซิงโครนัสและการค้นหาการถอดรหัสสแต็กจากขวาไปซ้าย

เมื่อใช้โทรศัพท์ที่ขึ้นกับบริบท (triphones) บริบทระหว่างคำจะถูกนำเข้าสู่
การพิจารณา. สำหรับรุ่นไท-มิกซ์-มิกซ์เสียง-ไท-มิกซ์เสียง อะคูสติกความเร็วสูง
การคำนวณความน่าจะเป็นทำได้โดยใช้การตัดแต่งกิ่งแบบเกาส์เซียน

สำหรับรายละเอียดเพิ่มเติม โปรดดูเอกสารที่เกี่ยวข้อง

OPTIONS


ตัวเลือกเหล่านี้ระบุรุ่น พฤติกรรมของระบบ และพารามิเตอร์การค้นหาต่างๆ
จูเลียส ตัวเลือกเหล่านี้สามารถตั้งค่าได้ที่บรรทัดคำสั่ง แต่ขอแนะนำให้คุณเขียน
ในไฟล์ข้อความเป็น "ไฟล์ jconf" และระบุด้วยตัวเลือก "-C"

แอปพลิเคชันที่รวม JuliusLib ยังใช้ตัวเลือกเหล่านี้เพื่อตั้งค่าพารามิเตอร์ของ core
เครื่องยนต์การรับรู้ ตัวอย่างเช่น ไฟล์ jconf สามารถโหลดไปยัง enine ได้โดยการเรียก
j_config_load_file_new() ด้วยชื่อไฟล์ jconf เป็นอาร์กิวเมนต์

โปรดทราบว่าพาธสัมพัทธ์ในไฟล์ jconf ควรสัมพันธ์กับไฟล์ jconf
เอง ไม่ใช่ไดเร็กทอรีการทำงานปัจจุบัน

ด้านล่างนี้คือรายละเอียดของตัวเลือกทั้งหมดที่รวบรวมโดยกลุ่ม

จูเลียส ใบสมัคร ตัวเลือก
นี่คือตัวเลือกแอปพลิเคชันของ Julius นอก JuliusLib ประกอบด้วยพารามิเตอร์และ
สวิตช์สำหรับเอาต์พุตผลลัพธ์ การแปลงชุดอักขระ ระดับบันทึก และตัวเลือกโหมดโมดูล
ตัวเลือกเหล่านี้มีเฉพาะสำหรับ Julius และไม่สามารถใช้กับแอปพลิเคชันที่ใช้ JuliusLib
นอกจากจูเลียส

-outfile
ในการป้อนไฟล์ ตัวเลือกนี้จะเขียนผลการจดจำของแต่ละไฟล์ไปยังไฟล์แยกกัน
ไฟล์. ไฟล์เอาต์พุตของไฟล์อินพุตจะเป็นชื่อเดียวกัน แต่ส่วนต่อท้ายจะเป็น
เปลี่ยนเป็น ".out" (rev.4.0)

-แยกคะแนน
ส่งออกภาษาและคะแนนเสียงแยกกัน

-callbackdebug
พิมพ์ชื่อโทรกลับทุกครั้งที่โทรเพื่อตรวจแก้จุดบกพร่อง (rev.4.0)

- ถ่าน ราคาเริ่มต้นที่ ไปยัง
พิมพ์ด้วยการแปลงชุดอักขระ ราคาเริ่มต้นที่ เป็นชุดอักขระต้นทางที่ใช้ใน
รูปแบบภาษาและ ไปยัง คือชุดอักขระเป้าหมายที่คุณต้องการได้รับ

บน Linux อาร์กิวเมนต์ควรเป็นชื่อรหัส คุณสามารถรับรายการที่มีอยู่
ชื่อรหัสโดยเรียกใช้คำสั่ง "iconv --list" บน Windows อาร์กิวเมนต์ควรเป็น
ชื่อรหัสหรือหมายเลขหน้ารหัส ชื่อรหัสควรเป็น "ansi", "mac", "oem",
"utf-7", "utf-8", "sjis", "euc" หรือคุณสามารถระบุหมายเลขหน้ารหัสใด ๆ ที่รองรับได้ที่
สภาพแวดล้อมของคุณ

-nocharconv
ปิดใช้งานการแปลงอักขระ

-โมดูล [ท่า]
เรียกใช้ Julius ใน "โหมดโมดูลเซิร์ฟเวอร์" หลังจากเริ่มต้น Julius รอการเชื่อมต่อ tcp/ip
จากลูกค้า เมื่อสร้างการเชื่อมต่อแล้ว Julius ก็เริ่มสื่อสารกับลูกค้า
เพื่อประมวลผลคำสั่งที่เข้ามาจากไคลเอนต์ หรือเพื่อผลลัพธ์การรับรู้ผลลัพธ์ input
ข้อมูลทริกเกอร์และสถานะระบบอื่น ๆ ให้กับลูกค้า หมายเลขพอร์ตเริ่มต้นคือ
10500.

-บันทึก dir
บันทึกข้อมูลคำพูดที่ป้อนทั้งหมดลงในไดเร็กทอรีที่ระบุโดยอัตโนมัติ อินพุตที่แบ่งแต่ละส่วนคือ
บันทึกไว้ทีละคน ชื่อไฟล์ของข้อมูลที่บันทึกไว้ถูกสร้างขึ้นจากเวลาของระบบ
เมื่ออินพุตสิ้นสุด ในรูปแบบของ YYYY.MMDD.HHMMSS.wav รูปแบบไฟล์เป็นแบบโมโนเรล 16 บิต
วาฟ. ไม่ถูกต้องสำหรับอินพุต mfcfile

ด้วยการปฏิเสธอินพุตโดย -ปฏิเสธสั้นอินพุตที่ถูกปฏิเสธจะถูกบันทึกไว้แม้ว่า
พวกเขาถูกปฏิเสธ

-ล็อกไฟล์ ไฟล์
บันทึกเอาต์พุตบันทึกทั้งหมดลงในไฟล์แทนเอาต์พุตมาตรฐาน (ฉบับที่.4.0)

- โนล็อก
ปิดใช้งานเอาต์พุตบันทึกทั้งหมด (ฉบับที่.4.0)

-ช่วยด้วย
ข้อความช่วยเหลือเอาต์พุตและออก

เหตุการณ์ที่ ตัวเลือก
ตัวเลือกเหล่านี้ขึ้นอยู่กับรุ่น/ตัวเลือกการค้นหาที่เกี่ยวข้องกับอินพุตเสียง การตรวจจับเสียง GMM
อัลกอริธึมการถอดรหัส สิ่งอำนวยความสะดวกของปลั๊กอิน และอื่นๆ Global option ควรวางไว้ก่อน
การประกาศตัวอย่างใดๆ (-เช้า, -แอลเอ็ม,หรือ -เอส.อาร์) หรือหลังจากนั้น "-ทั่วโลกตัวเลือก "

เสียง อินพุต
-ป้อนข้อมูล {mic|rawfile|mfcfile|adinnet|stdin|netaudio|alsa|oss|esd}
เลือกแหล่งป้อนคำพูด ระบุ 'file' หรือ 'rawfile' สำหรับไฟล์รูปคลื่น
'htkparam' หรือ 'mfcfile' สำหรับไฟล์พารามิเตอร์ HTK ในการป้อนไฟล์ ผู้ใช้จะเป็น
ให้ป้อนชื่อไฟล์จาก stdin หรือคุณสามารถใช้ -รายการไฟล์ ตัวเลือก
ระบุรายการไฟล์ที่จะประมวลผล

'mic' คือการรับอินพุตเสียงจากอุปกรณ์ไมโครโฟนสดเริ่มต้นและ 'adinnet'
หมายถึงการรับข้อมูลรูปคลื่นผ่านเครือข่าย tcpip จากไคลเอนต์ adinnet
'netaudio' มาจากอินพุต DatLink/NetAudio และ 'stdin' หมายถึงอินพุตข้อมูลจาก
อินพุตมาตรฐาน

สำหรับการป้อนไฟล์รูปคลื่น เฉพาะ WAV (ไม่มีการบีบอัด) และ RAW (ไม่มีส่วนหัว, 16 บิต, big
endian) ได้รับการสนับสนุนโดยค่าเริ่มต้น สามารถอ่านรูปแบบอื่นได้เมื่อคอมไพล์ด้วย
ห้องสมุด libsnd หากต้องการดูว่ารองรับรูปแบบใดบ้าง โปรดดูข้อความช่วยเหลือ
ใช้ตัวเลือก -ช่วยด้วย. สำหรับอินพุต stdin รองรับเฉพาะ WAV และ RAW (ค่าเริ่มต้น:
เอ็มเอฟซีไฟล์)

ที่ Linux คุณสามารถเลือก API ในขณะใช้งานโดยระบุ alsa, oss และ esd

-chunk_size ตัวอย่าง
ขนาดแฟรกเมนต์เสียงในจำนวนตัวอย่าง (ค่าเริ่มต้น: 1000)

-รายการไฟล์ ชื่อไฟล์
(ด้วย -ป้อนข้อมูล ไฟล์ดิบ|mfcfile) ทำการจดจำไฟล์ทั้งหมดที่ระบุไว้ใน
ไฟล์. ไฟล์ควรมีไฟล์อินพุตต่อบรรทัด เครื่องยนต์จะดับเมื่อทั้งหมด
ไฟล์จะถูกประมวลผล

-notypecheck
ตามค่าเริ่มต้น Julius จะตรวจสอบประเภทพารามิเตอร์อินพุตว่าตรงกับ AM หรือ
ไม่. ตัวเลือกนี้จะปิดใช้งานการตรวจสอบและบังคับให้เอ็นจิ้นใช้เวกเตอร์อินพุต
อย่างที่เป็น.

-48
บันทึกอินพุตด้วยการสุ่มตัวอย่าง 48kHz และลดตัวอย่างลงเหลือ 16kHz ได้ทันที นี้
ตัวเลือกนี้ใช้ได้กับรุ่น 16kHz เท่านั้น รูทีนการสุ่มตัวอย่างลดลงถูกย้ายจาก
สปท. (ฉบับที่ 4.0)

-นา ชื่ออุปกรณ์
ชื่อโฮสต์สำหรับอินพุตเซิร์ฟเวอร์ DatLink (-ป้อนข้อมูล เน็ตออดิโอ).

-แอดพอร์ต หมายเลขพอร์ต
กับ -ป้อนข้อมูล อดินเน็ตระบุหมายเลขพอร์ต adinnet เพื่อฟัง (ค่าเริ่มต้น: 5530)

-nostrip
โดยค่าเริ่มต้น Julius จะลบตัวอย่างศูนย์ที่ต่อเนื่องกันในข้อมูลคำพูดของอินพุต นี้
ตัวเลือกยับยั้งการกำจัด

-zmean , -nozmean
ตัวเลือกนี้เปิด/ปิดการลบ DC offset ของรูปคลื่นอินพุต ออฟเซ็ตจะเป็น
ประมาณจากอินพุตทั้งหมด สำหรับอินพุตไมโครโฟน / เครือข่าย ค่าเฉลี่ยศูนย์ของ
48000 ตัวอย่างแรก (3 วินาทีในการสุ่มตัวอย่าง 16kHz) จะถูกใช้สำหรับ
ประมาณการ (ค่าเริ่มต้น: ปิดการใช้งาน)

ตัวเลือกนี้ใช้การชดเชยคงที่สำหรับช่องสัญญาณ ดูสิ่งนี้ด้วย -zmeansource for
การลบออฟเซ็ตที่ชาญฉลาดของเฟรม

การพูด การค้นพบ by ระดับ และ ศูนย์ข้าม
-เงียบกริบ , - ความเงียบ
เปิด/ปิดการตรวจจับคำพูดตามระดับและกากบาทศูนย์ ค่าเริ่มต้นคือสำหรับ
อินพุตไมโครโฟน / adinnet และปิดสำหรับไฟล์

-เลเวล เธรด
ระดับเกณฑ์สำหรับการตรวจจับอินพุตเสียงพูด ค่าควรอยู่ในช่วงตั้งแต่ 0 ถึง
32767. (ค่าเริ่มต้น: 2000)

-zc เธรด
เกณฑ์การข้ามศูนย์ต่อวินาที เฉพาะอินพุตที่เกินระดับ
เกณฑ์ (-เลเวล) จะถูกนับ (ค่าเริ่มต้น: 60)

- headmargin มิลลิวินาที
ระยะขอบเงียบที่จุดเริ่มต้นของส่วนของคำพูดในหน่วยมิลลิวินาที (ค่าเริ่มต้น: 300)

-ส่วนท้าย มิลลิวินาที
ระยะขอบที่ส่วนท้ายของคำพูดในหน่วยมิลลิวินาที (ค่าเริ่มต้น: 400)

อินพุต การปฏิเสธ
มีการใช้วิธีการปฏิเสธอินพุตส่วนหน้าอย่างง่ายสองวิธี โดยอิงตามความยาวของอินพุต
และกำลังเฉลี่ยของส่วนที่ตรวจพบ การปฏิเสธโดยกำลังเฉลี่ยคือ
ทดลองและสามารถเปิดใช้งานโดย --enable-power-reject ในการรวบรวม ใช้ได้สำหรับ
ฟีเจอร์ MFCC พร้อมค่าสัมประสิทธิ์กำลังและอินพุตแบบเรียลไทม์เท่านั้น

สำหรับการปฏิเสธอินพุตตาม GMM โปรดดูส่วน GMM ด้านล่าง

-ปฏิเสธสั้น มิลลิวินาที
ปฏิเสธอินพุตที่สั้นกว่ามิลลิวินาทีที่ระบุ การค้นหาจะสิ้นสุดลงและ
จะไม่มีผลลัพธ์ออกมา

- พลังงาน เธรด
ปฏิเสธส่วนที่ป้อนด้วยพลังงานเฉลี่ย ถ้าพลังงานเฉลี่ยของ
อินพุตที่รู้จักล่าสุดต่ำกว่าเกณฑ์ Julius จะปฏิเสธอินพุต
(ฉบับที่.4.0)

ตัวเลือกนี้ใช้ได้เมื่อ --enable-power-reject ระบุไว้ที่การคอมไพล์
เวลา

เสียน สารผสม แบบ / จีเอ็มเอ็ม-วอด
GMM จะใช้สำหรับการปฏิเสธอินพุตด้วยคะแนนสะสมหรือสำหรับส่วนหน้า
VAD แบบ GMM เมื่อระบุ --enable-gmm-vad

หมายเหตุ: คุณควรตั้งค่าพารามิเตอร์ MFCC ที่เหมาะสมที่จำเป็นสำหรับ GMM
การระบุพารามิเตอร์เสียงที่อธิบายไว้ในส่วน AM -AM_GMM.

เมื่อเปิดใช้งาน VAD ตาม GMM คะแนนกิจกรรมเสียงจะถูกคำนวณที่แต่ละรายการ
เฟรมเป็นการประมวลผลส่วนหน้า ค่าจะถูกคำนวณเป็น \[ \max_{m \in M_v}
p(x|m) - \max_{m \in M_n} p(x|m) \] โดยที่ $M_v$ คือชุดเสียง GMM และ $M_n$ คือ
ชุดเสียง GMM ที่ควรระบุชื่อโดย -gmmreject. กิจกรรม
คะแนนจะถูกหาค่าเฉลี่ยสำหรับเฟรม N สุดท้าย โดยที่ N ถูกระบุโดย
-gmmmargin. Julius อัปเดตคะแนนกิจกรรมเฉลี่ยในแต่ละเฟรมและตรวจพบ
เสียงพูดขึ้นทริกเกอร์เมื่อค่าได้รับสูงกว่าค่าที่ระบุโดย -gmmupและ
ตรวจจับทริกเกอร์ดาวน์เมื่อได้รับต่ำกว่าค่า -gmmdown.

-gmm hmmdefs_file
ไฟล์คำจำกัดความ GMM ในรูปแบบ HTK หากระบุไว้ การตรวจสอบอินพุตตาม GMM
จะดำเนินการพร้อมกันกับรอบที่ 1 และคุณสามารถปฏิเสธการป้อนข้อมูลได้
ตามผลลัพธ์ที่กำหนดโดย -gmmreject. GMM ควรถูกกำหนดเป็น
HMM แบบรัฐเดียว

-gmmnum จำนวน
จำนวนองค์ประกอบเกาส์เซียนที่จะคำนวณต่อเฟรมในการคำนวณ GMM เท่านั้น
N-best Gaussians จะถูกคำนวณเพื่อการคำนวณที่รวดเร็ว ค่าเริ่มต้นคือ 10
และการระบุค่าที่น้อยกว่าจะทำให้การคำนวณ GMM เร็วขึ้น แต่ค่าน้อยเกินไป
(1 หรือ 2) อาจทำให้ประสิทธิภาพการระบุตัวตนลดลง

-gmmreject เชือก
รายการที่คั่นด้วยเครื่องหมายจุลภาคของชื่อ GMM ที่จะปฏิเสธเนื่องจากการป้อนข้อมูลที่ไม่ถูกต้อง เมื่อไหร่
การรับรู้ความเป็นไปได้ของบันทึกของ GMM ที่สะสมสำหรับข้อมูลทั้งหมดจะ
คำนวณควบคู่ไปกับรอบที่ 1 ถ้าชื่อ GMM คะแนนสูงสุด
อยู่ภายในสตริงนี้ การส่งผ่านครั้งที่ 2 จะไม่ถูกดำเนินการและอินพุตจะเป็น
ปฏิเสธ

-gmmmargin เฟรม
(GMM_VAD) ระยะขอบของส่วนหัวในเฟรม เมื่อตรวจพบทริกเกอร์คำพูดโดย GMM
การรับรู้จะเริ่มจากเฟรมปัจจุบันลบด้วยค่านี้ (ฉบับที่.4.0)

ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อคอมไพล์ด้วย --enable-gmm-vad

-gmmup ความคุ้มค่า
(GMM_VAD) เพิ่มเกณฑ์การทริกเกอร์ของคะแนนกิจกรรมเสียง (ฉบับที่.4.1)

ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อคอมไพล์ด้วย --enable-gmm-vad

-gmmdown ความคุ้มค่า
(GMM_VAD) เกณฑ์การทริกเกอร์ของคะแนนกิจกรรมเสียงลดลง (ฉบับที่.4.1)

ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อคอมไพล์ด้วย --enable-gmm-vad

ถอดรหัส ตัวเลือก
การประมวลผลตามเวลาจริงหมายถึงการประมวลผลผ่านการคำนวณ MFCC ครั้งที่ 1 พร้อมกัน
ถอดรหัส โดยค่าเริ่มต้น การประมวลผลตามเวลาจริงบนบัตรจะเปิดสำหรับไมโครโฟน /
อินพุต adinnet / netaudio และอื่น ๆ

- เรียลไทม์ , - เรียลไทม์
เปิด / ปิดการประมวลผลแบบเรียลไทม์ (ไปป์ไลน์) อย่างชัดเจนในการผ่านครั้งแรก
ค่าเริ่มต้นคือปิดสำหรับการป้อนไฟล์ และเปิดสำหรับไมโครโฟน adinnet และ NetAudio
ป้อนข้อมูล. ตัวเลือกนี้เกี่ยวข้องกับวิธีดำเนินการ CMN และการทำให้เป็นมาตรฐานของพลังงาน:
ถ้าปิด จะใช้คุณสมบัติทั่วไปของอินพุตทั้งหมด ถ้าเปิด MAP-CMN
และการทำให้เป็นมาตรฐานของพลังงานเพื่อทำการประมวลผลแบบเรียลไทม์

misc ตัวเลือก
-C jconfffile
โหลดไฟล์ jconf ที่นี่ เนื้อหาของ jconffile จะถูกขยายที่นี้
จุด.

-version
พิมพ์ข้อมูลเวอร์ชันไปยังข้อผิดพลาดมาตรฐาน และออก

-การตั้งค่า
พิมพ์ข้อมูลการตั้งค่ากลไกจัดการข้อผิดพลาดมาตรฐาน และออก

-เงียบ
บันทึกผลลัพธ์น้อยลง เพื่อผลลัพธ์ จะพิมพ์เฉพาะลำดับคำที่ดีที่สุดเท่านั้น

-debug
(สำหรับการดีบัก) ส่งข้อความภายในจำนวนมากและข้อมูลการดีบักเพื่อบันทึก

- ตรวจสอบ {wchmm|โครงตาข่าย|ไตรโฟน}
สำหรับการดีบัก ให้เข้าสู่โหมดตรวจสอบแบบโต้ตอบ

-ปลั๊กอินไดร์ ไดร์ลิสต์
ระบุไดเร็กทอรีเพื่อโหลดปลั๊กอิน หากมีหลายไดเร็กทอรี ให้ระบุโดย
รายการที่คั่นด้วยเครื่องหมายทวิภาค

ตัวอย่าง การประกาศ for หลาย ถอดรหัส
อาร์กิวเมนต์ต่อไปนี้จะสร้างชุดการกำหนดค่าใหม่พร้อมพารามิเตอร์เริ่มต้นและ
เปลี่ยนการตั้งค่าปัจจุบันเป็นมัน พารามิเตอร์ Jconf ที่ระบุหลังจากตัวเลือกจะถูกตั้งค่าเป็น
ชุดปัจจุบัน

ในการถอดรหัสแบบหลายโมเดล ควรระบุอาร์กิวเมนต์เหล่านี้ไว้ที่ส่วนแรกของแต่ละโมเดล
/ ค้นหาอินสแตนซ์ที่มีชื่อต่างกัน ตัวเลือกใดๆ ก่อนการกำหนดอินสแตนซ์แรก
จะถูกละเว้น

เมื่อไม่พบคำจำกัดความของอินสแตนซ์ (เช่น Julius เวอร์ชันเก่า) ตัวเลือกทั้งหมดจะเป็น
กำหนดให้กับอินสแตนซ์เริ่มต้นที่ชื่อ _default

โปรดทราบว่าการถอดรหัสด้วย LM เดียวและ AM หลายตัวไม่ได้รับการสนับสนุนอย่างสมบูรณ์ สำหรับ
ตัวอย่าง คุณอาจต้องการสร้างไฟล์ jconf ดังต่อไปนี้
ยังไม่รองรับการแชร์โมเดลประเภทนี้ เนื่องจากการประมวลผล LM บางส่วนขึ้นอยู่
ในช่วงเช้าที่ได้รับมอบหมาย คุณสามารถได้ผลลัพธ์เดียวกันโดยกำหนด LM เดียวกันสำหรับแต่ละ
น. แบบนี้

-เช้า ชื่อ
สร้างชุดการกำหนดค่า AM ใหม่และเปลี่ยนชุดปัจจุบันเป็นชุดใหม่ คุณควรให้
ชื่อที่ไม่ซ้ำ (ฉบับที่.4.0)

-แอลเอ็ม ชื่อ
สร้างชุดการกำหนดค่า LM ใหม่และเปลี่ยนชุดปัจจุบันเป็นชุดใหม่ คุณควรให้
ชื่อที่ไม่ซ้ำ (ฉบับที่.4.0)

-เอส.อาร์ ชื่อ ฉัน_ชื่อ lm_name
สร้างชุดการกำหนดค่าการค้นหาใหม่และเปลี่ยนชุดปัจจุบันเป็นชุดใหม่ ที่ระบุ
AM และ LM จะได้รับมอบหมายให้ ดิ ฉัน_ชื่อ และ lm_name เป็นได้ทั้งชื่อหรือ ID
ตัวเลข. คุณควรตั้งชื่อที่ไม่ซ้ำ (ฉบับที่.4.0)

-AM_GMM
เมื่อใช้ GMM สำหรับการประมวลผลส่วนหน้า คุณสามารถระบุเสียงเฉพาะ GMM ได้
พารามิเตอร์หลังจากตัวเลือกนี้ หากท่านไม่ระบุ -AM_GMM กับ GMM ทาง GMM จะ
ใช้เวกเตอร์พารามิเตอร์เดียวกันกับ AM สุดท้าย AM ปัจจุบันจะถูกเปลี่ยนเป็น
GMM หนึ่ง ดังนั้นโปรดระวังอย่าสับสนกับการกำหนดค่า AM ปกติ (ฉบับที่.4.0)

-ทั่วโลก
เริ่มส่วนสากล Global Options ควรวางไว้ก่อนอินสแตนซ์ใดๆ
ประกาศหรือหลังจากตัวเลือกนี้ในการรับรู้หลายรุ่น ใช้ได้เลย
หลายครั้ง. (ฉบับที่.4.1)

-ตรวจจมูก , -การตรวจสอบมาตรา
ปิดใช้งาน / เปิดใช้งานการตรวจสอบตำแหน่งตัวเลือกในการถอดรหัสหลายรุ่น เมื่อเปิดใช้งาน
ตัวเลือกระหว่างการประกาศอินสแตนซ์ถือเป็น "ส่วน" และเฉพาะที่เป็นของ
สามารถเขียนประเภทตัวเลือกได้ ตัวอย่างเช่น เมื่อ option -เช้า ระบุไว้ เฉพาะ AM
ตัวเลือกที่เกี่ยวข้องสามารถวางไว้หลังตัวเลือกจนกว่าจะพบประกาศอื่น อีกด้วย,
ตัวเลือกส่วนกลางควรวางไว้ที่ด้านบนสุด ก่อนการประกาศอินสแตนซ์ใดๆ นี่คือ
เปิดใช้งานโดยค่าเริ่มต้น (ฉบับที่.4.1)

ภาษา แบบ (-ล.ม)
กลุ่มนี้ประกอบด้วยตัวเลือกสำหรับการกำหนดแบบจำลองของแบบจำลองภาษาแต่ละประเภท เมื่อใช้
LM หลายตัว อินสแตนซ์เดียวสามารถมี LM ได้เพียงตัวเดียว

สามารถระบุ LM ได้เพียงประเภทเดียวเท่านั้นสำหรับการกำหนดค่า LM หากคุณต้องการใช้ multi
โมเดล คุณควรกำหนดให้เป็น LM ใหม่

N-กรัม
-d bingram_file
ใช้รูปแบบไบนารี N-gram ไฟล์ ARPA N-gram สามารถแปลงเป็น Julius binary
รูปแบบโดย mkbingram

-nlr arpa_ngram_file.arpa_ngram_file
โมเดลภาษา N-gram จากซ้ายไปขวาในรูปแบบ ARPA มาตรฐาน เมื่อไหร่
ระบุทั้ง N-gram ไปข้างหน้าและ N-gram ย้อนกลับ Julius ใช้ this
ส่งต่อ 2 กรัมสำหรับรอบแรกและ N-gram ย้อนหลังสำหรับรอบที่ 1

เนื่องจากไฟล์ ARPA มักจะมีขนาดใหญ่และต้องใช้เวลาโหลดมาก จึงอาจเป็น
ดีกว่าที่จะแปลงไฟล์ ARPA เป็นรูปแบบไบนารี Julius โดย mkbingram สังเกตว่า
หากใช้ N-gram ทั้งไปข้างหน้าและข้างหลังเพื่อรับรู้พวกเขาจะ
ถูกแปลงเป็นเลขฐานสองเดียว

เมื่อตัวเลือกนี้ระบุเฉพาะ N-gram ไปข้างหน้าและไม่มี N-gram . ย้อนกลับ
ระบุโดย -nrl, Julius ทำการจดจำด้วย N-gram ไปข้างหน้าเท่านั้น ดิ
รอบที่ 1 จะใช้รายการ 2 กรัมใน N-gram ที่กำหนดและรอบที่ 2 จะ
ใช้ N-gram ที่กำหนดโดยแปลงความน่าจะเป็นไปข้างหน้าเป็นย้อนหลัง
ความน่าจะเป็นตามกฎของเบย์ (ฉบับที่.4.0)

-nrl arpa_ngram_file.arpa_ngram_file
โมเดลภาษา N-gram แบบย้อนหลังจากขวาไปซ้ายในรูปแบบ ARPA มาตรฐาน เมื่อไหร่
ระบุทั้ง N-gram ไปข้างหน้าและ N-gram ย้อนกลับ Julius ใช้ forward
2 กรัมสำหรับรอบที่ 1 และ N-gram แบบย้อนกลับสำหรับรอบที่ 2

เนื่องจากไฟล์ ARPA มักจะมีขนาดใหญ่และต้องใช้เวลาโหลดมาก จึงอาจเป็น
ดีกว่าที่จะแปลงไฟล์ ARPA เป็นรูปแบบไบนารี Julius โดย mkbingram สังเกตว่า
หากใช้ N-gram ทั้งไปข้างหน้าและข้างหลังเพื่อรับรู้พวกเขาจะ
ถูกแปลงเป็นเลขฐานสองเดียว

เมื่อตัวเลือกนี้ระบุ N-gram ย้อนหลังเท่านั้นและไม่มี N-gram . ไปข้างหน้า
ระบุโดย -nlr, Julius ทำการจดจำด้วย N-gram ย้อนหลังเท่านั้น
รอบที่ 1 จะใช้ความน่าจะเป็นไปข้างหน้า 2 กรัมที่คำนวณจากย้อนหลัง
2 กรัมโดยใช้กฎ Bayes รอบที่ 2 ใช้ N-gram ย้อนหลังที่ให้มาอย่างเต็มที่
(ฉบับที่.4.0)

-v dict_file
ไฟล์พจนานุกรมคำ

-ซิลเฮด คำ_สตริง -ซิลเทล คำ_สตริง
คำเงียบที่กำหนดไว้ในพจนานุกรมสำหรับความเงียบที่จุดเริ่มต้นของ
ประโยคและจุดสิ้นสุดของประโยค (ค่าเริ่มต้น: " , " ")

-มาพังค์ คำ_สตริง
ระบุคำที่ไม่รู้จัก ค่าเริ่มต้นคือ " " หรือ " " จะใช้ในการมอบหมาย
ความน่าจะเป็นของคำในคำที่ไม่รู้จัก เช่น คำในพจนานุกรมที่ไม่อยู่ใน
คำศัพท์ N-gram

-iwspword
เพิ่มรายการคำลงในพจนานุกรมที่ควรสอดคล้องกับการหยุดระหว่างคำ
ซึ่งอาจช่วยปรับปรุงความแม่นยำในการจดจำในบางรูปแบบภาษาที่ไม่มี
การสร้างแบบจำลองการหยุดระหว่างคำอย่างชัดเจน รายการคำที่จะเพิ่มสามารถเปลี่ยนแปลงได้โดย
-iwspentry.

-iwspentry word_entry_string
ระบุรายการคำที่จะเพิ่มโดย -iwspword. (ค่าเริ่มต้น: " [sp] sp
sp")

- Sepnum จำนวน
จำนวนคำที่มีความถี่สูงที่จะแยกจากต้นไม้พจนานุกรมเพื่อความสะดวก
ข้อผิดพลาดในการประมาณที่อาจเกิดจากการประมาณที่ดีที่สุดครั้งเดียวในวันที่ 1
ผ่าน. (ค่าเริ่มต้น: 150)

ไวยากรณ์
สามารถระบุไวยากรณ์ได้หลายแบบโดยทำซ้ำ -กรัม และ -รายการไวยากรณ์. โปรดทราบว่าสิ่งนี้
เป็นพฤติกรรมที่ผิดปกติจากตัวเลือกอื่น ๆ (ในตัวเลือก Julius ปกติตัวสุดท้ายจะ
แทนที่ก่อนหน้านี้) คุณสามารถใช้ได้ -โนแกรม เพื่อรีเซ็ตไวยากรณ์แล้ว
ระบุไว้ก่อนจุด

-กรัม gramprefix1[,gramprefix2[,gramprefix3,...]]
รายการไวยากรณ์ที่จะใช้โดยคั่นด้วยเครื่องหมายจุลภาค อาร์กิวเมนต์ควรเป็นคำนำหน้าของ
ไวยากรณ์เช่นถ้าคุณมี ฟู.dfa และ ฟู.dictคุณควรระบุด้วย a
อาร์กิวเมนต์เดียว foo สามารถระบุไวยากรณ์ได้หลายแบบพร้อมกันเป็น a
รายการที่คั่นด้วยจุลภาค

-รายการไวยากรณ์ list_file
ระบุไฟล์รายการไวยากรณ์ที่มีรายการไวยากรณ์ที่จะใช้ รายการ
file ควรมีคำนำหน้าของไวยากรณ์ แต่ละรายการต่อบรรทัด เส้นทางสัมพัทธ์ใน
ไฟล์รายการจะถือว่าสัมพันธ์กับไฟล์ ไม่ใช่เส้นทางปัจจุบันหรือ
ไฟล์การกำหนดค่า

-dfa dfa_file -v dict_file
วิธีเก่าในการระบุไฟล์ไวยากรณ์แยกกัน นี่เป็นของปลอมและไม่ควร
นำไปใช้ได้อีก

-โนแกรม
ลบรายการไวยากรณ์ปัจจุบันที่ระบุโดย -กรัม, -รายการไวยากรณ์, -dfa
และ -v.

แยก word
สามารถระบุพจนานุกรมได้โดยใช้ -w และ -รายการ. เมื่อคุณระบุหลาย
ครั้งทั้งหมดจะถูกอ่านเมื่อเริ่มต้น คุณสามารถใช้ได้ -โนแกรม เพื่อรีเซ็ต
พจนานุกรมที่กำหนดไว้แล้ว ณ จุดนั้น

-w dict_file
พจนานุกรมคำศัพท์สำหรับการรู้จำคำศัพท์แบบแยกส่วน รูปแบบไฟล์เหมือนกับไฟล์อื่นๆ
แอลเอ็ม. (ฉบับที่.4.0)

-รายการ list_file
ระบุไฟล์รายการพจนานุกรมที่มีรายการพจนานุกรมที่จะใช้
ไฟล์รายการควรมีชื่อไฟล์ของพจนานุกรม แต่ละรายการต่อบรรทัด อา
เส้นทางสัมพัทธ์ในไฟล์รายการจะถือว่าสัมพันธ์กับไฟล์รายการ ไม่ใช่
เส้นทางปัจจุบันหรือไฟล์การกำหนดค่า (ฉบับที่.4.0)

-โนแกรม
ลบรายการพจนานุกรมปัจจุบันที่ระบุโดย -w และ -รายการ.

-wsil head_sil_model_name tail_sil_model_name sil_context_name
ในการจดจำคำแบบแยกส่วน โมเดลความเงียบจะถูกผนวกเข้ากับส่วนหัวและ
หางของแต่ละคำที่รับรู้ ตัวเลือกนี้ระบุรุ่นเงียบที่จะ
ต่อท้าย sil_context_name เป็นชื่อรุ่นหัวซิลและรุ่นซิลหาง
เป็นบริบทของโทรศัพท์คำและโทรศัพท์หาง ตัวอย่างเช่น หากคุณระบุ
-wsil silB silE sp คำที่มีลำดับโทรศัพท์ b eh t จะถูกแปลเป็น silB
sp-b+eh b-eh+t eh-t+sp ไซล์ (ฉบับที่.4.0)

ที่ผู้ใช้กำหนด LM
-ผู้ใช้
ประกาศใช้ฟังก์ชัน LM ของผู้ใช้ในโปรแกรม ควรระบุตัวเลือกนี้
หากคุณใช้ฟังก์ชัน LM ที่ผู้ใช้กำหนด (ฉบับที่.4.0)

misc LM ตัวเลือก
-บังคับ
ข้ามคำที่ผิดพลาดในพจนานุกรมและบังคับให้ทำงาน

อะคูสติก แบบ และ ลักษณะ การวิเคราะห์ (-เช้า) (-AM_GMM)
ส่วนนี้เกี่ยวกับตัวเลือกสำหรับรุ่นอะคูสติก การแยกคุณลักษณะ คุณลักษณะ
การทำให้เป็นมาตรฐานและการลบสเปกตรัม

หลังชื่อ -AM ควรเขียนโมเดลอะคูสติกและข้อกำหนดที่เกี่ยวข้อง คุณสามารถใช้ได้
AM หลายตัวได้รับการฝึกฝนด้วย MFCC ประเภทต่างๆ สำหรับ GMM เงื่อนไขพารามิเตอร์ที่จำเป็น
ควรระบุเช่นเดียวกับ AM หลังจาก -AM_GMM.

เมื่อใช้ AM หลายตัว ค่าของ -smpระยะเวลา, -smpFreq, -ขนาด และ - เปลี่ยนเกียร์ ควรจะเป็น
เหมือนกันในบรรดา AM ทั้งหมด

อะคูสติก อืม
-h อืมdef_file
ไฟล์คำจำกัดความ Acoustic HMM ควรอยู่ในรูปแบบ HTK ascii หรือ Julius binary
รูปแบบ. คุณสามารถแปลงรูปแบบ HTK ascii เป็นรูปแบบไบนารี Julius โดยใช้ mkbinhmm

-รายการ อืมlist_file
ไฟล์ HMMList สำหรับการแมปโทรศัพท์ ไฟล์นี้มีการจับคู่ระหว่างตรรกะ
ชื่อ triphone ที่สร้างขึ้นในพจนานุกรมและชื่อ HMM ที่กำหนดไว้ใน hmmdefs
ควรระบุตัวเลือกนี้สำหรับโมเดลที่ขึ้นกับบริบท

-tmix จำนวน
ระบุจำนวน Gaussians อันดับต้น ๆ ที่จะคำนวณในสมุดรหัสผสม
ตัวเลขขนาดเล็กจะเพิ่มความเร็วในการคำนวณเสียง แต่ความแม่นยำของ AM อาจได้รับ
แย่ลงด้วยมูลค่าที่น้อยเกินไป ดูสิ่งนี้ด้วย -gprune. (ค่าเริ่มต้น: 2)

-spmodel ชื่อ
ระบุชื่อรุ่น HMM ที่สอดคล้องกับการหยุดชั่วคราวในคำพูด ดิ
ชื่อรุ่นการหยุดชั่วขณะสั้น ๆ จะถูกใช้ในการจดจำ: หยุดชั่วขณะข้ามบน
การจดจำไวยากรณ์ การแทรกรูปแบบการหยุดชั่วขณะสิ้นสุดคำด้วย -iwsp บน N-gram,
หรือแบ่งช่วงสั้นๆ (-spsegment). (ค่าเริ่มต้น: "sp")

-หลายทาง
เปิดใช้งานโหมดหลายเส้นทาง เพื่อให้ถอดรหัสเร็วขึ้น Julius โดยค่าเริ่มต้นจะกำหนด a
จำกัดการเปลี่ยนผ่าน HMM ที่แต่ละรุ่นควรมีเพียงหนึ่งการเปลี่ยนแปลงจาก
สถานะเริ่มต้นและสถานะสิ้นสุด ในโหมดหลายเส้นทาง Julius จัดการพิเศษ
เกี่ยวกับการเปลี่ยนระหว่างแบบจำลองเพื่ออนุญาตให้ข้ามแบบจำลองและการเปลี่ยนแปลงหลายรายการ
การเปลี่ยนเอาต์พุต/อินพุต โปรดทราบว่าการระบุตัวเลือกนี้จะทำให้ Julius a
ช้าลงเล็กน้อยและอาจต้องใช้ความกว้างของลำแสงที่ใหญ่ขึ้น

ฟังก์ชันนี้เป็นตัวเลือกเวลารวบรวมใน Julius 3.x และตอนนี้กลายเป็น a
ตัวเลือกรันไทม์ ตามค่าเริ่มต้น (ไม่มีตัวเลือกนี้) จูเลียสจะตรวจสอบการเปลี่ยนแปลง
ประเภทของ HMM ที่ระบุ และเปิดใช้งานโหมด multi-path หากจำเป็น คุณสามารถ
บังคับโหมดหลายเส้นทางด้วยตัวเลือกนี้ (rev.4.0)

-gprune {ปลอดภัย|ฮิวริสติก|บีม|ไม่มี|ค่าเริ่มต้น}
ตั้งค่าอัลกอริธึมการตัดแต่งกิ่งแบบเกาส์เซียนที่จะใช้ สำหรับรุ่นมัดรวม จูเลียสดำเนินการ
การตัดแต่งกิ่งแบบเกาส์เซียนเพื่อลดการคำนวณทางเสียงโดยการคำนวณเฉพาะยอดN
Gaussians ในแต่ละ codebook ในแต่ละเฟรม การตั้งค่าเริ่มต้นจะถูกตั้งค่า
ตามประเภทรุ่นและการตั้งค่าเครื่องยนต์ ค่าเริ่มต้นจะบังคับให้ยอมรับ
การตั้งค่าเริ่มต้น ตั้งค่านี้เป็น none เพื่อปิดใช้งานการตัดแต่งกิ่งและดำเนินการอย่างเต็มที่
การคำนวณ ปลอดภัยรับประกัน N Gaussians อันดับต้น ๆ ที่จะคำนวณ ฮิวริสติกและ
ลำแสงช่วยลดต้นทุนการคำนวณเชิงรุกมากขึ้น แต่อาจส่งผลให้มีขนาดเล็ก
แบบจำลองการสูญเสียความแม่นยำ (ค่าเริ่มต้น: ปลอดภัย (มาตรฐาน), บีม (เร็ว) สำหรับส่วนผสมที่ผูกไว้
รุ่นไม่มีสำหรับรุ่นไม่ผูก)

-iwcd1 {สูงสุด|เฉลี่ย|จำนวนที่ดีที่สุด}
เลือกวิธีการประมาณไตรโฟนระหว่างคำที่ส่วนหัวและส่วนท้ายของคำ
ในรอบแรก

max จะใช้โอกาสสูงสุดของ triphones บริบทเดียวกัน เฉลี่ย
ใช้โอกาสเฉลี่ยของไตรโฟนบริบทเดียวกัน หมายเลขที่ดีที่สุดจะ
ใช้ค่าเฉลี่ยของแนวโน้มที่ดีที่สุดของ N ของ triphone บริบทเดียวกัน

ค่าเริ่มต้นคือ 3 ที่ดีที่สุดสำหรับใช้กับ N-gram และเฉลี่ยสำหรับไวยากรณ์และคำ เมื่อสิ่งนี้
AM ใช้ร่วมกันโดย LM ทั้งสองประเภท โดยจะเลือกอย่างหลัง

-iwspenalty ลอย
บทลงโทษสำหรับการหยุดชั่วคราวสั้นๆ สิ้นสุดคำต่อท้ายโดย -iwsp.

-gshmm อืมdef_file
หากระบุตัวเลือกนี้ Julius จะทำการเลือกส่วนผสมแบบเกาส์เซียนสำหรับ
การถอดรหัสที่มีประสิทธิภาพ hmmdefs ควรเป็นรุ่นโมโนโฟนที่สร้างจาก an
รุ่น HMM โมโนโฟนธรรมดาโดยใช้ mkgshmm

-gsnum จำนวน
บน GMS ระบุจำนวนสถานะโมโนโฟนเพื่อคำนวณ Triphone ที่สอดคล้องกันใน
รายละเอียด. (ค่าเริ่มต้น: 24)

การพูด การวิเคราะห์
รองรับเฉพาะการแยกคุณลักษณะ MFCC ใน Julius ปัจจุบัน ดังนั้นเมื่อรับรู้
อินพุตรูปคลื่นจากไฟล์หรือไมโครโฟน AM ต้องได้รับการฝึกอบรมจาก MFCC พารามิเตอร์
ควรกำหนดเงื่อนไขให้เหมือนกับเงื่อนไขการฝึกโดย
ตัวเลือกด้านล่าง

เมื่อคุณป้อนข้อมูลในไฟล์พารามิเตอร์ HTK คุณสามารถใช้พารามิเตอร์ใดก็ได้สำหรับ
เช้า. ในกรณีนี้ Julius ไม่สนใจเกี่ยวกับประเภทของคุณสมบัติอินพุตและ AM เพียง
อ่านเป็นลำดับเวกเตอร์และจับคู่กับ AM ที่กำหนด จูเลียสตรวจสอบเท่านั้น
ไม่ว่าประเภทพารามิเตอร์จะเหมือนกันหรือไม่ หากใช้งานไม่ได้ คุณสามารถปิดการใช้งานได้
การตรวจสอบนี้โดย -notypecheck.

ใน Julius ชนิดพารามิเตอร์และตัวระบุ (เช่น TARGETKIND ใน HTK) และตัวเลข
ของพารามิเตอร์ cepstral (NUMCEPS) จะถูกตั้งค่าโดยอัตโนมัติจากเนื้อหาของ
ส่วนหัว AM ดังนั้นคุณไม่จำเป็นต้องระบุตามตัวเลือก

ควรตั้งค่าพารามิเตอร์อื่นๆ ให้เหมือนกับเงื่อนไขการฝึกทุกประการ นอกจากนี้คุณยังสามารถ
ให้ไฟล์ HTK Config ที่คุณใช้ฝึก AM ถึง Julius โดย -htkconf. เมื่อเป็นเช่นนี้
ใช้ตัวเลือก Julius จะแยกวิเคราะห์ไฟล์ Config และตั้งค่าพารามิเตอร์ที่เหมาะสม

คุณสามารถฝังการตั้งค่าพารามิเตอร์การวิเคราะห์เหล่านั้นเพิ่มเติมลงในไฟล์ HMM แบบไบนารีได้โดยใช้
กินบินหืม.

หากระบุตัวเลือกได้หลายวิธี จะพิจารณาตามลำดับด้านล่าง
พารามิเตอร์ฝังตัว AM จะถูกโหลดก่อน หากมี จากนั้น ไฟล์กำหนดค่า HTK
มอบให้โดย -htkconf จะถูกแยกวิเคราะห์ หากค่าที่ตั้งไว้แล้วโดยค่าฝัง AM HTK
config จะแทนที่พวกเขา ในที่สุดตัวเลือกโดยตรงจะถูกโหลดซึ่งจะ
แทนที่การตั้งค่าที่โหลดมาก่อน โปรดทราบว่าเมื่อระบุตัวเลือกเดียวกัน
หลายครั้ง ภายหลังจะแทนที่ก่อนหน้า ยกเว้นว่า -htkconf จะได้รับการประเมิน
ครั้งแรกตามที่อธิบายไว้ข้างต้น

-smpระยะเวลา ระยะเวลา
ระยะเวลาสุ่มตัวอย่างคำพูดอินพุต ในหน่วย 100 นาโนวินาที อัตราการสุ่มตัวอย่างสามารถ
ยังระบุโดย -smpFreq. โปรดทราบว่าความถี่อินพุตควรเป็น
กำหนดให้เท่ากับเงื่อนไขการฝึกของ AM (ค่าเริ่มต้น: 625 สอดคล้องกับ
16,000Hz)

ตัวเลือกนี้สอดคล้องกับ HTK Option SOURCERATE ค่าเดียวกันสามารถเป็น
ให้กับตัวเลือกนี้

เมื่อใช้ AM หลายตัว ค่านี้ควรเหมือนกันในบรรดา AM ทั้งหมด

-smpFreq Hz
ตั้งค่าความถี่สุ่มตัวอย่างคำพูดอินพุตเป็น Hz อัตราการสุ่มตัวอย่างยังสามารถเป็น
ระบุโดยใช้ -smpระยะเวลา. โปรดทราบว่าความถี่นี้ควรตั้งให้เท่ากัน
ตามเงื่อนไขการฝึกของ AM (ค่าเริ่มต้น: 16,000)

เมื่อใช้ AM หลายตัว ค่านี้ควรเหมือนกันในบรรดา AM ทั้งหมด

-ขนาด ตัวอย่าง_num
ขนาดหน้าต่างในจำนวนตัวอย่าง (ค่าเริ่มต้น: 400)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK WINDOWSIZE แต่ค่าควรเป็น
ตัวอย่าง (ค่า HTK / smpPeriod)

เมื่อใช้ AM หลายตัว ค่านี้ควรเหมือนกันในบรรดา AM ทั้งหมด

- เปลี่ยนเกียร์ ตัวอย่าง_num
การเปลี่ยนเฟรมในจำนวนตัวอย่าง (ค่าเริ่มต้น: 160)

ตัวเลือกนี้สอดคล้องกับเป้าหมายตัวเลือก HTK แต่ค่าควรเป็น
ตัวอย่าง (ค่า HTK / smpPeriod)

เมื่อใช้ AM หลายตัว ค่านี้ควรเหมือนกันในบรรดา AM ทั้งหมด

-คำนำหน้า ลอย
ค่าสัมประสิทธิ์ก่อนเน้น (ค่าเริ่มต้น: 0.97)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK PREEMCOEF สามารถให้ค่าเท่ากันได้
ต่อตัวเลือกนี้

-fbank NUM
จำนวนช่องกรองธนาคาร (ค่าเริ่มต้น: 24)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK NUMCHANS สามารถให้ค่าเท่ากันได้
ต่อตัวเลือกนี้ โปรดทราบว่าค่าเริ่มต้นไม่เหมือนกับใน HTK (22)

-เซพลิฟ NUM
ค่าสัมประสิทธิ์การยกของช่องท้อง (ค่าเริ่มต้น: 22)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK CEPLIFTER สามารถให้ค่าเท่ากันได้
ต่อตัวเลือกนี้

-ราวี , -นรวี
เปิด/ปิดโดยใช้พลังงานดิบก่อนการเน้นล่วงหน้า (ค่าเริ่มต้น: ปิดใช้งาน)

ตัวเลือกนี้สอดคล้องกับ HTK Option RAWENERGY โปรดทราบว่าค่าเริ่มต้น
ค่าแตกต่างจาก HTK (เปิดใช้งานที่ HTK ปิดใช้งานที่ Julius)

-ผิดปกติ , -ไม่ปกติ
เปิด/ปิดการทำให้พลังงานบันทึกเป็นมาตรฐาน ในการป้อนข้อมูลสด การทำให้เป็นมาตรฐานนี้จะเป็น
ประมาณจากค่าเฉลี่ยของข้อมูลที่ป้อนล่าสุด (ค่าเริ่มต้น: ปิดการใช้งาน)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK ENORMALISE โปรดทราบว่าค่าเริ่มต้น
ค่าแตกต่างจาก HTK (เปิดใช้งานที่ HTK ปิดใช้งานที่ Julius)

-ขนาด float_scale
ตัวคูณสเกลของพลังงานบันทึกเมื่อทำให้พลังงานบันทึกเป็นมาตรฐาน (ค่าเริ่มต้น: 1.0)

ตัวเลือกนี้สอดคล้องกับ HTK Option ESCALE โปรดทราบว่าค่าเริ่มต้น
ค่าแตกต่างจาก HTK (0.1)

-พื้นสีเงิน ลอย
พลังงานปิดเสียงพื้นเป็น dB เมื่อปรับพลังงานบันทึกให้เป็นมาตรฐาน (ค่าเริ่มต้น: 50.0)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK SILFLOOR

-เดลวิน กรอบ
ขนาดหน้าต่างเดลต้าในจำนวนเฟรม (ค่าเริ่มต้น: 2)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK DELTAWINDOW ค่าเดียวกันสามารถเป็น
ให้กับตัวเลือกนี้

-แอควิน กรอบ
ขนาดหน้าต่างเร่งความเร็วในจำนวนเฟรม (ค่าเริ่มต้น: 2)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK ACCWINDOW สามารถให้ค่าเท่ากันได้
ต่อตัวเลือกนี้

-ความถี่สูง Hz
เปิดใช้งานการจำกัดแบนด์สำหรับการคำนวณธนาคารตัวกรอง MFCC: ตั้งค่าความถี่บน
ตัด ค่า -1 จะปิดการใช้งาน (ค่าเริ่มต้น: -1)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK HIFREQ ค่าเดียวกันสามารถมอบให้กับ
ตัวเลือกนี้

-lofreq Hz
เปิดใช้งานการจำกัดแบนด์สำหรับการคำนวณ MFCC filterbank: ตั้งค่าความถี่ที่ต่ำกว่า
ตัด ค่า -1 จะปิดการใช้งาน (ค่าเริ่มต้น: -1)

ตัวเลือกนี้สอดคล้องกับตัวเลือก HTK LOFREQ ค่าเดียวกันสามารถมอบให้กับ
ตัวเลือกนี้

-zmeanframe , -nozmeanframe
ด้วยการป้อนข้อมูลด้วยคำพูด ตัวเลือกนี้จะเปิดใช้งาน/ปิดใช้งานการลบ DC offset แบบ frame-wise
ซึ่งสอดคล้องกับการกำหนดค่า HTK ZMEANSOURCE ใช้ร่วมกันไม่ได้
กับ -zmean. (ค่าเริ่มต้น: ปิดการใช้งาน)

- ใช้พลังงาน
ใช้กำลังแทนขนาดในการวิเคราะห์ช่องกรอง (ค่าเริ่มต้น: ปิดการใช้งาน)

normalization
Julius สามารถทำ cepsralmean normalization (CMN) สำหรับอินพุตได้ CMN จะเป็น
เปิดใช้งานเมื่อ AM ที่กำหนดได้รับการฝึกอบรมด้วย CMN (เช่นมีตัวระบุ "_Z" ใน
หัวข้อ).

ค่าเฉลี่ยของช่องท้องจะถูกประมาณด้วยวิธีที่แตกต่างกันไปตามประเภทอินพุต
ที่อินพุตไฟล์ ค่าเฉลี่ยจะถูกคำนวณจากอินพุตทั้งหมด บนอินพุตสดเช่น
ในฐานะไมโครโฟนและอินพุตเครือข่าย ค่าเฉลี่ย ceptral ของอินพุตไม่เป็นที่รู้จักที่
เริ่ม. ดังนั้นจะใช้ MAP-CMN บน MAP-CMN จะใช้เวกเตอร์ค่าเฉลี่ยเริ่มต้น
ในตอนเริ่มต้น และเวกเตอร์เฉลี่ยจะถูกทาเป็นค่าเฉลี่ยของ
การเพิ่มเวกเตอร์อินพุตเมื่ออินพุตดำเนินไป ตัวเลือกด้านล่างสามารถควบคุมพฤติกรรมของ
แผนที่-CMN.

-cvn
เปิดใช้งานการปรับให้เป็นมาตรฐานของความแปรปรวนของสมอง ที่อินพุตไฟล์ ความแปรปรวนของทั้งหมด
อินพุตจะถูกคำนวณและนำไปใช้ ที่การป้อนไมโครโฟนสด ความแปรปรวนของ
อินพุตสุดท้ายจะถูกนำไปใช้ รองรับ CVN สำหรับอินพุตเสียงเท่านั้น

-vtln แอลฟา เตี้ย สะกิด
ทำการแปรปรวนของความถี่ โดยทั่วไปแล้วสำหรับการปรับความยาวช่องเสียงให้เป็นปกติ (VTLN)
อาร์กิวเมนต์เป็นปัจจัยแปรปรวน คัทออฟความถี่สูงและความถี่ต่ำ ตัด พวกเขา
สอดคล้องกับค่าการกำหนดค่า HTK, WARPFREQ, WARPHCUTOFF และ WARPLCUTOFF

-cmnโหลด ไฟล์
โหลดเวกเตอร์ค่าเฉลี่ย cepstral เริ่มต้นจากไฟล์เมื่อเริ่มต้น ดิ ไฟล์ ควรจะเป็นหนึ่ง
บันทึกโดย -cmnsave. การโหลดค่าเฉลี่ยของช่องท้องช่วยให้จูเลียสดีขึ้น
รับรู้คำพูดแรกในการป้อนข้อมูลแบบเรียลไทม์ เมื่อใช้ร่วมกับ
-cmnnoupdateค่าเริ่มต้นนี้จะใช้สำหรับอินพุตทั้งหมด

-cmnsave ไฟล์
บันทึกเวกเตอร์ค่าเฉลี่ยของสมองที่คำนวณแล้วลงใน ไฟล์. พารามิเตอร์จะถูกบันทึกไว้
ที่ปลายอินพุตแต่ละอัน หากมีไฟล์เอาต์พุตอยู่แล้ว ไฟล์นั้นจะถูกแทนที่

-cmnupdate -cmnnoupdate
ควบคุมว่าจะอัปเดตค่าเฉลี่ยของ cepstral ที่อินพุตแต่ละรายการในอินพุตแบบเรียลไทม์หรือไม่
ปิดการใช้งานนี้และระบุ -cmnโหลด จะทำให้เครื่องยนต์ใช้งานได้ตลอด
ค่าเฉลี่ยของ cepstral เริ่มต้นแบบสถิต

-cmmapweight ลอย
ระบุน้ำหนักของค่าเฉลี่ยเซ็ปทรัลเริ่มต้นสำหรับ MAP-CMN ระบุค่าที่มากขึ้นเพื่อ
รักษาค่าเฉลี่ยของ cepstral เริ่มต้นไว้เป็นระยะเวลานานและมีค่าน้อยกว่าเพื่อสร้าง
ค่าเฉลี่ยของ cepstral ขึ้นอยู่กับอินพุตปัจจุบันมากขึ้น (ค่าเริ่มต้น: 100.0)

Front-end การประมวลผล
Julius สามารถทำการลบสเปกตรัมเพื่อลดเสียงรบกวนจากเสียงได้
ป้อนข้อมูล. แม้ว่าจะไม่ใช่วิธีที่มีประสิทธิภาพ แต่อาจใช้ได้ผลในบางสถานการณ์
จูเลียสมีสองวิธีในการประมาณสเปกตรัมของสัญญาณรบกวน วิธีหนึ่งคือการสันนิษฐานว่าอย่างแรก
ส่วนสั้นของอินพุตเสียงพูดเป็นส่วนเสียง และประมาณสเปกตรัมเสียง
เป็นค่าเฉลี่ยของกลุ่ม อีกวิธีหนึ่งคือการคำนวณสเปกตรัมเฉลี่ยจาก
อินพุตเสียงเท่านั้นโดยใช้เครื่องมืออื่น mkss และโหลดใน Julius อดีตคือ
เป็นที่นิยมสำหรับการป้อนไฟล์คำพูดและควรใช้หลังในการป้อนข้อมูลสด ตัวเลือก
ด้านล่างจะสลับ/ควบคุมพฤติกรรม

-sscalc
ทำการลบสเปกตรัมโดยใช้ส่วนหัวของแต่ละไฟล์เป็นส่วนเงียบ ดิ
ความยาวของส่วนหัวควรระบุโดย -sscallen. ใช้ได้เฉพาะสำหรับการป้อนไฟล์
ขัดแย้งกับ -ssload.

-sscallen มิลลิวินาที
กับ -sscalc, ระบุความยาวของการปิดเสียงส่วนหัวสำหรับการประเมินสเปกตรัมเสียง
ในหน่วยมิลลิวินาที (ค่าเริ่มต้น: 300)

-ssload ไฟล์
ดำเนินการลบสเปกตรัมสำหรับการป้อนคำพูดโดยใช้สเปกตรัมเสียงที่ประเมินไว้ล่วงหน้า
โหลดจาก ไฟล์. ไฟล์คลื่นรบกวนสามารถทำได้โดย mkss ใช้ได้กับทุกคน
อินพุตคำพูด ขัดแย้งกับ -sscalc.

-สซัลฟา ลอย
ค่าสัมประสิทธิ์อัลฟาของการลบสเปกตรัมสำหรับ -sscalc และ -ssload. เสียงรบกวนจะ
ลบออกมากขึ้นเมื่อค่านี้ใหญ่ขึ้น แต่ผลลัพธ์จะบิดเบี้ยว
สัญญาณก็น่าทึ่งเช่นกัน (ค่าเริ่มต้น: 2.0)

-ssชั้น ลอย
ค่าสัมประสิทธิ์การปูพื้นของการลบสเปกตรัม พลังสเปกตรัมที่ไปด้านล่าง
ศูนย์หลังการลบจะถูกแทนที่ด้วยสัญญาณต้นทางด้วยสิ่งนี้
ค่าสัมประสิทธิ์คูณ (ค่าเริ่มต้น: 0.5)

misc AM ตัวเลือก
-htkconf ไฟล์
แยกวิเคราะห์ไฟล์ HTK Config ที่กำหนด และตั้งค่าพารามิเตอร์ที่เกี่ยวข้องเป็น Julius
เมื่อใช้ตัวเลือกนี้ ค่าพารามิเตอร์เริ่มต้นจะเปลี่ยนจาก Julius
ค่าเริ่มต้นเป็นค่าเริ่มต้น HTK

ได้รับการยอมรับ กระบวนการ และ ค้นหา (-ส)
ส่วนนี้ประกอบด้วยตัวเลือกสำหรับพารามิเตอร์การค้นหาในรอบที่ 1 / 2 เช่น beam
ความกว้างและน้ำหนัก LM, การกำหนดค่าสำหรับการแบ่งส่วนการหยุดชั่วคราว, สวิตช์สำหรับ word
เอาต์พุตแบบแลตทิซและเอาต์พุตของเครือข่ายที่สับสน การบังคับการจัดตำแหน่ง และตัวเลือกอื่นๆ ที่เกี่ยวข้อง
กระบวนการรับรู้และผลลัพธ์ที่ได้

ค่าเริ่มต้นสำหรับความกว้างของลำแสงและตุ้มน้ำหนัก LM จะเปลี่ยนไปตามการตั้งค่าเวลาคอมไพล์
ของ JuliusLib ประเภทรุ่น AM และขนาด LM โปรดดูบันทึกการเริ่มต้นใช้งานจริง
ค่า

1st ส่ง พารามิเตอร์
-lmp น้ำหนัก การลงโทษ
(N-gram) น้ำหนักแบบจำลองภาษาและบทลงโทษการแทรกคำสำหรับการผ่านครั้งแรก

-จุดโทษ1 การลงโทษ
(ไวยากรณ์) บทลงโทษการแทรกคำสำหรับการผ่านครั้งแรก (ค่าเริ่มต้น: 0.0)

-b ความกว้าง
ความกว้างของลำแสงในจำนวนโหนด HMM สำหรับอันดับบีมในการผ่านครั้งแรก ค่านี้
กำหนดความกว้างในการค้นหาในรอบที่ 1 และมีผลเหนือผลรวม
ระยะเวลาดำเนินการ. ความกว้างที่เล็กลงจะทำให้การถอดรหัสเร็วขึ้น แต่ค่าน้อยเกินไป
จะส่งผลให้เกิดข้อผิดพลาดในการรับรู้เพิ่มขึ้นอย่างมากเนื่องจากการค้นหา
ความล้มเหลว. ค่าที่มากขึ้นจะทำให้การค้นหามีเสถียรภาพและจะนำไปสู่การปราศจากข้อผิดพลาด
ค้นหา แต่เวลาในการประมวลผลจะเพิ่มขึ้นตามสัดส่วนของความกว้าง

ค่าเริ่มต้นขึ้นอยู่กับประเภทรุ่นอะคูสติก: 400 (โมโนโฟน), 800
(โทรศัพท์สามเครื่อง) หรือ 1000 (โทรศัพท์สามเครื่อง การตั้งค่า=v2.1)

-ไม่จำกัด NUM
ขีดจำกัดสูงสุดของโทเค็นต่อโหนด ตัวเลือกนี้ใช้ได้เมื่อ --enable-wpair และ
--enable-wpair-nlimit ถูกเปิดใช้งานในเวลารวบรวม

-progout
เปิดใช้งานเอาต์พุตแบบโปรเกรสซีฟของผลลัพธ์บางส่วนในการผ่านครั้งแรก

-ระยะเริ่มต้น มิลลิวินาที
ตั้งช่วงเวลาสำหรับ -progout ในหน่วยมิลลิวินาที (ค่าเริ่มต้น: 300)

2nd ส่ง พารามิเตอร์
-lmp2 น้ำหนัก การลงโทษ
(N-gram) น้ำหนักแบบจำลองภาษาและบทลงโทษการแทรกคำสำหรับวินาที
ผ่านไป

-จุดโทษ2 การลงโทษ
(ไวยากรณ์) บทลงโทษการแทรกคำสำหรับรอบที่สอง (ค่าเริ่มต้น: 0.0)

-b2 ความกว้าง
ความกว้างของลำแสงซองจดหมาย (จำนวนสมมติฐาน) ในรอบที่สอง ถ้านับ
การขยายคำที่ความยาวสมมติฐานหนึ่งถึงขีดจำกัดนี้ขณะค้นหา
สมมติฐานที่สั้นกว่าจะไม่ถูกขยายเพิ่มเติม สิ่งนี้จะป้องกันไม่ให้การค้นหาตกอยู่ใน
สถานการณ์กว้างเหมือนก่อนซ้อนในตำแหน่งเดียวกันและปรับปรุงการค้นหา
ความล้มเหลวส่วนใหญ่สำหรับเงื่อนไขคำศัพท์ขนาดใหญ่ (ค่าเริ่มต้น: 30)

-ส ลอย
ความกว้างของซองให้คะแนนสำหรับการให้คะแนนแบบซอง เมื่อคำนวณคะแนนสมมติฐาน
สำหรับแต่ละสมมติฐานที่สร้างขึ้น การขยายโครงสร้างบังตาที่เป็นช่อง และการดำเนินการของ Viterbi จะ
ถูกตัดตรงกลางของคำพูดถ้าคะแนนบนเฟรมต่ำกว่าความกว้าง
การให้ค่าเล็กน้อยทำให้การผ่านครั้งที่สองเร็วขึ้น แต่อาจเกิดข้อผิดพลาดในการคำนวณ
เกิดขึ้น. (ค่าเริ่มต้น: 80.0)

-s NUM
ขนาดสแต็ก คือ จำนวนสูงสุดของสมมติฐานที่สามารถเก็บไว้ใน
กองซ้อนระหว่างการค้นหา ค่าที่มากขึ้นอาจให้ผลลัพธ์ที่เสถียรกว่า แต่
เพิ่มจำนวนหน่วยความจำที่ต้องการ (ค่าเริ่มต้น: 500)

-m นับ
จำนวนสมมติฐานเพิ่มเติมที่จำเป็นในการยุติการค้นหา ถ้าตัวเลข
ของสมมติฐานที่ขยายออกมานั้นมากกว่าเกณฑ์นี้ ดังนั้นการค้นหาคือ
หยุดอยู่ ณ จุดนั้น ยิ่งค่านี้มากเท่าไหร่ จูเลียสก็ยิ่งนานขึ้นเท่านั้น
ละทิ้งการค้นหา (ค่าเริ่มต้น: 2000)

-n NUM
จำนวนผู้สมัครที่จูเลียสพยายามหา การค้นหาดำเนินต่อไปจนถึงสิ่งนี้
พบจำนวนสมมติฐานประโยคแล้ว สมมติฐานประโยคที่ได้รับ
จะถูกจัดเรียงตามคะแนน และผลลัพธ์สุดท้ายจะแสดงตามลำดับ (ดูเพิ่มเติมที่
-เอาต์พุต). ความเป็นไปได้ที่จะพบสมมติฐานที่เหมาะสมที่สุด
เพิ่มขึ้นเมื่อค่านี้เพิ่มขึ้น แต่เวลาในการประมวลผลก็จะกลายเป็น
อีกต่อไป ค่าเริ่มต้นขึ้นอยู่กับการตั้งค่าเครื่องยนต์ในเวลารวบรวม: 10
(มาตรฐาน) หรือ 1 (เร็วหรือ v2.1)

-เอาต์พุต NUM
สมมติฐาน N ประโยคด้านบนที่จะส่งออกเมื่อสิ้นสุดการค้นหา ใช้กับ -n
(ค่าเริ่มต้น: 1)

-lookuprange กรอบ
กำหนดจำนวนเฟรมก่อนและหลังเพื่อค้นหาสมมติฐานคำถัดไปใน
โครงสร้างบังตาที่เป็นช่องคำในรอบที่สอง ซึ่งจะป้องกันการละเว้นคำสั้น ๆ แต่
ด้วยมูลค่าที่มาก จำนวนสมมติฐานที่ขยายเพิ่มขึ้นและระบบ
กลายเป็นช้า (ค่าเริ่มต้น: 5)

-มองเทรลลิส
(ไวยากรณ์) ขยายเฉพาะคำที่รอดตายในรอบแรกแทนที่จะขยาย
ทุกคำทำนายโดยไวยากรณ์ ตัวเลือกนี้ทำการถอดรหัสรอบที่สอง
ได้เร็วกว่าโดยเฉพาะคำศัพท์ขนาดใหญ่แต่อาจเพิ่มการลบ
ข้อผิดพลาดของคำสั้น ๆ (ค่าเริ่มต้น: ปิดการใช้งาน)

หยุดชั่วคราว การแบ่งส่วน / ตัวถอดรหัส-VAD
เมื่อคอมไพล์ด้วย --enable-decoder-vad การแบ่งส่วนแบบหยุดชั่วคราวจะเป็น
ขยายเพื่อรองรับ VAD ที่ใช้ตัวถอดรหัส

-spsegment
เปิดใช้งานโหมดการแบ่งส่วนการหยุดชั่วคราว อินพุตจะถูกแบ่งส่วนเมื่อหยุดชั่วคราวสั้น ๆ
คำ (คำที่มีรูปแบบเสียงเพียงอย่างเดียวในการออกเสียง) มีโอกาสมากที่สุด
ที่เฟรมต่อเนื่องกันในการผ่านครั้งแรก เมื่อตรวจพบส่วนสิ้นสุด
จูเลียสหยุดรอบที่ 1 ที่จุด ดำเนินการรอบที่ 2 และดำเนินการต่อไป
ส่วน บริบทของคำจะถูกพิจารณาในกลุ่มต่างๆ (ฉบับที่.4.0)

เมื่อคอมไพล์ด้วย --enable-decoder-vad ตัวเลือกนี้จะเปิดใช้งาน VAD ที่ใช้ตัวถอดรหัส
เพื่อข้ามความเงียบที่ยาวนาน

-spdur กรอบ
ระยะเวลาหยุดชั่วคราวสั้น ๆ เพื่อตรวจจับจุดสิ้นสุดของส่วนอินพุตในจำนวนเฟรม
(ค่าเริ่มต้น: 10)

-หยุดโมเดลชั่วคราว เชือก
รายการที่คั่นด้วยเครื่องหมายจุลภาคของชื่อรุ่นหยุดชั่วคราวที่จะใช้ในการหยุดชั่วคราว
การแบ่งส่วน คำที่ออกเสียงประกอบด้วยเฉพาะตัวแบบหยุดชั่วคราว
จะถือว่าเป็น "คำหยุดชั่วคราว" และใช้สำหรับการตรวจจับการหยุดชั่วคราว หากไม่ระบุ
ชื่อของ -spmodel, -ซิลเฮด และ -ซิลเทล จะถูกนำไปใช้. (ฉบับที่.4.0)

-spmargin กรอบ
ระยะขอบด้านหลังที่ทริกเกอร์ขึ้นสำหรับ VAD ที่ใช้ตัวถอดรหัส เมื่อพูดขึ้นทริกเกอร์
พบโดยตัวถอดรหัส-VAD จูเลียสจะกรอกลับพารามิเตอร์อินพุตด้วยค่านี้และ
เริ่มการรับรู้ที่จุด (ฉบับที่.4.0)

ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อคอมไพล์ด้วย --enable-decoder-vad

- ความล่าช้า กรอบ
ทริกเกอร์เฟรมความล่าช้าในการตัดสินใจเมื่อทริกเกอร์ขึ้นสำหรับ VAD ที่ใช้ตัวถอดรหัส (ฉบับที่.4.0)

ตัวเลือกนี้จะใช้ได้ก็ต่อเมื่อคอมไพล์ด้วย --enable-decoder-vad

คำ ขัดแตะ / ความสับสน เครือข่าย เอาท์พุต
- ตาข่าย , -โนแลตติซ
เปิด / ปิดการสร้างกราฟคำ อัลกอริธึมการค้นหาก็เปลี่ยนเป็น
ปรับให้เหมาะสมสำหรับการสร้างกราฟคำที่ดีขึ้น ดังนั้นผลลัพธ์ของประโยคอาจไม่เป็น
เช่นเดียวกับการจดจำ N-best ปกติ (ฉบับที่.4.0)

-confnet , -noconfnet
เปิด / ปิดการสร้างเครือข่ายความสับสน การเปิดใช้งานนี้จะยัง
เปิดใช้งาน - ตาข่าย ภายใน (ฉบับที่.4.0)

-กราฟเรนจ์ กรอบ
รวมคำเดียวกันที่ตำแหน่งเพื่อนบ้านในการสร้างกราฟ ถ้าเวลาเริ่มต้น
และเวลาสิ้นสุดของผู้สมัครสองคำที่มีคำเดียวกันอยู่ภายในที่กำหนด
ช่วงนั้นจะถูกรวมเข้าด้วยกัน ค่าเริ่มต้นคือ 0 (อนุญาตให้รวมคำเดียวกันบน
ตำแหน่งเดียวกันทุกประการ) และการระบุค่าที่มากขึ้นจะทำให้ค่าน้อยลง
เอาต์พุตกราฟ การตั้งค่านี้เป็น -1 จะปิดใช้งานการผสาน ในกรณีนี้ เหมือนกัน
คำในตำแหน่งเดียวกันของคะแนนที่แตกต่างกันจะถูกทิ้งไว้ตามที่เป็นอยู่
(ค่าเริ่มต้น: 0)

-กราฟคัท ความลึก
ตัดกราฟผลลัพธ์ตามความลึกของคำในขั้นตอนหลังการประมวลผล ความลึก
value คือจำนวนคำที่อนุญาตในเฟรม การตั้งค่าเป็น -1 ปิดการใช้งาน
คุณลักษณะนี้ (ค่าเริ่มต้น: 80)

-graphboundloop นับ
จำกัดจำนวนลูปการปรับขอบเขตในขั้นตอนหลังการประมวลผล นี้
พารามิเตอร์ป้องกัน Julius จากการบล็อกโดยลูปการปรับแบบอนันต์โดยย่อ
การสั่นของคำ (ค่าเริ่มต้น: 20)

- ความล่าช้าในการค้นหากราฟ , -nographsearchdelay
เมื่อเปิดใช้งานตัวเลือกนี้ Julius จะแก้ไขอัลกอริทึมการสร้างกราฟใน
ครั้งที่ 2 ไม่ยุติการค้นหาด้วยการรวมกราฟจนครบประโยคแรก
พบผู้สมัครแล้ว ตัวเลือกนี้อาจปรับปรุงความแม่นยำของกราฟ โดยเฉพาะเมื่อคุณ
จะสร้างกราฟคำขนาดใหญ่โดยการตั้งค่าการค้นหาแบบกว้างๆ กล่าวคืออาจ
ส่งผลให้กราฟแม่นยำขึ้นเมื่อตั้งคานกว้างทั้งรอบแรก -b และ
รอบที่ 2 -b2และจำนวนมากสำหรับ -n. (ค่าเริ่มต้น: ปิดการใช้งาน)

หลายกรัม / หลายลูกเต๋า การรับรู้
-มัลติแกรมเอาท์ , -nomultigramout
ในการจดจำไวยากรณ์โดยใช้หลายไวยากรณ์ Julius จะแสดงเฉพาะสิ่งที่ดีที่สุด
ผลในหมู่ไวยากรณ์ทั้งหมด การเปิดใช้งานตัวเลือกนี้จะทำให้ Julius ส่งออก
ผลลัพธ์สำหรับแต่ละไวยากรณ์ (ค่าเริ่มต้น: ปิดการใช้งาน)

ถูกบังคับ การวางแนว
-walign
ทำการจัดตำแหน่ง viterbi ต่อหน่วยคำสำหรับผลการจดจำ คำ
ขอบเขตเฟรมและคะแนนเสียงเฉลี่ยต่อเฟรมจะถูกคำนวณ

- จัดตำแหน่ง
ทำการจัดตำแหน่ง viterbi ต่อหน่วยโทรศัพท์สำหรับผลการจดจำ โทรศัพท์
ขอบเขตเฟรมและคะแนนเสียงเฉลี่ยต่อเฟรมจะถูกคำนวณ

-สไลน์
ทำการจัดตำแหน่ง viterbi ต่อรัฐสำหรับผลการรับรู้ พรมแดนของรัฐ
เฟรมและคะแนนเสียงเฉลี่ยต่อเฟรมจะถูกคำนวณ

misc ค้นหา ตัวเลือก
-ไม่ใช้งาน
เริ่มอินสแตนซ์กระบวนการรับรู้นี้ด้วยสถานะที่ไม่ใช้งาน (ฉบับที่.4.0)

-1 ผ่าน
ดำเนินการเฉพาะรอบแรกเท่านั้น

-fallback1pass
เมื่อผ่าน 2nd ล้มเหลว Julius เสร็จสิ้นการจดจำโดยไม่มีผลลัพธ์ ตัวเลือกนี้
บอก Julius ให้ส่งออกผลการผ่านครั้งแรกเป็นผลสุดท้ายเมื่อรอบที่ 1
ล้มเหลว โปรดทราบว่าการออกคะแนนบางส่วน (ความมั่นใจ ฯลฯ) อาจไม่เป็นประโยชน์ นี้คือ
พฤติกรรมเริ่มต้นของ Julius-3.x

-no_ccd , -force_ccd
สลับการจัดการบริบทของโทรศัพท์อย่างชัดเจนเมื่อค้นหา โดยปกติจูเลียสจะกำหนด
ไม่ว่าการใช้ AM จะเป็นแบบจำลองตามบริบทหรือไม่ก็ตามจากชื่อรุ่น
กล่าวคือ ชื่อมีอักขระ + และ - หรือไม่ ตัวเลือกนี้จะแทนที่
การตรวจจับอัตโนมัติ

-ซีมัลฟา ลอย
พารามิเตอร์การปรับให้เรียบสำหรับการให้คะแนนความมั่นใจ (ค่าเริ่มต้น: 0.05)

-iwsp
(โหมดหลายพาธเท่านั้น) เปิดใช้งานการแทรกการหยุดชั่วคราวสั้นๆ แบบไม่มีบริบทระหว่างคำ
ตัวเลือกนี้จะเพิ่มรูปแบบการหยุดชั่วคราวสั้นๆ ที่ข้ามได้ต่อท้ายทุกคำที่ลงท้ายด้วย ดิ
สามารถกำหนดรูปแบบการหยุดชั่วคราวโดย -spmodel.

-ทรานส์ ลอย
บทลงโทษสำหรับการแทรกเพิ่มเติมสำหรับคำที่โปร่งใส (ค่าเริ่มต้น: 0.0)

-การสาธิต
เทียบเท่ากับ -progout -เงียบ.

และพวกเรา ตัวแปร


อัลซาเดฟ
(โดยใช้อินพุตไมโครโฟนกับอุปกรณ์ alsa) ระบุชื่ออุปกรณ์จับภาพ หากไม่ระบุ
จะใช้ "ค่าเริ่มต้น"

เครื่องเสียง
(โดยใช้อินพุตไมโครโฟนกับอุปกรณ์ oss) ระบุเส้นทางของอุปกรณ์จับภาพ หากไม่ระบุ
"/dev/dsp" จะถูกนำไปใช้.

LATENCY_MSEC
ลองตั้งค่าเวลาแฝงอินพุตของอินพุตไมโครโฟนเป็นมิลลิวินาที มูลค่าที่น้อยกว่าจะ
ทำให้เวลาแฝงสั้นลง แต่บางครั้งทำให้กระบวนการไม่เสถียร ค่าเริ่มต้นจะขึ้นอยู่กับ
รันระบบปฏิบัติการ

ตัวอย่าง


สำหรับตัวอย่างการใช้งานระบบ โปรดดูส่วนการสอนในเอกสาร Julius

ข้อสังเกต


หมายเหตุเกี่ยวกับไฟล์ jconf: พาธสัมพัทธ์ในไฟล์ jconf ถูกตีความว่าสัมพันธ์กับ
jconf เอง ไม่ใช่ไดเร็กทอรีปัจจุบัน

ใช้จูเลียสออนไลน์โดยใช้บริการ onworks.net


เซิร์ฟเวอร์และเวิร์กสเตชันฟรี

ดาวน์โหลดแอพ Windows & Linux

  • 1
    Firebird
    Firebird
    Firebird RDBMS นำเสนอคุณสมบัติ ANSI SQL
    & ทำงานบน Linux, Windows &
    หลายแพลตฟอร์ม Unix คุณสมบัติ
    การทำงานพร้อมกันและประสิทธิภาพที่ยอดเยี่ยม
    & พลัง...
    ดาวน์โหลด Firebird
  • 2
    Kompozer
    Kompozer
    KompoZer เป็นโปรแกรมแก้ไข HTML wysiwyg โดยใช้
    ฐานโค้ด Mozilla Composer เนื่องจาก
    การพัฒนาของ Nvu ถูกหยุดลง
    ในปี 2005 KompoZer แก้ไขข้อบกพร่องมากมายและ
    เพิ่มเ...
    ดาวน์โหลดโปรแกรม KompoZer
  • 3
    ดาวน์โหลดมังงะฟรี
    ดาวน์โหลดมังงะฟรี
    The Free Manga Downloader (FMD) เป็น
    แอปพลิเคชันโอเพ่นซอร์สที่เขียนใน
    Object-Pascal สำหรับการจัดการและ
    ดาวน์โหลดมังงะจากเว็บไซต์ต่างๆ
    นี่คือกระจก...
    ดาวน์โหลด Manga Downloader ฟรี
  • 4
    Aetbootin
    Aetbootin
    UNetbootin ช่วยให้คุณสร้างบูตได้
    ไดรฟ์ USB สดสำหรับ Ubuntu, Fedora และ
    การกระจาย Linux อื่น ๆ ที่ไม่มี
    เขียนซีดี มันทำงานบน Windows, Linux,
    และ ...
    ดาวน์โหลด UNetbootin
  • 5
    โดลิบาร์ ERP - CRM
    โดลิบาร์ ERP - CRM
    Dolibarr ERP - CRM ใช้งานง่าย
    แพ็คเกจซอฟต์แวร์โอเพ่นซอร์ส ERP และ CRM
    (รันด้วยเว็บเซิร์ฟเวอร์ php หรือ as
    ซอฟต์แวร์แบบสแตนด์อโลน) สำหรับธุรกิจ
    ฐานราก...
    ดาวน์โหลด Dolibarr ERP - CRM
  • 6
    ไคลเอนต์ sqirreL SQL
    ไคลเอนต์ sqirreL SQL
    SQuirreL SQL Client คือ SQL . แบบกราฟิก
    ไคลเอนต์ที่เขียนด้วย Java ที่จะอนุญาต
    ให้คุณดูโครงสร้างของ JDBC
    ฐานข้อมูลที่สอดคล้อง เรียกดูข้อมูลใน
    โต๊ะ...
    ดาวน์โหลดไคลเอนต์ sqirreL SQL
  • เพิ่มเติม»

คำสั่ง Linux

Ad