אנגליתצרפתיתספרדי

הפעל שרתים | Ubuntu > | Fedora > |


סמל OnWorks

julius - מקוון בענן

הפעל את יוליוס בספק אירוח בחינם של OnWorks על אובונטו מקוון, פדורה מקוון, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זוהי הפקודה julius שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


יוליוס
- מנוע LVCSR רב תכליתי בקוד פתוח

תַקצִיר


יוליוס [-ג jconffile] [אפשרויות...]

תיאור


יוליוס הוא מנוע זיהוי דיבור בעל ביצועים גבוהים, רב-תכליתיים, בקוד פתוח עבור
חוקרים ומפתחים. הוא מסוגל לבצע זיהוי כמעט בזמן אמת של
דיבור רציף עם יותר מ-60k מילים מודל שפה של 3 גרם ודגם triphone HMM, ברובם
מחשבים נוכחיים. יוליוס יכול לבצע זיהוי על קבצי אודיו, קלט מיקרופון חי,
קבצי קלט ופרמטרים של תכונה.

מודול זיהוי הליבה מיושם כספריית C בשם "JuliusLib". זה גם יכול להיות
מורחבת על ידי מתקן תוסף.

נתמך מודלים
יוליוס צריך מודל שפה ומודל אקוסטי כדי לרוץ כמזהה דיבור. יוליוס
תומך בדגמים הבאים.

אקוסטי מודל
תת-מלת HMM (מודל Markov מוסתר) בפורמט HTK ascii נתמכות. תתקשר אלי
מודלים (מונופון), דגמי פונמה תלויי הקשר (טריפון), תערובת קשורה ו
ניתן להשתמש במודלים של תערובת פונטית של כל יחידה. בעת שימוש תלוי הקשר
מודלים, מטופלת גם תלות בהקשר בין מילים. תכונת ריבוי זרמים ו
MSD-HMM נתמך גם כן. אתה יכול להמשיך להשתמש בכלי מקבינהממ להמיר את ה-ascii
קובץ HMM לפורמט בינארי קומפקטי לטעינה מהירה יותר.

שים לב כי יוליוס עצמו יכול רק לחלץ תכונות MFCC מנתוני דיבור. אם אתה משתמש
HMM אקוסטי מאומן לתכונה אחרת, אתה צריך לתת את הקלט בפרמטר HTK
קובץ מאותו סוג תכונה.

שפה מודל: מילה N-גרם
מודל השפה של Word N-gram, עד 10 גרם, נתמך. יוליוס משתמש אחרת
N-גרם לכל מעבר: משמאל לימין 2-גרם במעבר הראשון, ו-N-גרם מימין לשמאל
מעבר 2. מומלץ להשתמש גם ב-LR 2-גרם וגם ב-RL N-גרם עבור יוליוס.
עם זאת, אתה יכול להשתמש רק LR N-gram בודד או RL N-gram. במקרה כזה, משוער
LR 2-גרם מחושבים מה-N-גרם הנתון יוחל במעבר הראשון.

פורמט ARPA סטנדרטי נתמך. בנוסף, פורמט בינארי הוא גם
נתמך ליעילות. הכלי mkbingram(1) יכול להמיר פורמט ARPA N-gram ל
פורמט בינארי.

שפה מודל: דקדוק
פורמט הדקדוק הוא תבנית מקורית, וכלים ליצירת דקדוק זיהוי
נכללים בהפצה. דקדוק מורכב משני קבצים: האחד הוא א
קובץ 'דקדוק' המתאר מבני משפטים בסגנון BNF, באמצעות מילה
שם 'קטגוריה' כסמלי סיום. אחר הוא קובץ 'voca' שמגדיר מילים
עם ההגיות שלו (כלומר רצפי פונמות) לכל קטגוריה. הם צריכים להיות
הומר על ידי mkdfa(1) לקובץ אוטומט סופי דטרמיניסטי (.dfa) וא
קובץ מילון (.dict), בהתאמה. אתה יכול גם להשתמש בדקדוקים מרובים.

שפה מודל: מְבוּדָד מילה
אתה יכול לבצע זיהוי מילים מבודד באמצעות מילון מילים בלבד. עם זה
סוג דגם, יוליוס יבצע זיהוי מהיר של מעבר אחד עם הקשר סטטי
טיפול. מודלים של שתיקה יתווספו הן בראש והן בזנב של כל מילה. אתה יכול
גם להשתמש במספר מילונים בתהליך.

חיפוש אַלגוֹרִיתְם
אלגוריתם זיהוי של יוליוס מבוסס על אסטרטגיית שני מעברים. מילה 2-גרם והיפוך
המילה 3-גרם משמשת במעברים המתאימים. כל הקלט מעובד בראשון
לעבור, ושוב תהליך החיפוש הסופי מבוצע שוב עבור הקלט, באמצעות ה-
תוצאה של המעבר הראשון כדי לצמצם את מרחב החיפוש. ספציפית, ההכרה
האלגוריתם מבוסס על חיפוש היוריסטי של עץ-טרליס בשילוב עם שמאל לימין
חיפוש קרן סינכרוני למסגרת וחיפוש פענוח מחסנית מימין לשמאל.

בעת שימוש בטלפונים תלויי הקשר (טריפונים), נלקחים בחשבון הקשרים בין מילים
הִתחַשְׁבוּת. לדגמי תערובת קשורה ופונטית, אקוסטית במהירות גבוהה
חישוב סבירות אפשרי באמצעות גיזום גאוסי.

לפרטים נוספים, עיין במסמכים הקשורים.

אפשרויות


אפשרויות אלו מציינות את המודלים, התנהגויות המערכת ופרמטרי החיפוש השונים
יוליוס. ניתן להגדיר את האפשרויות הללו בשורת הפקודה, אך מומלץ לכתוב
אותם בקובץ טקסט בתור "קובץ jconf", וציין זאת באמצעות אפשרות "-C".

יישומים המשלבים את JuliusLib משתמשים גם באפשרויות אלה כדי להגדיר את הפרמטרים של הליבה
מנוע זיהוי. לדוגמה, ניתן לטעון קובץ jconf ל-enine על ידי קריאה
j_config_load_file_new() עם שם הקובץ jconf כארגומנט.

שימו לב שנתיבים יחסיים בקובץ jconf צריכים להיות יחסיים לקובץ jconf
עצמו, לא ספריית העבודה הנוכחית.

להלן הפרטים של כל האפשרויות, שנאספו לפי קבוצה.

יוליוס יישום אוֹפְּצִיָה
אלו הן אפשרויות היישום של Julius, מחוץ ל- JuliusLib. הוא מכיל פרמטרים ו
מתגים עבור פלט תוצאה, המרת ערכת תווים, רמת יומן ואפשרויות מצב מודול.
אפשרויות אלו הן ספציפיות לג'וליוס, ולא ניתן להשתמש בהן ביישומים המשתמשים ב-JuliusLib
מלבד יוליוס.

-תיק
בקלט קובץ, אפשרות זו כתוב את תוצאת הזיהוי של כל קובץ לקובץ נפרד
קוֹבֶץ. קובץ הפלט של קובץ קלט יהיה באותו שם אבל הסיומת תהיה
שונה ל-".out". (גרסה 4.0)

-ניקוד נפרד
פלט את השפה ואת הציונים האקוסטיים בנפרד.

-callbackdebug
הדפס את שמות ההתקשרות חזרה בכל קריאה לניפוי באגים. (גרסה 4.0)

-charconv החל מ- ל
הדפס עם המרת סט תווים. החל מ- הוא ערכת תווי המקור המשמשת ב-
מודל שפה, ו ל הוא ערכת תווי היעד שאתה רוצה להשיג.

ב-Linux, הארגומנטים צריכים להיות שם קוד. אתה יכול לקבל את רשימת הזמינים
שמות קוד על ידי הפעלת הפקודה "iconv --list". ב-Windows, הטיעונים צריכים להיות
שם קוד או מספר דף קוד. שם הקוד צריך להיות אחד של "ansi", "mac", "oem",
"utf-7", "utf-8", "sjis", "euc". לחלופין, תוכל לציין כל מספר דף קוד שנתמך ב
הסביבה שלך.

-nocharconv
השבת המרת תווים.

-מודול [נמל]
הפעל את יוליוס על "מצב מודול שרת". לאחר ההפעלה, יוליוס ממתין לחיבור tcp/ip
מלקוח. ברגע שנוצר חיבור, יוליוס מתחיל בתקשורת עם הלקוח
לעבד פקודות נכנסות מהלקוח, או להוציא תוצאות זיהוי, קלט
מפעיל מידע ומצב מערכת אחר ללקוח. מספר היציאה המוגדר כברירת מחדל הוא
10500.

-תקליט dir
שמור אוטומטית את כל נתוני הדיבור הקלט בספרייה שצוינה. כל קלט מפולח הם
מוקלט כל אחד. שם הקובץ של הנתונים המוקלטים נוצר מזמן המערכת
כאשר הקלט מסתיים, בסגנון YYYY.MMDD.HHMMSS.wav. פורמט הקובץ הוא 16 סיביות מונורלי
WAV. לא חוקי עבור קלט mfcfile.

עם דחיית קלט על ידי -קצר לדחות, הקלט שנדחה יוקלט גם אם
הם נדחים.

-קובץ לוג פילה
שמור את כל פלט היומן בקובץ במקום פלט רגיל. (Rev.4.0)

-נולוג
השבת את כל פלט היומן. (Rev.4.0)

עזרה
פלט הודעת עזרה וצא.

גלוֹבָּלִי אפשרויות
אלו הן אפשרויות תלויות דגם/חיפוש הקשורות לקלט שמע, זיהוי קול, GMM,
אלגוריתם פענוח, מתקן תוספים ואחרים. יש להציב אפשרויות גלובליות לפני
כל הצהרת מקרה (-AM, -LM, או -SR), או רק אחרי "-גלוֹבָּלִי"אופציה.

אודיו קלט
-קֶלֶט {mic|rawfile|mfcfile|adinnet|stdin|netaudio|alsa|oss|esd}
בחר מקור קלט דיבור. ציין 'קובץ' או 'קובץ rawfile' עבור קובץ צורת גל,
'htkparam' או 'mfcfile' עבור קובץ הפרמטרים HTK. בקלט קובץ, המשתמשים יהיו
תתבקש להזין את שם הקובץ מ-stdin, או שאתה יכול להשתמש -רשימת קבצים אפשרות ל
ציין רשימה של קבצים לעיבוד.

'מיקרופון' הוא לקבל קלט שמע ממכשיר ברירת מחדל של מיקרופון חי, ו-'adinnet'
פירושו קבלת נתוני צורת גל דרך רשת tcpip מלקוח adinnet.
'netaudio' הוא מקלט DatLink/NetAudio, ו-'stdin' פירושו קלט נתונים מ
קלט סטנדרטי.

עבור קלט קובץ צורת גל, רק WAV (ללא דחיסה) ו-RAW (ללא כותרת, 16bit, גדול
endian) נתמכים כברירת מחדל. ניתן לקרוא פורמט אחר כאשר הוא מורכב עם
ספריית libsnd. כדי לראות איזה פורמט נתמך בפועל, עיין בהודעת העזרה
באמצעות אפשרות עזרה. עבור קלט stdin, רק WAV ו-RAW נתמכים. (בְּרִירַת מֶחדָל:
mfcfile)

בלינוקס, אתה יכול לבחור API בזמן ריצה על ידי ציון alsa, oss ו-esd.

-גודל_chunk דגימות
גודל קטע שמע במספר הדגימות. (ברירת מחדל: 1000)

-רשימת קבצים שם הקובץ
(עם -קֶלֶט rawfile|mfcfile) לבצע זיהוי על כל הקבצים הרשומים ב
קוֹבֶץ. הקובץ צריך להכיל קובץ קלט בכל שורה. המנוע יסתיים כאשר כל
הקבצים מעובדים.

בדיקת לא-טיפוס
כברירת מחדל, יוליוס בודק את סוג פרמטר הקלט אם הוא מתאים ל-AM או
לֹא. אפשרות זו תשבית את מנוע הסימון ותאלץ להשתמש בוקטור הקלט
כמו שהוא.

-48
הקלט קלט עם דגימה של 48kHz, והורד אותה ל-16kHz תוך כדי תנועה. זֶה
האפשרות תקפה לדגם 16kHz בלבד. שגרת הדגימה למטה הועברה
sptk. (Rev. 4.0)

-נ"א שם התקן
שם מארח עבור קלט שרת DatLink (-קֶלֶט netaudio).

-adport port_number
עם -קֶלֶט adinnet, ציין את מספר יציאת adinnet להאזנה. (ברירת מחדל: 5530)

-nostrip
יוליוס כברירת מחדל מסיר דגימות אפס עוקבות בנתוני דיבור קלט. זֶה
אפשרות מעכבת את ההסרה.

-זמעאן , -נוזמין
אפשרות זו מאפשרת/משביתה הסרת DC offset של צורת גל קלט. קיזוז יהיה
מוערך מכל הקלט. עבור כניסת מיקרופון / רשת, אפס ממוצע של
48000 הדגימות הראשונות (3 שניות בדגימה של 16kHz) ישמשו עבור
אוּמדָן. (ברירת מחדל: מושבת)

אפשרות זו משתמשת בהיסט סטטי עבור הערוץ. ראה גם -zmeansource ל
הסרת אופסט מבחינה מסגרת.

נאום זיהוי by רָמָה ו אפס צלב
-שתיקה , -שתיקה
הפעל/כבה את זיהוי הדיבור לפי רמה ואפס הצלב. ברירת המחדל מופעלת עבור
קלט מיקרופון / adinnet, וכבוי עבור קבצים.

-lv סף
סף רמה לזיהוי קלט דיבור. הערכים צריכים להיות בטווח שבין 0 ל
32767. (ברירת מחדל: 2000)

-zc סף
אפס סף מעבר לשנייה. רק קלט שעובר את הרמה
מפתן (-lv) ייספר. (ברירת מחדל: 60)

-שולי ראש אלפיות שנייה
שולי שתיקה בתחילת קטע הדיבור באלפיות שניות. (ברירת מחדל: 300)

-שולי הזנב אלפיות שנייה
שולי שתיקה בסוף קטע הדיבור באלפיות שניות. (ברירת מחדל: 400)

קֶלֶט דחיה
שתי שיטות פשוטות לדחיית קלט חזיתית מיושמות, המבוססות על אורך קלט
והספק ממוצע של קטע שזוהה. הדחייה לפי כוח ממוצע הוא
ניסיוני, וניתן להפעיל אותו על ידי --enable-power-reject בהידור. תקף ל
תכונת MFCC עם מקדם הספק וקלט בזמן אמת בלבד.

לדחיית קלט מבוסס GMM, עיין בסעיף GMM להלן.

-קצר לדחות אלפיות שנייה
דחה קלט קצר יותר מאלפיות שניות שצוינו. החיפוש יופסק ו
לא תוצא תוצאה.

-powerthres סף
דחה את הקטע המוזן לפי האנרגיה הממוצעת שלו. אם האנרגיה הממוצעת של
הקלט האחרון שזוהה מתחת לסף, יוליוס ידחה את הקלט.
(Rev.4.0)

אפשרות זו תקפה כאשר --enable-power-reject מצוין בהידור
הזמן.

גאוס תַעֲרוֹבֶת מודל / GMM-VAD
GMM ישמש לדחיית קלט לפי ניקוד מצטבר, או לחזית
VAD מבוסס GMM כאשר --enable-gmm-vad מצוין.

הערה: עליך גם להגדיר את הפרמטרים המתאימים של MFCC הנדרשים עבור GMM,
ציון הפרמטרים האקוסטיים המתוארים בסעיף AM -AM_GMM.

כאשר VAD מבוסס GMM מופעל, ציון הפעילות הקולית יחושב בכל אחד
מסגרת כעיבוד חזיתי. הערך יחושב כ-\[ \max_{m \in M_v}
p(x|m) - \max_{m \in M_n} p(x|m) \] כאשר $M_v$ הוא קבוצה של GMM קול, ו-$M_n$ הוא
קבוצה של רעש GMM שאת שמותיהם יש לציין על ידי -גממדחה. הפעילות
לאחר מכן יערך ממוצע של הניקוד עבור N הפריימים האחרונים, כאשר N מצוין על ידי
-gmmmargin. יוליוס מעדכן את ציון הפעילות הממוצע בכל פריים, ומזהה
הפעלת הדיבור כאשר הערך עולה על הערך שצוין על ידי -gmmup, ו
detecgt מטה-הדק כאשר הוא יורד מערך של -gmmdown.

-גממ hmmdefs_file
קובץ הגדרות GMM בפורמט HTK. אם צוין, אימות קלט מבוסס GMM
יבוצע במקביל למעבר הראשון, ותוכל לדחות את הקלט
לפי התוצאה כפי שצוינה על ידי -גממדחה. יש להגדיר את ה-GMM כ
HMM של מדינה אחת.

-gmmnum מספר
מספר הרכיבים גאוסים שיש לחשב לכל מסגרת בחישוב GMM. רק
ה-N-הגאוסים הטובים ביותר יחושבו לחישוב מהיר. ברירת המחדל היא 10
וציון ערך קטן יותר יאיץ את חישוב GMM, אבל ערך קטן מדי
(1 או 2) עלולים לגרום לירידה בביצועי הזיהוי.

-גממדחה מחרוזת
רשימה מופרדת בפסיקים של שמות GMM שיש לדחות כקלט לא חוקי. מתי
זיהוי, הסיכויים ביומן של GMMs שנצברו עבור כל הקלט יהיו
יחושב במקביל למעבר הראשון. אם שם ה-GMM של הציון המקסימלי
נמצא בתוך מחרוזת זו, המעבר השני לא יבוצע והקלט יהיה
נדחה.

-gmmmargin מסגרות
(GMM_VAD) שולי ראש במסגרות. כאשר טריגר דיבור מזוהה על ידי GMM,
הזיהוי יתחיל מהמסגרת הנוכחית פחות ערך זה. (Rev.4.0)

אפשרות זו תהיה תקפה רק אם היא מורכבת עם --enable-gmm-vad.

-gmmup ערך
(GMM_VAD) מעלה את סף ההדק של ציון הפעילות הקולית. (Rev.4.1)

אפשרות זו תהיה תקפה רק אם היא מורכבת עם --enable-gmm-vad.

-gmmdown ערך
(GMM_VAD) סף ההפעלה נמוך של ציון פעילות קולית. (Rev.4.1)

אפשרות זו תהיה תקפה רק אם היא מורכבת עם --enable-gmm-vad.

פענוח אוֹפְּצִיָה
עיבוד בזמן אמת פירושו עיבוד מקביל של חישוב MFCC מעבר ראשון
פִּעַנוּחַ. כברירת מחדל, עיבוד בזמן אמת בכרטיס מופעל עבור מיקרופון /
קלט adinnet / netaudio, ועבור אחרים.

-זמן אמת , -זמן נורמלי
הפעל/כבה במפורש עיבוד בזמן אמת (צינור) במעבר הראשון.
ברירת המחדל כבויה עבור קלט קבצים ומופעלת עבור מיקרופון, adinnet ו-NetAudio
קֶלֶט. אפשרות זו מתייחסת לאופן ביצוע CMN ונורמליזציה של אנרגיה:
אם כבוי, הם ייעשו באמצעות תכונות ממוצעות של קלט שלם. אם פועל, MAP-CMN
ונורמליזציה של אנרגיה כדי לבצע עיבוד בזמן אמת.

שונה. אפשרויות
-C jconffile
טען קובץ jconf כאן. התוכן של jconffile יורחב בנקודה זו
נְקוּדָה.

-הפך
הדפס את פרטי הגרסה לשגיאה רגילה וצא.

-הגדרה
הדפס מידע על הגדרות מנוע לשגיאה סטנדרטית וצא.

-שֶׁקֶט
פלט פחות יומן. לתוצאה, רק רצף המילים הטוב ביותר יודפס.

-לנפות
(לניפוי באגים) פלט הודעה פנימית עצומה ומידע ניפוי באגים ללוג.

-חשבון {wchmm|טרליס|טריפון}
עבור ניפוי באגים, היכנס למצב בדיקה אינטראקטיבי.

-plugindir רשימת מטה
ציין ספרייה לטעינת הפלאגין. אם קיימים מספר מדריכים, ציין אותם לפי
רשימה מופרדת בנקודתיים.

מופע הכרזה ל רב פִּעַנוּחַ
הארגומנטים הבאים ייצרו ערכת תצורה חדשה עם פרמטרי ברירת מחדל, ו
החלף זרם מוגדר אליו. פרמטרי Jconf שצוינו לאחר האפשרות יוגדרו ב-
סט נוכחי.

כדי לבצע פענוח רב-מודלים, יש לציין ארגומנטים אלה בראשון של כל דגם
/ חפש מופעים עם שמות שונים. כל האפשרויות לפני הגדרת המופע הראשון
תתעלם.

כאשר לא נמצאה הגדרת מופע (כגרסה ישנה יותר של יוליוס), כל האפשרויות הן
מוקצה למופע ברירת מחדל בשם _default.

שים לב שפענוח עם LM בודד ומספר AMs אינו נתמך במלואו. ל
לדוגמה, ייתכן שתרצה לבנות את קובץ jconf באופן הבא.
סוג זה של שיתוף מודלים אינו נתמך עדיין, מכיוון שחלק מסוים מעיבוד LM תלוי
על AM שהוקצה. במקום זאת, אתה יכול לקבל את אותה תוצאה על ידי הגדרת אותם LMs עבור כל אחד
AM, ככה:

-AM שם
צור ערכת תצורה חדשה של AM, והחלף את הנוכחית לחדשה. כדאי לתת א
שם ייחודי. (Rev.4.0)

-LM שם
צור ערכת תצורה חדשה של LM, והחלף את הנוכחית לחדשה. כדאי לתת א
שם ייחודי. (Rev.4.0)

-SR שם am_name lm_name
צור ערכת תצורת חיפוש חדשה, והחלף את הנוכחית לחדשה. המסויים
AM ו-LM יוקצו לו. ה am_name ו lm_name יכול להיות שם או תעודה מזהה
מספר. כדאי לתת שם ייחודי. (Rev.4.0)

-AM_GMM
בעת שימוש ב-GMM לעיבוד חזיתי, ניתן לציין אקוסטיקה ספציפית ל-GMM
פרמטרים לאחר אפשרות זו. אם לא תפרט -AM_GMM עם GMM, ה-GMM יהיה
חולקים את אותו וקטור פרמטר כמו ה-AM האחרון. AM הנוכחי יועבר ל-
GMM one, אז היזהר לא להתבלבל עם תצורות AM רגילות. (Rev.4.0)

-גלוֹבָּלִי
התחל קטע גלובלי. יש להציב את האפשרויות הגלובליות לפני כל מופע
הצהרה, או לאחר אפשרות זו על זיהוי דגמים מרובים. זה יכול לשמש
מספר פעמים. (Rev.4.1)

-בדיקת אף , -בדיקת קטעים
השבת / הפעל בדיקת מיקום של אפשרויות בפענוח מרובה דגמים. כאשר מופעל, ה
האפשרויות בין הצהרת מופע מטופלות כאל "קטעים" ורק השייכות
ניתן לכתוב סוגי אפשרויות. למשל, כאשר אופציה -AM מצוין, רק ה-AM
ניתן להציב אפשרות קשורה אחרי האפשרות עד שנמצא הצהרה אחרת. גַם,
יש להציב אפשרויות גלובליות בראש, לפני כל הצהרת מופע. זה
מופעל כברירת מחדל. (Rev.4.1)

שפה מודל (-LM)
קבוצה זו מכילה אפשרויות להגדרת מודל של כל סוג מודל שפה. כשמשתמש
מספר LM, מופע אחד יכול להיות רק LM אחד.

ניתן לציין רק סוג אחד של LM עבור תצורת LM. אם אתה רוצה להשתמש במולטי
דגם, עליך להגדיר אותם כ-LM חדש.

N-גרם
-d bingram_file
השתמש בפורמט בינארי N-gram. ניתן להמיר קובץ ARPA N-gram לבינארי Julius
פורמט על ידי mkbingram.

-nlr arpa_ngram_file
מודל שפת N-גרם קדימה משמאל לימין בפורמט ARPA סטנדרטי. מתי
מצוינים גם גרם N קדימה וגם N-גרם אחורה, יוליוס משתמש בזה
קדימה 2-גרם למעבר הראשון, וה-N-גרם אחורה למעבר השני.

מכיוון שקובץ ARPA הופך לרוב עצום ודורש זמן רב לטעינה, ייתכן שכן
עדיף להמיר את קובץ ARPA לפורמט בינארי של יוליוס על ידי mkbingram. ציין זאת
אם משתמשים ב-N-גרם גם קדימה וגם אחורה לצורך זיהוי, הם יחד יעשו זאת
להמיר לבינארי יחיד.

כאשר רק גרם N קדימה מצוין על ידי אפשרות זו ולא אחורה N גרם
שצוין על ידי -nrl, יוליוס מבצע זיהוי רק עם ה-N-גרם הקדמי. ה
המעבר הראשון ישתמש בערך ה-1 גרם ב-N-גרם הנתון, והמעבר השני יעשה שימוש
השתמש ב-N-גרם הנתון, עם המרת הסתברויות קדימה לאחור
הסתברויות לפי כלל בייס. (Rev.4.0)

-nrl arpa_ngram_file
מודל שפת N-גרם אחורה, מימין לשמאל, בפורמט ARPA סטנדרטי. מתי
מצוינים גם גרם N קדימה וגם N-גרם אחורה, יוליוס משתמש קדימה
2-גרם למעבר הראשון, וה-N-גרם האחורי הזה למעבר השני.

מכיוון שקובץ ARPA הופך לרוב עצום ודורש זמן רב לטעינה, ייתכן שכן
עדיף להמיר את קובץ ARPA לפורמט בינארי של יוליוס על ידי mkbingram. ציין זאת
אם משתמשים ב-N-גרם גם קדימה וגם אחורה לצורך זיהוי, הם יחד יעשו זאת
להמיר לבינארי יחיד.

כאשר רק גרם N לאחור מצוין על ידי אפשרות זו וללא גרם N קדימה
שצוין על ידי -nlr, יוליוס מבצע זיהוי רק עם ה-N-גרם לאחור.
המעבר הראשון ישתמש בהסתברות קדימה של 1 גרם המחושבת מאחור
2 גרם באמצעות כלל בייס. המעבר השני השתמש במלואו ב-N-גרם הנתון לאחור.
(Rev.4.0)

-v dict_file
קובץ מילון וורד.

-ציף מחרוזת_מילה -זנב מחרוזת_מילה
מילת שתיקה המוגדרת במילון, עבור שתיקות בתחילת
משפט וסוף משפט. (ברירת מחדל: " ", " ")

-מפאנק מחרוזת_מילה
ציין מילה לא ידועה. ברירת המחדל היא " "או" ". זה ישמש להקצאה
הסתברות מילים על מילים לא ידועות, כלומר מילים במילון שאינן נמצאות בהן
אוצר מילים של N-גרם.

-iwspword
הוסף ערך מילה למילון שאמור להתאים להפסקות בין מילים.
זה עשוי לשפר את דיוק הזיהוי במודל שפה כלשהו שאין לו
מודל הפסקה מפורש בין מילים. ניתן לשנות את ערך המילה שיש להוסיף על ידי
-iwspentry.

-iwspentry מחרוזת_כניסת מילה
ציין את רשומת המילה שתתווסף על ידי -iwspword. (ברירת מחדל: " [sp] sp
sp")

-ספנום מספר
מספר מילים בתדירות גבוהה שיש לבודד מעץ הלקסיקון, כדי להקל
שגיאת קירוב שעלולה להיגרם מהקירוב הטוב ביותר ב-1
לַעֲבוֹר. (ברירת מחדל: 150)

דקדוק
ניתן לציין דקדוקים מרובים על ידי חזרה -גְרַם ו -gramlist. שים לב לכך
היא התנהגות חריגה מאפשרויות אחרות (באופציה רגילה של יוליוס, האחרונה תהיה
לעקוף את הקודמים). אתה יכול להשתמש -נוגרם כדי לאפס את הדקדוקים כבר
שצוין לפני הנקודה.

-גְרַם gramprefix1[,gramprefix2[,gramprefix3,...]]
רשימה מופרדת בפסיקים של דקדוקים שיש להשתמש בהם. הטיעון צריך להיות קידומת של
דקדוק, כלומר אם יש לך foo.dfa ו foo.dict, עליך לציין אותם עם א
טיעון יחיד foo. ניתן לציין דקדוקים מרובים בו-זמנית בתור א
רשימה מופרדת בפסיקים.

-gramlist list_file
ציין קובץ רשימת דקדוק המכיל רשימה של דקדוקים לשימוש. הרשימה
הקובץ צריך להכיל את הקידומות של דקדוקים, כל אחד בשורה. נתיב יחסי פנימה
קובץ הרשימה יטופל כיחסי לקובץ, לא לנתיב הנוכחי או
קובץ תצורה.

-dfa dfa_file -v dict_file
דרך ישנה לציון קבצי דקדוק בנפרד. זה מזויף, ולא צריך
לשמש יותר.

-נוגרם
הסר את רשימת הדקדוקים הנוכחית שכבר צוינה על ידי -גְרַם, -gramlist, -dfa
ו -v.

מבודד מילה
ניתן לציין מילון באמצעות -w ו -wlist. כאשר אתה מציין מרובים
פעמים, כולם יקראו בעת ההפעלה. אתה יכול להשתמש -נוגרם כדי לאפס את
מילונים כבר צוינו בשלב זה.

-w dict_file
מילון מילים לזיהוי מילים מבודד. פורמט הקובץ זהה לזה של אחרים
LM. (Rev.4.0)

-wlist list_file
ציין קובץ רשימת מילונים המכיל רשימה של מילונים לשימוש.
קובץ הרשימה צריך להכיל את שם הקובץ של מילונים, כל אחד בשורה. א
נתיב יחסי בקובץ הרשימה יטופל כיחסי לקובץ הרשימה, לא
הנתיב הנוכחי או קובץ התצורה. (Rev.4.0)

-נוגרם
הסר את הרשימה הנוכחית של מילונים שכבר צוינה על ידי -w ו -wlist.

-וסיל head_sil_model_name tail_sil_model_name sil_context_name
על זיהוי מילים מבודד, יצורפו מודלים של שתיקה לראש ו
זנב של כל מילה בעת הזיהוי. אפשרות זו מציינת את דגמי השתיקה
צורף. sil_context_name הוא השם של דגם head sil ודגם tail sil
כהקשר של מילה טלפון ראש וטלפון זנב. לדוגמה, אם אתה מציין
-wsil silB silE sp, מילה עם רצף טלפון b eh t תתורגם כ-silB
sp-b+eh b-eh+t eh-t+sp silE. (Rev.4.0)

משתמש הוגדר LM
-userlm
הצהר להשתמש בפונקציות LM של המשתמש בתוכנית. יש לציין אפשרות זו
אם אתה משתמש בפונקציות LM המוגדרות על ידי המשתמש. (Rev.4.0)

שונה. LM אפשרויות
-להכריח
דלג על מילות שגיאה במילון והרצה בכוח.

אקוסטי מודל ו תכונה אנליזה (- בבוקר) (-AM_GMM)
סעיף זה עוסק באפשרויות לדגם אקוסטי, חילוץ תכונה, תכונה
נורמליזציות וחיסור ספקטרלי.

אחרי השם -AM, יש לכתוב דגם אקוסטי ומפרט קשור. אתה יכול להשתמש
מספר AMs מאומנים עם סוגי MFCC שונים. עבור GMM, תנאי הפרמטר הנדרש
יש לציין בדיוק כמו AMs לאחר -AM_GMM.

בעת שימוש במספר AMs, הערכים של -smpPeriod, -smpFreq, -fsize ו -fshift צריך להיות
זהה בין כל ה-AMs.

אקוסטי HMM
-h hmmdef_file
קובץ הגדרות HMM אקוסטי. זה צריך להיות בפורמט HTK ascii, או Julius בינארי
פוּרמָט. אתה יכול להמיר פורמט HTK ascii לפורמט בינארי של Julius באמצעות mkbinhmm.

-הרשימה hmmlist_file
קובץ HMMList למיפוי טלפונים. קובץ זה מספק מיפוי בין לוגי
שמות טריפון שנוצרו במילון ושמות HMM המוגדרים ב-hmmdefs.
יש לציין אפשרות זו עבור מודל תלוי הקשר.

-tmix מספר
ציין את מספר הגאוסים העליונים שיחושבו בספר קודים של תערובת.
מספר קטן יאיץ את החישוב האקוסטי, אבל דיוק AM עשוי להגיע
גרוע יותר עם ערך קטן מדי. ראה גם -gprune. (ברירת מחדל: 2)

-spmodel שם
ציין שם דגם HMM המתאים להפסקה קצרה באמירה. ה
שם הדגם של הפסקה קצרה ישמש לזיהוי: דילוג על הפסקה קצרה
זיהוי דקדוק, הוספת מודל להפסקה קצרה עם סוף מילה -iwsp על N-גרם,
או פילוח של הפסקה קצרה (-spsegment). (ברירת מחדל: "sp")

-רב-נתיבים
אפשר מצב ריבוי נתיבים. כדי להפוך את הפענוח למהיר יותר, יוליוס כברירת מחדל כופה א
הגבלה על מעברי HMM שלכל דגם אמור להיות מעבר אחד בלבד
מצב התחלתי ומצב סיום. במצב ריבוי נתיבים, יוליוס עושה טיפול נוסף
על מעבר בין מודל לאפשר מעבר מודל דילוג ומרובה
מעברי פלט/קלט. שימו לב שציון אפשרות זו יהפוך את יוליוס ל-a
קצת יותר איטי, וייתכן שיידרש רוחב האלומה הגדול יותר.

פונקציה זו הייתה אפשרות לזמן קומפילציה ב- Julius 3.x, וכעת הופכת ל- a
אפשרות זמן ריצה. כברירת מחדל (ללא אפשרות זו), יוליוס בודק את המעבר
סוג של HMMs שצוין, והפעל את מצב ריבוי הנתיבים במידת הצורך. אתה יכול
לאלץ מצב ריבוי נתיבים עם אפשרות זו. (גרסה 4.0)

-gprune {safe|heuristic|beam|none|default}
הגדר את אלגוריתם הגזם גאוס לשימוש. עבור מודל תערובת קשור, יוליוס מבצע
גיזום גאוסי להפחתת חישוב אקוסטי, על ידי חישוב ה-N העליון בלבד
גאוסים בכל ספר קודים בכל מסגרת. הגדרת ברירת המחדל תוגדר
לפי סוג הדגם והגדרת המנוע. ברירת המחדל תאלץ לקבל
הגדרת ברירת המחדל. הגדר את זה ל'אין' כדי להשבית את הגיזום ולבצע מלא
חישוב. בטוח מבטיחה את N Gaussians העליון להיות מחושבים. היוריסטית ו
קרן מבצעת הפחתת עלויות חישוב אגרסיבית יותר, אך עשויה לגרום לקטן
מודל אובדן דיוק (ברירת מחדל: בטוח (סטנדרטי), קרן (מהיר) עבור תערובת קשורה
דגם, אין לדגם ללא תערובת).

-iwcd1 {max|avg|המספר הטוב ביותר}
בחר שיטה להערכת טריפון בין מילים על הראש והזנב של מילה
במעבר הראשון.

max יחיל את הסבירות המקסימלית של אותם טריפונים בהקשר. רצון ממוצע
להחיל את הסבירות הממוצעת של אותם טריפונים בהקשר. המספר הטוב ביותר יהיה
להחיל את הממוצע של ההסתברויות הטובות ביותר של N של אותו טריפון ההקשר.

ברירת המחדל היא הטובה ביותר 3 לשימוש עם N-gram, ו-avg עבור דקדוק ומילה. כשזה
AM משותף ל-LMs משני הסוגים, האחרון ייבחר.

-iwsppenalty לצוף
עונש הכנסה עבור הפסקות קצרות לסוף מילה שצורפו על ידי -iwsp.

-שממ hmmdef_file
אם אפשרות זו צוינה, יוליוס מבצע בחירת תערובת גאוס עבור
פענוח יעיל. ה-hmmdefs צריכים להיות דגם מונופון שנוצר מ-an
דגם HMM מונופון רגיל, באמצעות mkgshmm.

-gsnum מספר
ב-GMS, ציין את מספר מצבי המונופון שבהם יש לחשב את הטריפונים המתאימים
פרט. (ברירת מחדל: 24)

נאום אנליזה
רק מיצוי תכונות MFCC נתמך בג'וליוס הנוכחי. כך כאשר מזהים
קלט צורת גל מקובץ או מיקרופון, AM חייב להיות מאומן על ידי MFCC. הפרמטר
יש להגדיר את התנאי בדיוק כמו תנאי האימון על ידי
אפשרויות להלן.

כאשר אתה נותן קלט בקובץ פרמטר HTK, אתה יכול להשתמש בכל סוג פרמטר עבור
AM. במקרה הזה לג'וליוס לא אכפת מסוג תכונת הקלט ו-AM, רק
קרא אותם כרצף וקטור והתאם אותם ל-AM הנתון. יוליוס רק בודק
האם סוגי הפרמטרים זהים. אם זה לא עובד טוב, אתה יכול להשבית
בדיקה זו על ידי בדיקת לא-טיפוס.

ב-Julius, סוג הפרמטר והסמכויות (כ-TARGETKIND ב-HTK) והמספר
של פרמטרי cepstral (NUMCEPS) יוגדרו אוטומטית מהתוכן של
כותרת AM, אז אתה לא צריך לציין אותם לפי אפשרויות.

פרמטרים אחרים צריכים להיות מוגדרים בדיוק כמו מצב האימון. אתה יכול גם
תן קובץ HTK Config שבו השתמשת כדי לאמן את AM ל- Julius על ידי -htkconf. כשזה
מופעלת, יוליוס ינתח את קובץ התצורה ויגדיר פרמטר מתאים.

אתה יכול עוד להטביע את הגדרות פרמטר הניתוח האלה לקובץ HMM בינארי באמצעות
מקבינהממ.

אם האפשרויות יצוינו בכמה דרכים, הן יוערכו לפי הסדר שלהלן.
הפרמטר המוטבע AM ייטען ראשון אם בכלל. לאחר מכן, קובץ התצורה של HTK
ניתנו על ידי -htkconf ינותח. אם ערך כבר מוגדר על ידי ערך מוטבע AM, HTK
התצורה תעקוף אותם. לבסוף, האפשרויות הישירות ייטענו, מה שיעשה
לעקוף הגדרות שנטענו קודם לכן. שימו לב, כאשר צוינו אותן אפשרויות
מספר פעמים, מאוחר יותר יעקוף את הקודמים, מלבד זאת -htkconf יוערך
תחילה כפי שתואר לעיל.

-smpPeriod תקופה
תקופת דגימה של דיבור קלט, ביחידה של 100 ננו-שניות. קצב דגימה יכול
יצוין גם על ידי -smpFreq. שימו לב שתדר הקלט צריך להיות
מוגדר שווה לתנאי האימון של AM. (ברירת מחדל: 625, מתאים ל
16,000Hz)

אפשרות זו מתאימה לאפשרות HTK SOURCERATE. אותו ערך יכול להיות
נתון לאפשרות זו.

בעת שימוש במספר AM, ערך זה צריך להיות זהה בין כל AMs.

-smpFreq Hz
הגדר את תדירות הדגימה של דיבור קלט בהרץ. קצב הדגימה יכול להיות גם
שצוין באמצעות -smpPeriod. שימו לב שיש להגדיר תדירות זו שווה
לתנאי האימון של AM. (ברירת מחדל: 16,000)

בעת שימוש במספר AM, ערך זה צריך להיות זהה בין כל AMs.

-fsize sample_num
גודל חלון במספר דוגמאות. (ברירת מחדל: 400)

אפשרות זו מתאימה לאפשרות HTK WINDOWSIZE, אך הערך צריך להיות ב
דוגמאות (ערך HTK / smpPeriod).

בעת שימוש במספר AM, ערך זה צריך להיות זהה בין כל AMs.

-fshift sample_num
שינוי מסגרת במספר הדגימות. (ברירת מחדל: 160)

אפשרות זו מתאימה לאפשרות HTK TARGETRATE, אך הערך צריך להיות ב
דוגמאות (ערך HTK / smpPeriod).

בעת שימוש במספר AM, ערך זה צריך להיות זהה בין כל AMs.

-קדימה לצוף
מקדם הדגשה. (ברירת מחדל: 0.97)

אפשרות זו מתאימה לאופציית HTK PREEMCOEF. ניתן לתת אותו ערך
לאופציה זו.

-fbank NUM
מספר ערוצי בנק הסינון. (ברירת מחדל: 24)

אפשרות זו מתאימה לאפשרות HTK NUMCHANS. ניתן לתת אותו ערך
לאופציה זו. שים לב שערך ברירת המחדל אינו זהה לערך ב-HTK (22).

-ספליף NUM
מקדם הרמת Cepstral. (ברירת מחדל: 22)

אפשרות זו מתאימה לאופציית HTK CEPLIFTER. ניתן לתת אותו ערך
לאופציה זו.

-גולמי , -נורווה
הפעל/השבת שימוש באנרגיה גולמית לפני הדגשה מוקדמת (ברירת מחדל: מושבת)

אפשרות זו מתאימה לאופציית HTK RAWENERGY. שים לב כי ברירת המחדל
הערך שונה מ-HTK (מופעל ב-HTK, מושבת ב-Julius).

-חריג , -לא נורמלי
הפעל/השבת נרמול אנרגיית יומן. בקלט חי, נורמליזציה זו תהיה
משוער מהממוצע של הקלט האחרון. (ברירת מחדל: מושבת)

אפשרות זו מתאימה לאפשרות HTK ENORMALISE. שים לב כי ברירת המחדל
הערך שונה מ-HTK (מופעל ב-HTK, מושבת ב-Julius).

-escale קנה מידה_צף
גורם קנה מידה של אנרגיית לוג בעת נורמליזציה של אנרגיית לוג. (ברירת מחדל: 1.0)

אפשרות זו מתאימה לאפשרות HTK ESCALE. שים לב כי ברירת המחדל
הערך שונה מ-HTK (0.1).

-רצפה לצוף
רצפת שקט אנרגיה ב-dB בעת מנרמל אנרגיית יומן. (ברירת מחדל: 50.0)

אפשרות זו מתאימה לאופציית HTK SILFLOOR.

-דלווין מסגרת
גודל חלון דלתא במספר מסגרות. (ברירת מחדל: 2)

אפשרות זו מתאימה לאפשרות HTK DELTAWINDOW. אותו ערך יכול להיות
נתון לאפשרות זו.

-אקווין מסגרת
גודל חלון האצה במספר מסגרות. (ברירת מחדל: 2)

אפשרות זו מתאימה לאפשרות HTK ACCWINDOW. ניתן לתת אותו ערך
לאופציה זו.

-hifreq Hz
אפשר הגבלת פס עבור חישוב בנק מסנן MFCC: הגדר תדר עליון
לחתוך. ערך של -1 ישבית אותו. (ברירת מחדל: -1)

אפשרות זו מתאימה לאפשרות HTK HIFREQ. ניתן לתת אותו ערך
אפשרות זו.

-lofreq Hz
אפשר הגבלת פס עבור חישוב בנק מסנן MFCC: הגדר תדר נמוך יותר
לחתוך. ערך של -1 ישבית אותו. (ברירת מחדל: -1)

אפשרות זו מתאימה לאופציית HTK LOFREQ. ניתן לתת אותו ערך
אפשרות זו.

-zmeanframe , -nozmeanframe
עם קלט דיבור, אפשרות זו מאפשרת/משביתה הסרת DC offset מבחינת מסגרת.
זה מתאים לתצורת HTK ZMEANSOURCE. לא ניתן להשתמש בזה ביחד
עם -זמעאן. (ברירת מחדל: מושבת)

-כוח שימוש
השתמש בכוח במקום בגודל בניתוח מסנן. (ברירת מחדל: מושבת)

נוֹרמָלִיזָצִיָה
יוליוס יכול לבצע נורמליזציה ממוצעת (CMN) עבור תשומות. CMN יהיה
הופעל כאשר ה-AM הנתון אומן עם CMN (כלומר יש לו "_Z" מוקדמות ב-
כּוֹתֶרֶת).

הממוצע הספסטרלי יוערך בצורה שונה בהתאם לסוג הקלט.
בקלט קובץ, הממוצע יחושב מכל הקלט. על קלט חי כזה
ככניסת מיקרופון ורשת, הממוצע הצטרלי של הקלט אינו ידוע ב-
הַתחָלָה. אז MAP-CMN ישמש. ב-MAP-CMN, וקטור ממוצע ראשוני יופעל
בהתחלה, והווקטור הממוצע יימרח לממוצע של ה
הגדלה של וקטור קלט ככל שהקלט עובר. האפשרויות שלהלן יכולות לשלוט בהתנהגות של
MAP-CMN.

-cvn
אפשר נורמליזציה של שונות צפסלית. בקלט הקובץ, השונות של השלם
הקלט יחושב ולאחר מכן ייושם. בכניסת מיקרופון חיה, שונות של
הקלט האחרון יופעל. CVN נתמך רק עבור כניסת שמע.

-vtln אלפא חתך נמוך hicut
עשה עיוות תדר, בדרך כלל עבור נורמליזציה של אורך מערכת הקול (VTLN).
הטיעונים הם גורם עיוות, ניתוק בתדר גבוה ותדירות נמוכה. לחתוך. הֵם
תואמים לערכי HTK Config, WARPFREQ, WARPHCUTOFF ו-WARPLCUTOFF.

-cmnload פילה
טען וקטור ממוצע cepstral ראשוני מהקובץ בעת ההפעלה. ה פילה צריך להיות אחד
נשמר על ידי -cmnsave. טעינת ממוצע ספסטרלי ראשוני מאפשרת לג'וליוס להשתפר
לזהות את האמירה הראשונה בקלט בזמן אמת. בשימוש יחד עם
-cmnnoעדכון, ערך התחלתי זה ישמש עבור כל הקלט.

-cmnsave פילה
שמור את הווקטור הממוצע הספסטרלי המחושב לתוך פילה. הפרמטרים יישמרו
בכל קצה קלט. אם קובץ הפלט כבר קיים, הוא יעקוף.

-cmnupdate -cmnnoעדכון
שליטה אם לעדכן את ממוצע הספסל בכל קלט בקלט בזמן אמת.
מבטל את זה ומציין -cmnload יגרום למנוע להשתמש תמיד בטעון
ממוצע ראשוני סטטי cepstral.

-cmnmapweight לצוף
ציין את המשקל של הממוצע הקסטרלי הראשוני עבור MAP-CMN. ציין ערך גדול יותר ל
לשמור על הממוצע הקפסטרי ההתחלתי לתקופה ארוכה יותר, וערך קטן יותר לעשות
האמצעי הקססטרלי מסתמך יותר על הקלט הנוכחי. (ברירת מחדל: 100.0)

חזיתי תהליך
יוליוס יכול לבצע חיסור ספקטרלי כדי להפחית קצת רעש נייח מאודיו
קֶלֶט. אמנם זו לא שיטה חזקה, אבל היא עשויה לעבוד על מצב מסוים.
לג'וליוס יש שתי דרכים להעריך את ספקטרום הרעש. דרך אחת היא להניח שהראשונה
קטע קצר של קלט דיבור הוא קטע רעש, והעריך את ספקטרום הרעש
כממוצע של הפלח. דרך נוספת היא לחשב ספקטרום ממוצע מתוך
קלט רעש בלבד באמצעות כלי אחר mkss, וטען אותו ב- Julius. הקודם הוא
פופולרי עבור קלט קבצי דיבור, ובאחרון יש להשתמש בקלט חי. האפשרויות
להלן יחליף / ישלוט בהתנהגות.

-scalc
בצע חיסור ספקטרלי באמצעות חלק ראש של כל קובץ כחלק שקט. ה
אורך חלק ראש צריך להיות מוגדר על ידי -scalclen. תקף רק עבור קלט קובץ.
עימות עם -ssload.

-scalclen אלפיות שנייה
עם -scalc, ציין את אורך הדממת הראש להערכת ספקטרום הרעש
באלפיות שניות. (ברירת מחדל: 300)

-ssload פילה
בצע חיסור ספקטרלי עבור קלט דיבור באמצעות ספקטרום רעש משוער מראש
טעון מ- פילה. קובץ ספקטרום הרעש יכול להיעשות על ידי mkss. תקף לכולם
קלט דיבור. עימות עם -scalc.

-סלפה לצוף
מקדם אלפא של חיסור ספקטרלי עבור -scalc ו -ssload. יהיה רעש
מופחת חזק יותר ככל שהערך הזה גדל, אבל עיוות של המתקבל
האות גם הופך מדהים. (ברירת מחדל: 2.0)

-קומה לצוף
מקדם ריצוף של חיסור ספקטרלי. הכוח הספקטרלי שיורד למטה
אפס לאחר חיסור יוחלף באות המקור בזה
מקדם מוכפל. (ברירת מחדל: 0.5)

שונה. AM אפשרויות
-htkconf פילה
נתח את קובץ ה-HTK Config הנתון, והגדר פרמטרים מתאימים לג'וליוס.
בעת שימוש באפשרות זו, ערכי ברירת המחדל של פרמטרים מוחלפים מ- Julius
ברירת המחדל לברירות המחדל של HTK.

הכרה תהליך ו search (-SR)
סעיף זה מכיל אפשרויות לפרמטרי חיפוש במעבר הראשון / השני, כגון קורה
משקלי רוחב ומשקולות LM, תצורות לפילוח הפסקה קצרה, מתגים למילה
פלט סריג ופלט רשת בלבול, יישורים מאולצים ואפשרויות אחרות הקשורות
תהליך ההכרה ותפוקת התוצאה.

ערכי ברירת המחדל של רוחב האלומה ומשקולות LM ישתנו בהתאם להגדרת זמן ההידור
של JuliusLib, סוג דגם AM וגודל LM. אנא עיין ביומן האתחול למידע בפועל
ערכים.

1st לעבור פרמטרים
-למפ מִשׁקָל עוֹנֶשׁ
(N-גרם) משקלי מודל שפה ועונשי הכנסת מילה למעבר הראשון.

-עונש 1 עוֹנֶשׁ
(דקדוק) עונש הכנסת מילה למעבר הראשון. (ברירת מחדל: 0.0)

-b רוחב
רוחב קרן במספר צמתי HMM עבור קרינת דירוג במעבר הראשון. הערך הזה
מגדיר את רוחב החיפוש במעבר הראשון, ויש לו השפעה דומיננטית על הסכום הכולל
זמן עיבוד. רוחב קטן יותר יאיץ את הפענוח, אבל ערך קטן מדי
יגרום לעלייה משמעותית של שגיאות זיהוי עקב חיפוש
כישלון. ערך גדול יותר יהפוך את החיפוש ליציב ויוביל ללא כשלים
חיפוש, אבל זמן העיבוד יגדל ביחס לרוחב.

ערך ברירת המחדל תלוי בסוג הדגם האקוסטי: 400 (מונופון), 800
(טריפון), או 1000 (טריפון, setup=v2.1)

-nlimit NUM
גבול עליון של אסימון לכל צומת. אפשרות זו תקפה כאשר --enable-wpair ו
--enable-wpair-nlimit מופעלים בזמן ההידור.

- פרוגאוט
אפשר פלט פרוגרסיבי של התוצאות החלקיות במעבר הראשון.

-פרוגנטרוול אלפיות שנייה
הגדר את מרווח הזמן עבור - פרוגאוט באלפיות שניות. (ברירת מחדל: 300)

2nd לעבור פרמטרים
-lmp2 מִשׁקָל עוֹנֶשׁ
(N-גרם) משקלי מודל שפה ועונשי הכנסת מילה עבור השני
לַעֲבוֹר.

-עונש 2 עוֹנֶשׁ
(דקדוק) עונש הכנסת מילה למעבר השני. (ברירת מחדל: 0.0)

-ב2 רוחב
רוחב אלומת המעטפת (מספר ההשערות) במעבר השני. אם הספירה של
הרחבת מילים באורך השערה מסויימת מגיעה לגבול הזה בזמן חיפוש,
השערות קצרות יותר אינן מורחבות יותר. זה מונע מחיפוש ליפול פנימה
מצב רוחב-ראשון כמו הערמה על אותה עמדה, ולשפר את החיפוש
כישלון בעיקר בגלל מצב אוצר מילים גדול. (ברירת מחדל: 30)

-sb לצוף
רוחב מעטפת הניקוד עבור ניקוד המעטפה. בעת חישוב ציון השערה
עבור כל השערה שנוצרה, הרחבת הסורג שלה ותפעול Viterbi יהיו
לגזום באמצע הנאום אם ניקוד על מסגרת יורד מתחת לרוחב.
מתן ערך קטן הופך את המעבר השני למהיר יותר, אך ייתכן שגיאות חישוב
מתרחש. (ברירת מחדל: 80.0)

-s NUM
גודל מחסנית, כלומר המספר המרבי של השערות שניתן לאחסן על
מחסנית במהלך החיפוש. ערך גדול יותר עשוי לתת תוצאות יציבות יותר, אבל
מגדיל את כמות הזיכרון הנדרשת. (ברירת מחדל: 500)

-m לספור
מספר ההשערות המורחבות הנדרשות כדי להפסיק את החיפוש. אם המספר
של השערות מורחבות גדול יותר מהסף הזה אם כן, החיפוש הוא
הופסק בשלב זה. ככל שהערך הזה גדול יותר, כך ג'וליוס מגיע לזמן ארוך יותר
לוותר על החיפוש. (ברירת מחדל: 2000)

-n NUM
מספר המועמדים שיוליוס מנסה למצוא. החיפוש נמשך עד זה
נמצאו מספר השערות משפטיות. השערות המשפט שהתקבלו
ממוינים לפי ציון, והתוצאה הסופית מוצגת לפי הסדר (ראה גם את
-תְפוּקָה). האפשרות שההשערה האופטימלית נמצאה נכונה
גדל ככל שהערך הזה גדל, אבל גם זמן העיבוד הופך
ארוך יותר. ערך ברירת המחדל תלוי בהגדרת המנוע בזמן ההידור: 10
(סטנדרטי) או 1 (מהיר או v2.1)

-תְפוּקָה NUM
השערת המשפט N העליון שתופיע בסוף החיפוש. תשתמש עם -n
(ברירת מחדל: 1)

-טווח חיפוש מסגרת
הגדר את מספר הפריימים לפני ואחרי כדי לחפש את השערות המילה הבאה ב-
מילה סבכה במעבר השני. זה מונע השמטת מילים קצרות, אבל
עם ערך גדול, מספר ההשערות המורחבות גדל והמערכת
הופך לאיטי. (ברירת מחדל: 5)

-לוקטרליס
(דקדוק) הרחב רק את המילים ששרדו במעבר הראשון במקום להרחיב
כל המילים שנחזה על ידי הדקדוק. אפשרות זו מבצעת פענוח מעבר שני
מהיר יותר במיוחד במצב של אוצר מילים גדול, אך עשוי להגביר את המחיקה
טעות של מילים קצרות. (ברירת מחדל: מושבת)

הפסקה קצרה פילוח / מפענח-VAD
כאשר הידור עם --enable-decoder-vad, הפילוח של הפסקה קצרה יהיה
מורחבת לתמיכה ב-VAD מבוסס מפענח.

-spsegment
אפשר מצב פילוח של הפסקה קצרה. הקלט יפולח בעת הפסקה קצרה
מילה (מילה עם מודל שתיקה בלבד בהגייה) מקבלת את הסבירות הגבוהה ביותר
במסגרות עוקבות מסוימות במעבר הראשון. כאשר זוהה סוף קטע,
יוליוס עצור את המעבר הראשון בנקודה, בצע את המעבר השני והמשיך במעבר הבא
מִגזָר. המילה הקשר תיחשב בין מקטעים. (Rev.4.0)

כאשר הידור עם --enable-decoder-vad, אפשרות זו מאפשרת VAD מבוסס מפענח,
לדלג על שתיקה ארוכה.

-spdur מסגרת
משך זמן הפסקה קצר לזיהוי סוף קטע הקלט, במספר פריימים.
(ברירת מחדל: 10)

-דוגמניות הפסקה מחרוזת
רשימה מופרדת בפסיקים של שמות מודלים להשהות לשימוש בהפסקה קצרה
הִתפַּלְגוּת. המילה שהגייתה מורכבת ממודלים של הפסקה בלבד
יטופל כ"מילת השהייה" ותשמש לזיהוי הפסקה. אם לא צוין,
שם של -spmodel, -ציף ו -זנב יהיה בשימוש. (Rev.4.0)

-spmargin מסגרת
שולי צעד אחורה בעת ההדק למעלה עבור VAD מבוסס מפענח. כאשר הדיבור מעלה הדק
נמצא על ידי מפענח-VAD, יוליוס יגלגל את פרמטר הקלט לאחור בערך זה, ו
להתחיל את ההכרה בנקודה. (Rev.4.0)

אפשרות זו תהיה תקפה רק אם היא מורכבת עם --enable-decoder-vad.

-השהייה מסגרת
הפעל מסגרת עיכוב החלטה בעת ההפעלה עבור VAD מבוסס מפענח. (Rev.4.0)

אפשרות זו תהיה תקפה רק אם היא מורכבת עם --enable-decoder-vad.

Word סָרִיג / בלבול רשת תפוקה
-סָרִיג , -נולטיקה
אפשר / השבת יצירת גרף מילים. גם אלגוריתם החיפוש השתנה ל
בצע אופטימיזציה ליצירת גרף מילים טוב יותר, כך שתוצאת המשפט עשויה לא להיות
זהה לזיהוי N-best רגיל. (Rev.4.0)

-confnet , -noconfnet
אפשר / השבת יצירת רשת בלבול. הפעלת זה יהיה גם
מופעל -סָרִיג כְּלַפֵּי פְּנִים. (Rev.4.0)

-טווח גרף מסגרת
מיזוג אותן מילים במיקום שכן ביצירת גרפים. אם שעת ההתחלה
וזמן הסיום של שתי מילים מועמדות של אותה מילה נמצא בטווח המצוין
טווח, הם ימוזגו. ברירת המחדל היא 0 (אפשר מיזוג של אותן מילים על
בדיוק באותו מיקום) וציון ערך גדול יותר יביא לקטן יותר
פלט גרף. הגדרת ערך זה ל-1 תשבית את המיזוג, במקרה זה זהה
מילים באותו מיקום של ציונים שונים יוותרו כפי שהן.
(ברירת מחדל: 0)

-גרפיקה עומק
חתוך את הגרף המתקבל לפי עומק המילים שלו בשלב שלאחר העיבוד. העומק
ערך הוא מספר המילים המותרות במסגרת. הגדרה ל-1 משביתה
תכונה זו. (ברירת מחדל: 80)

-graphboundloop לספור
הגבל את מספר לולאות התאמת הגבולות בשלב שלאחר העיבוד. זֶה
פרמטר מונע מג'וליוס לחסום על ידי לולאת התאמה אינסופית בקצרה
תנודת מילים. (ברירת מחדל: 20)

-graphsearchdelay , -nographsearchdelay
כאשר אפשרות זו מופעלת, יוליוס משנה את אלגוריתם יצירת הגרפים שלו
המעבר השני לא לסיים את החיפוש על ידי מיזוג גרפים, עד המשפט הראשון
נמצא מועמד. אפשרות זו עשויה לשפר את דיוק הגרפים, במיוחד כאשר אתה
הולכים ליצור גרף מילים ענק על ידי הגדרת חיפוש רחב. כלומר, זה עשוי
לגרום לדיוק גרף טוב יותר כאשר אתה מגדיר אלומות רחבות בשני המעבר הראשון -b ו
מעבר 2 -ב2, ומספר גדול עבור -n. (ברירת מחדל: מושבת)

רב גרם / רב דיק הכרה
-out multigramout , -נומולטיגרםout
על זיהוי דקדוק באמצעות דקדוקים מרובים, יוליוס יוציא רק את הטובים ביותר
תוצאה בין כל הדקדוקים. הפעלת אפשרות זו תגרום לג'וליוס לבצע פלט
תוצאה עבור כל דקדוק. (ברירת מחדל: מושבת)

כפוי יישור
-ווליין
בצע יישור ויטרבי ליחידות מילה עבור תוצאת הזיהוי. המילה
מסגרות גבול והציונים האקוסטיים הממוצעים לפריים יחושבו.

-פיין
בצע יישור ויטרבי ליחידות טלפון עבור תוצאת הזיהוי. הטלפון
מסגרות גבול והציונים האקוסטיים הממוצעים לפריים יחושבו.

-סליין
בצע יישור ויטרבי לכל מצב עבור תוצאת הזיהוי. גבול המדינה
מסגרות והציונים האקוסטיים הממוצעים לכל פריים יחושבו.

שונה. search אפשרויות
-לֹא פָּעִיל
התחל את מופע תהליך הזיהוי הזה במצב לא פעיל. (Rev.4.0)

-1 מעבר
בצע רק את המעבר הראשון.

-fallback1pass
כשהמעבר השני נכשל, ג'וליוס מסיים את ההכרה ללא תוצאה. אפשרות זו
אמור לג'וליוס להוציא את תוצאת המעבר הראשון כתוצאה סופית כאשר המעבר השני
נכשל. שים לב שייתכן כי פלט ניקוד מסוים (ביטחון וכו') לא יהיה שימושי. זה היה
התנהגות ברירת המחדל של Julius-3.x.

-לא_ccd , -force_ccd
החלף במפורש את הטיפול בהקשר הטלפון בחיפוש. בדרך כלל יוליוס קובע
האם השימוש ב-AM הוא מודל תלוי הקשר או לא משמות המודלים,
כלומר, האם השמות מכילים תו + ו-. אפשרות זו תעקוף את
זיהוי אוטומטי.

-קמלפה לצוף
פרמטר החלקה לציון ביטחון. (ברירת מחדל: 0.05)

-iwsp
(מצב ריבוי נתיבים בלבד) אפשר הכנסת הפסקה קצרה ללא הקשר בין מילים.
אפשרות זו מוסיפה מודל הפסקה קצרה שניתן לדלג עליה לכל סוף מילה. ה
ניתן לציין מודל של הפסקה קצרה על ידי -spmodel.

-טרנספ לצוף
עונש הכנסה נוסף למילים שקופות. (ברירת מחדל: 0.0)

-הַדגָמָה
שווה ערך ל - פרוגאוט -שֶׁקֶט.

הסביבה וריאציות


אלסדב
(באמצעות קלט מיקרופון עם מכשיר alsa) ציין שם התקן לכידה. אם לא צוין,
ישמש "ברירת מחדל".

AUDIODEV
(באמצעות קלט מיקרופון עם מכשיר oss) ציין נתיב התקן לכידה. אם לא צוין,
"/dev/dsp" יהיה בשימוש.

LATENCY_MSEC
נסה להגדיר את זמן השהיה של קלט המיקרופון באלפיות שניות. ערך קטן יותר יהיה
לקצר את זמן האחזור אך לפעמים להפוך את התהליך ללא יציב. ערך ברירת המחדל יהיה תלוי ב
מערכת הפעלה פועלת.

דוגמאות


לדוגמאות לשימוש במערכת, עיין בסעיף ההדרכה במסמכי יוליוס.

הודעה


הערה לגבי קבצי jconf: נתיבים יחסיים בקובץ jconf מתפרשים כיחסיים ל-
קובץ jconf עצמו, לא לספרייה הנוכחית.

השתמש ב-julius באינטרנט באמצעות שירותי onworks.net


Ad


Ad