זוהי הפקודה g2p-sk שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
g2p-sk - תעתיק פונטי לסלובקית
תַקצִיר
g2p-sk [--color] [--dl רמת ניפוי באגים] [--help] [--stats] [--ofile ] [
קובץ>]
תיאור
התעתיק הפונטי חיוני לזיהוי לשוני או דיבור כלשהו
יישומים. בהתאם לשפה יש גישה מבוססת כללים או סטטיסטית
בשימוש. g2p-sk מיישמת את הגישה מבוססת הכללים אך בעתיד היא עשויה להיות מוחלפת ב
אחד סטטיסטי.
כל מילת קלט המורכבת מרצף הגרפמים מתומללת לרצף
של טלפונים בקידוד SAMPA. אם לא צוין קובץ קלט, הקלט הסטנדרטי הוא
צָפוּי. אם נעשה שימוש בקובץ קלט אז הפלט נכתב גם בקובץ. ה
שם הקובץ הוא שם קובץ קלט עם הסיומת "_trans.txt".
דף הקוד של פלט הקלט הוא ISO 8859-2. כדי להשתמש בו עם CP שונה השתמש בכמה CP
ממיר וצינורות. למשל כדי לקבל קלט ופלט בשימוש ב-UTF-8 (עבור אינטראקטיבי
להשתמש): פילטרם UTF8-iso2 iso2-UTF8 g2p-sk או (לעיבוד אצווה) סמל -f UTF-8 -t
ISO_8859-2 | g2p-sk | סמל -f ISO_8859-2 -t UTF-8
ביצועי התעתיק הפונטטי תלויים בפילוח המורפמטי. ל
לשפר את איכות הפילוח המורפמטי אפשר להחליף את הקטן
גרסה של המילון המורפמטי הפשוט ב-
/usr/share/g2p_sk/Exceptions/morfemy.dat עם הטוב יותר. הפילוח הסילבי
חשוב לא פחות מהמורפמטי. הפילוח ההברתי מסופק על ידי sylseg-sk
חֲבִילָה.
העיצוב של g2p-sk תלוי בשפה. כדי להשתמש בו עבור שפה אחרת הכל
צריך לשכתב כללים.
אפשרויות
--צֶבַע
אפשר פלט צבע.
--dl 1..5
הגדר את רמת ניפוי הבאגים. שלוט בכמות המידע המוצג רמת ניפוי הבאגים 0
לא מציג כלום. הרמה המקסימלית 5 מציגה דוח איתור באגים מלא. ברירת המחדל
רמת ניפוי באגים היא 1.
--help הצג טקסט עזרה קצר
--file
כתוב פלט גם בקובץ נתון.
--סטטיסטיקות
ספור והצג סטטיסטיקה עבור כל טלפון
דוגמאות
השתמש בקלט סטנדרטי וניפוי באגים ברמה 3:
g2p-sk --dl 3
עבד את כל מהקובץ aaa.txt:
g2p-sk aaa.txt
יְצִיאָה סטָטוּס
g2p-sk מחזיר אפס אם הוא מצליח לעבד את כל מילות הקלט
השתמש ב-g2p-sk באינטרנט באמצעות שירותי onworks.net