אנגליתצרפתיתספרדי

Ad


סמל OnWorks

kakasi - מקוון בענן

הפעל את kakasi בספק אירוח בחינם של OnWorks על אובונטו מקוון, פדורה מקוון, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זוהי הפקודה kakasi שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


KAKASI - מהפך פשוט של קאנג'י קאנה (בין קאנג'י, גם קאנה ורומאג'י)

תַקצִיר


קאקאסי [אפשרויות] [jisyo1 [jisyo2 [jisyo1,,]]]

תיאור


KAKASI ביפנית משפטים מורכבים לרוב מתערובת של תווים סיניים (קאנג'י),
קאנה (Hiragana ו-Katakana) ו-Romaji (הגייה פונטית בלטינית). התוכנית הזו
ממיר בין ארבע הדרכים השונות הללו לכתיבה יפנית.

תוכנית זו שימושית עבור אלה שהמסוף או שולחן העבודה שלהם אינם תומכים במקור
תצוגה של יפנית. כמו כן, זהו כלי נהדר עבור אלה שלומדים יפנית
(סטודנטים וילדים בינלאומיים וכו').

ניתן להעביר מילה לקלט הסטנדרטי (stdin), ולאחר מכן היא מתורגמת ויוצאת אליה
standard out (stdout). בדוגמה הבאה ה-"בunchu" קאנג'י מומר
היראגנה.

kakasi -JH < מסמך

מאז גרסה 2.3.0 נתמך טקסט עם רווחים בין מילים. בתוך ה
הדוגמה הבאה לפלט יש רווחים בין כל מילה.

kakasi -w < מסמך

מאז גרסה 2.3.5 רמת המרה נתמך. בדוגמה הבאה,
קנג'ים פשוטים נשארים ללא המרה, וקנג'ים קשים מתורגמים ל
היראגנה.

kakasi -l4 < מסמך

KAKASI אפשר להמיר אותיות לתווים אלפביתיים. גם קטאקנה
אותיות בערכת התווים JIS x0201 ו-Hiragana בערכת התווים JIS x0208 יכולים
להתגייר בין זה לזה.

KAKASI ערכת התווים הבאה בסוגריים שמוצגת.

ASCII (א) ידוע בתור סט תווים "ascii".

JISROMAN (י)
ידוע בתור סט דמויות "jis roman".

גרפיקה (ג)
זוהי ערכת התווים הגרפית של DEC.

קטאקנה (ק)
JIS x0201, מוגדר כחלק ממערך התווים GR.

מטעמי נוחות, JIS x0208 מחולק כמפורט להלן.

קאנג'י (J)
תווי JIS x0208 הכלולים בין 16 ל-94 מקטעים.

Hiragana (H)
תווי JIS x0208 הכלולים בסעיף 4 (Hiragana)

קטאקנה (K)
תווי JIS x0208 הכלולים בסעיף 5 (קטקאנה)

סימן (E)
תווי JIS x0208 הכלולים בסעיפים 1,2,3,6,7 ו-8. (שים לב שהסעיף
9-15 אינם מוגדרים ב-JIS x0208.)

תרגום בין ערכות התווים הבאות זמין.

ASCII -> JISROMAN, סימן

JISROMAN -> ASCII, סימן

גרפיקה -> ASCII, JISROMAN, סימן

JISx0201 קטאקנה
-> ASCII, JISROMAN, קאנה, Hiragana

סימן -> ASCII, JISROMAN

Katakana -> ASCII, JISROMAN, JISx0201 Katakana, Hiragana

Hiragana -> ASCII, JISROMAN, JISx0201 Katakana, קאנה

Kanji -> ASCII, JISROMAN, JISx0201 Katakana, Kana, Hiragana

עם המרה של ASCII וה-JISROMAN, המרת התווים האלפביתי מתבצעת
מ-JISx0201 Katakana, Katakana, Hiragana וקאנג'י.

דוגמא:

1. כל דמויות הקאנג'י מומרות ל-Hiragana.

קאקאסי -JH

2. כל תווי JIS x0208 מומרים ל-JIS X 0201.

קאקאסי -Hk -Kk -Jk -Ea

3. כל התווים מומרים ל-JIS X 0208.

kakasi -aE -jE -gE -kK

4. כל התווים מומרים ל-ascii והמילים מופרדות.

קאקאסי -הא -קא -ג'ה -אה -קה

5. החלפה בין דמויות קטאקנה והיראגנה.

קאקאסי -HK -KH

המרה יָעוּדִי אופי SET


חלק ממערכות התווים מסווגות לפי קאקאסי ומצויינות על ידי מנימוני הזיכרון הבאים: a, j,
g, k, E, H, K, J.

a --- תווי ASCII
j --- JIS ROMAN (כמעט שווה ל-ASCII, "~" ו-"
שונה ) שהוגדר על ידי JIS x0201
g --- DEC תווים גרפיים
k --- KATAKANA שהוגדר על ידי JIS x0201

E, H, K ו-J כלולים בערכת התווים JIS x0208.

J --- דמויות KANJI של JIS x0208.
H --- תווים HIRAGANA של JIS x0208.
K --- תווי KATAKANA של JIS x0208.
E --- שאר התווים לעיל של JIS x0208 הכולל
אלפבית, מספרים, סמלים וכן הלאה.

-(מ)(אל) פירושו המרה מקבוצת תווים (מ) ל(אל). לדוגמה, אפשרות -JK
גורם לכך שתווי KANJI מומרים ל-HIRAGANA. השילובים בטבלה הבאה הם
זמין. (אסור לזכור את זה, כי ה-h מציג את אותו מידע)

ל\מ| ajk EHKJ g
-------+-------------------------------------------------- --
א | - o o1 o o1 o1 o12 o
י | o - o1 o o1 o1 o12 o
ק | - או o2
ה | או - או
ח | o - o o2
ק | או -

o -- הומר.
1 - הומר ל-Romaji.
2 -- קאנג'י -> המרת קאנה.

קנג'י סִמוּל המרה


למרבה הצער, מספר מערכות קידוד משמשות ביפן ותקן JIS x0208 השתנה
ב-1983. לכן, KAKASI יכול להבחין אוטומטית בין מערכת הקידוד והקידוד
גרסה ולאחר מכן השתמש באותה מערכת קידוד פלט אם המסמך אינו כולל JIS
x0201 KATAKANA. אם JIS x0201 KATAKANA כלול או שאתה רוצה לשנות קידוד קאנג'י
מערכת, תוכל להשתמש באפשרויות הבאות.

-i : קידוד קלט
-o : קידוד פלט

jis -- בשימוש נרחב באינטרנט. (לדוגמה: fj, jp, .. קבוצות דיון)
נגזר משיטת קידוד ISO-2022.
newjis: JISx0208 (1983) שהופעל על ידי ESC-$-B.
oldjis: JISx0208 (1978) שהופעל על ידי ESC-$-@.
euc,dec -- משמש לעתים קרובות ב-UNIX כמו מחשבים. JISx0208 הוא
מוקצה ל-GR (MSB הוא 1). ההבדל העיקרי בין
euc ו-dec היא הקצאה של JISx0201 KATAKANA ו
הדמות הגרפית של DEC.
sjis -- מוגדר על ידי Microsoft Corp. בשימוש נרחב על אישי
מחשבים (MSDOS, Mac, ..)
utf8 - תקן בינלאומי נוכחי. כל מערכת ההפעלה המודרנית משתמשת בזה
קידוד של ערכת התווים של Unicode כברירת מחדל.

ROMAJI המרה


אפשרויות המרה של Kanji Kana. בשימוש עם -J? אוֹפְּצִיָה. ישנם 2 סוגים של כתיבה רומאג'י.
הראשונה היא שיטת Kunrei שהוגדרה על ידי ממשלת יפן, והשנייה היא
שיטת הפבורן. אני חושב ששיטת הפבורן נשמעת טבעית לזרים.

-rhepburn: שיטת הפבורן (ברירת מחדל)
-רקונריי: שיטת קונרי

אחר אפשרויות


-p: רשום את כל הקריאות האפשריות. אם קיימים שניים או יותר
קריאות אפשריות, KAKASI מציג אותן בסוגריים {aaa,bbb}.
-s: הכנס תו נפרד בין המילים.
-f: מצב Furigana. מציג את מילת הקאנג'י המקורית עם קריאה.
-c: דלג על תווים בתוך מילה. (ברירת מחדל TAB CR LF BLANK)
-C: השתמש באותיות רישיות במילה Romaji (עם אפשרות -Ja או -Jj)
-U: מילת romaji מרוכזת (עם אפשרות -Ja או -Jj)
-u: התקשר ל-fflush().
-w: מצב wakatigaki. 'wakatigaki' הוא פילוח מילים עבור
משפטים יפניים.

מנחים


KAKASI יכול לקבל מילון נוסף למילון המערכת. הפורמט המקובל
של מילון נוסף הוא SKK פורמט, ו Wnn פורמט, וכן הלאה. כלומר, כל שיא הוא
שורה אחת עם שני שדות, יומי (קריאה) ו-Jukugo (אידיום). השדות מופרדים עם
פסיקים (או TAB, או ריק). קוד הקאנג'י מוגבל ל-JIS או EUC. ראה אחר
מסמך בשם JISYO לפרטים נוספים.

הסביבה וריאציות


ההתנהגות מושפעת ממשתני הסביבה הבאים.

KANWADICTPATH
מציין נתיב של kanwadict (נתיב מלא כולל שם קובץ). ערך ברירת המחדל הוא
/usr/share/kakasi/kanwadict.

ITAIJIDICTPATH
מציין נתיב של itaijidict (נתיב מלא כולל שם קובץ). ערך ברירת המחדל הוא
/usr/share/kakasi/itaijidict.

השתמש ב- kakasi באינטרנט באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

פקודות לינוקס

Ad