انگلیسیفرانسویاسپانیایی

Ad


فاویکون OnWorks

kakasi - آنلاین در ابر

kakasi را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این دستور kakasi است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


KAKASI - اینورتر ساده کانجی کانا (بین کانجی، هر دو کانا و روماجی)

خلاصه


کاکاسی [گزینه ها] [jisyo1 [jisyo2 [jisyo1,,]]]

شرح


کاکاسی در زبان ژاپنی جملات اغلب ترکیبی از حروف چینی ساخته می شوند (کانجی)،
کانا (هیراگانا و کاتاکانا) و روماجی (تلفظ آوایی لاتین). این برنامه
بین این چهار روش مختلف نوشتن ژاپنی تبدیل می شود.

این برنامه برای کسانی مفید است که ترمینال یا دسکتاپ آنها از بومی پشتیبانی نمی کند
نمایش ژاپنی همچنین این یک ابزار عالی برای کسانی است که در حال یادگیری زبان ژاپنی هستند
(دانشجویان بین المللی و کودکان و غیره).

یک کلمه را می توان به ورودی استاندارد (stdin) منتقل کرد، سپس آن را ترجمه و خروجی به آن داد
استاندارد خارج (stdout). در مثال زیر "بونچو" کانجی به تبدیل شده است
هیراگانا

kakasi -JH < سند

از نسخه 2.3.0 متن با فاصله بین کلمات پشتیبانی شده است. در
مثال زیر خروجی بین هر کلمه فاصله دارد.

kakasi -w < سند

از آنجایی که حالت تبدیل سطح نسخه 2.3.5 پشتیبانی شده است. در مثال زیر،
کانجی های ساده تبدیل نشده رها می شوند و کانجی های دشوار به آنها ترجمه می شوند
هیراگانا

kakasi -l4 < سند

کاکاسی امکان تبدیل حروف به حروف الفبا وجود دارد. همچنین کاتاکانا
حروف در مجموعه کاراکترهای JIS x0201 و هیراگانا در مجموعه کاراکترهای JIS x0208 می توانند
بین یکدیگر تبدیل شوند.

کاکاسی کاراکتر زیر در پرانتز تنظیم می شود که نمایش داده می شود.

ASCII (الف) معروف به مجموعه کاراکتر "ascii".

JISROMAN (j)
معروف به مجموعه شخصیت "jis roman".

گرافیک (گرم)
این مجموعه کاراکترهای گرافیکی DEC است.

کاتاکانا (k)
JIS x0201، به عنوان بخشی از مجموعه کاراکترهای GR تعریف شده است.

برای اطمینان، JIS x0208 به شرح زیر تقسیم می شود.

کانجی (J)
کاراکترهای JIS x0208 شامل 16 تا 94 بخش است.

هیراگانا (H)
کاراکترهای JIS x0208 موجود در بخش 4 (هیراگانا)

کاتاکانا (K)
کاراکترهای JIS x0208 موجود در بخش 5 (کاتاکانا)

علامت (E)
کاراکترهای JIS x0208 موجود در بخش 1,2,3,6,7،8،XNUMX،XNUMX،XNUMX و XNUMX. (به آن بخش توجه کنید
9-15 در JIS x0208 تعریف نشده است.)

ترجمه بین مجموعه کاراکترهای زیر موجود است.

ASCII -> JISROMAN، علامت

JISROMAN -> ASCII، علامت

GRAPHIC -> ASCII، JISROMAN، Sign

JISx0201 کاتاکانا
-> ASCII، JISROMAN، Kana، Hiragana

علامت -> ASCII، JISROMAN

Katakana -> ASCII، JISROMAN، JISx0201 Katakana، Hiragana

هیراگانا -> ASCII، JISROMAN، JISx0201 Katakana، Kana

Kanji -> ASCII، JISROMAN، JISx0201 Katakana، Kana، Hiragana

با تبدیل ASCII و JISROMAN، تبدیل حروف الفبا انجام می شود
از JISx0201 Katakana، Katakana، Hiragana و Kanji.

مثال:

1. تمام شخصیت های کانجی به هیراگانا تبدیل می شوند.

کاکاسی -جی اچ

2. تمام کاراکترهای JIS x0208 به JIS X 0201 تبدیل می شوند.

kakasi -Hk -Kk -Jk -Ea

3. همه کاراکترها به JIS X 0208 تبدیل می شوند.

kakasi -aE -jE -gE -kK

4. همه کاراکترها به ascii تبدیل می شوند و کلمات از هم جدا می شوند.

kakasi -Ha -Ka -Ja -Ea -ka

5. تبادل بین شخصیت های کاتاکانا و هیراگانا.

kakasi -HK -KH

تبدیل تعیین شده است شخصیت مجموعه


برخی از مجموعه شخصیت‌ها با کاکاسی دسته‌بندی می‌شوند و با یادداشت‌های زیر نشان داده می‌شوند: a، j،
g، k، E، H، K، J.

یک --- کاراکترهای ASCII
j --- JIS ROMAN (تقریبا برابر با ASCII، "~" و "
متفاوت) تعریف شده توسط JIS x0201
g --- کاراکترهای گرافیکی DEC
k --- KATAKANA تعریف شده توسط JIS x0201

E، H، K و J در مجموعه کاراکترهای JIS x0208 گنجانده شده است.

J --- کاراکترهای KANJI JIS x0208.
H --- کاراکترهای HIRAGANA JIS x0208.
K --- کاراکترهای KATAKANA JIS x0208.
E --- بقیه کاراکترهای فوق JIS x0208 که شامل
حروف الفبا، اعداد، نمادها و غیره.

-(از)(به) به معنای تبدیل از مجموعه کاراکتر (از) به (به) است. به عنوان مثال، گزینه -JK
باعث می شود کاراکترهای KANJI به HIRAGANA تبدیل شوند. ترکیبات در جدول زیر هستند
در دسترس. (شما نباید آن را به خاطر بسپارید، زیرا -h اطلاعات مشابهی را نشان می دهد)

به\از| ajk EHKJ g
-------+----------------------------------------- --
یک | - o o1 o o1 o1 o12 o
j | o - o1 o o1 o1 o12 o
k | - oo o2
E | اوو - ای
H | o - o o2
K | اوه -

o -- تبدیل شده است.
1 -- تبدیل به روماجی.
2 -- کانجی -> تبدیل کانا.

کانجی کدنویسی تبدیل


متأسفانه چندین سیستم کدگذاری در ژاپن استفاده می شود و استاندارد JIS x0208 تغییر کرده است
در سال 1983. بنابراین، KAKASI می تواند به طور خودکار سیستم کدگذاری و کدگذاری را تشخیص دهد
ویرایش کنید و سپس از همان سیستم کدگذاری خروجی استفاده کنید اگر سند شامل JIS نیست
x0201 کاتاکانا. اگر JIS x0201 KATAKANA گنجانده شده است یا می خواهید کدگذاری کانجی را تغییر دهید
سیستم، می توانید از گزینه های بعدی استفاده کنید.

-i: کدگذاری ورودی
-o: کدگذاری خروجی

jis -- به طور گسترده در اینترنت استفاده می شود. (مثلاً: گروه های خبری fj، jp، ..)
برگرفته از روش کدگذاری ISO-2022.
newjis: JISx0208 (1983) توسط ESC-$-B فراخوانی شده است.
oldjis: JISx0208 (1978) توسط ESC-$-@ فراخوانی شده است.
euc,dec -- اغلب در یونیکس مانند کامپیوترها استفاده می شود. JISx0208 است
به GR اختصاص داده شده است (MSB 1 است). تفاوت عمده بین
euc و dec تخصیص JISx0201 KATAKANA و
کاراکتر گرافیکی DEC
sjis -- تعریف شده توسط Microsoft Corp. به طور گسترده در شخصی استفاده می شود
کامپیوترها (MSDOS، Mac، ..)
utf8 -- استاندارد بین المللی فعلی. همه سیستم عامل های مدرن از این استفاده می کنند
کدگذاری کاراکتر یونیکد به عنوان پیش فرض.

روماجی تبدیل


گزینه های تبدیل کانجی کانا استفاده شده با -J؟ گزینه. 2 نوع نوشتار روماجی وجود دارد.
اولی روش Kunrei است که توسط دولت ژاپن تعریف شده است و دومی روش
روش هپبورن من فکر می کنم روش هپبورن برای خارجی ها طبیعی است.

-rhepburn: روش هپبورن (پیش‌فرض)
-rkunrei: روش Kunrei

OTHER OPTIONS


-p: فهرست همه قرائت های ممکن. اگر دو یا بیشتر وجود دارد
قرائت های ممکن، KAKASI آنها را در پرانتزهای {aaa,bbb} نشان می دهد.
-s: یک کاراکتر جداگانه بین کلمات درج کنید.
-f: حالت Furigana. کلمه کانجی اصلی را با خواندن نشان می دهد.
-c: رد شدن از کاراکترهای درون word. ( پیش فرض TAB CR LF BLANK )
-C: کلمه Romaji را با حروف بزرگ بنویسید (با گزینه -Ja یا -Jj)
-U: کلمه روماجی با حروف بزرگ (با گزینه -Ja یا -Jj)
-u: فراخوانی flush().
-w: حالت wakatigaki. 'wakatigaki' تقسیم بندی کلمه برای است
جملات ژاپنی

گفتگوها


کاکاسی می تواند فرهنگ لغت اضافی را به فرهنگ لغت سیستم بپذیرد. فرمت قابل قبول
از فرهنگ لغت اضافی است SKK فرمت، و Wnn قالب و غیره یعنی هر رکورد است
یک خط با دو فیلد، Yomi (خواندن) و Jukugo (اصطلاحات). فیلدها با
کاما (یا TAB یا خالی). کد کانجی به JIS یا EUC محدود شده است. دیگری را ببینید
سند به نام JISYO برای جزئیات بیشتر.

محیط زیست متغیرها


رفتار تحت تأثیر متغیرهای محیطی زیر قرار می گیرد.

KANWADICTPATH
یک مسیر kanwadict (مسیر کامل شامل نام فایل) را مشخص می کند. مقدار پیش فرض است
/usr/share/kakasi/kanwadict.

ITAIJIDICTPATH
مسیر itaijidict (مسیر کامل شامل نام فایل) را مشخص می کند. مقدار پیش فرض است
/usr/share/kakasi/itaijidict.

با استفاده از خدمات onworks.net از kakasi به صورت آنلاین استفاده کنید


سرورها و ایستگاه های کاری رایگان

دانلود برنامه های ویندوز و لینوکس

دستورات لینوکس

Ad