Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Chạy máy chủ | Ubuntu > | Fedora > |


Biểu tượng yêu thích OnWorks

kcc - Trực tuyến trên Đám mây

Chạy kcc trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks qua Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh kcc có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


kcc - Trình che phủ mã Kanji với tính năng tự động phát hiện mã hóa

SYNOPSIS


kcc [ -IOchnvxz ] [ -b bufsize ] [ hồ sơ ] ...

MÔ TẢ


kcc là một bộ lọc đọc hồ sơ theo thứ tự, chuyển đổi mã hóa kanji và đầu ra thành
stdout. Nếu không có tệp nào được chỉ định hoặc được chỉ định - dưới dạng tên tệp, nó đọc từ stdin. Bạn có thể
chỉ định mã hóa kanji cho đầu vào / đầu ra. Tuy vậy, kcc tự động phát hiện mã hóa đầu vào,
nếu bạn không chỉ định mã hóa đầu vào.

Các bảng mã kanji có sẵn là JIS (7 bit và / hoặc 8 bit), Shift JISEUCDEC. Cho đầu vào
mã hóa, bạn có thể kết hợp khi chúng là cặp của một trong EUC DEC hoặc Shift JIS và 7 bit JIS.
SI/SOESC (Tôi được công nhận là một nửa băng thông của JIS.

LỰA CHỌN


-O
-IO I để mã hóa kanji đầu vào¡¤O để mã hóa kanji đầu ra. Khi không có mã hóa đầu vào
được chỉ định, nó sẽ được phát hiện tự động và nếu cả hai đầu vào / đầu ra đều không
được chỉ định, mã hóa đầu ra là 7 bit JIS.

Bạn có thể chỉ định một trong những điều sau cho tùy chọn mã hóa đầu vào, I.

e EUC (khả dụng với JIS 7 bit)
d DEC (khả dụng với JIS 7 bit)
s Shift JIS (khả dụng với JIS 7 bit)
j7 or k
7 bit JIS
8 8 bit JIS

Bạn có thể chỉ định một trong những điều sau cho tùy chọn mã hóa đầu ra, O.

e EUC
d Tháng mười hai
s Shift JIS
jXY or 7XY
7 bit JIS (sử dụngSI/SO để chỉ định JIS kana)
kXY 7 bit JIS (sử dụngESC (tôi để chỉ định JIS kana)
8XY 8 bit JIS

By XY in O tùy chọn, Bạn có thể chỉ định trình tự thoát nào được sử dụng trong mã hóa JIS. BJ
là mặc định. Ký hiệu kanji bổ sung được cố định thành ESC $ (D

X Kanji được chỉ định bởi:
B ESC $ B(JIS X0208-1983)
@ ESC $ @(JIS X0208-1978)
+ ESC & @ ESC $ B(JIS X0212-1990)
Y Alpha Numerical được chỉ định bởi:
B ESC (B(ASCII)
J ESC (J(JIS Roman; JIS X0201)
H ESC (H(Tiếng Thụy Điển; bị phản đối mạnh mẽ)

-v kết quả đầu ra của việc phát hiện mã hóa đầu vào tới stderr.

-x Chế độ mở rộng. Bằng cách tự động phát hiện các mã hóa đầu vào, nhận dạng do người dùng xác định
ký tự và vùng ký tự mở rộng (nằm ngoài phạm vi EUC, nửa chiều rộng không xác định
kana, ký tự điều khiển, vùng C1 và / hoặc vùng ký tự mở rộng Shift C1 JIS).
Phân biệt giữa DEC và EUC được thực hiện trong chế độ này.

-z Chế độ co lại. Không nhận dạng kana nửa băng thông (ngoại trừ JIS 7 bit) với mã hóa đầu vào
sự phát hiện. Với tùy chọn này, độ chính xác của việc tự động phát hiện các mã hóa đầu vào trở nên
tốt hơn nhiều cho tệp không có kana nửa băng thông.

-h Thông thường, khi chuyển đổi kana nửa băng thông sang DEC, nó sẽ trở thành Katakana băng thông đầy đủ.
Với tùy chọn này, nó sẽ trở thành Hiragana.

-n ký tự do người dùng xác định, ký tự mở rộng và ký tự kanji bổ sung
được chuyển đổi thành hộp trắng có độ rộng toàn phần và vùng không xác định của kana nửa độ rộng băng thông là
được chuyển đổi thành dấu chấm ở giữa một nửa chiều rộng.

-b bufsize
chỉ định kích thước bộ đệm. 8kbyte là mặc định.

-c không chuyển đổi nhưng kiểm tra mã hóa đầu vào và in kết quả thành stdout. Khác với
tự động phát hiện bình thường, toàn bộ nội dung của tệp được kiểm tra. Tuy nhiên, khi
sự không nhất quán của các bảng mã được tìm thấy, hủy bỏ việc đọc và in "dữ liệu". Tùy chọn
ngoại trừ -x¡¤-z bị bỏ qua.

VÍ DỤ


% kcc -e hồ sơ
Mã hóa đầu vào được phát hiện tự động và đầu ra ở dạng mã hóa EUC.

% kcc -sj tệp1 tệp2
Hai tệp trong Shift JIS đồng thời chuyển đổi sang JIS.

% lệnh | kcc -k + J
đầu ra của lệnh đang chuyển đổi đến JIS (JIS JIS X0208 JIS JIS Roman¡¤ESC (tôi Một nửa chiều rộng
Kana JIS)

% kcc -c hồ sơ
Mã hóa nội dung của hồ sơ được phát hiện (không có chuyển đổi)

BUG


Tự động phát hiện mã hóa đầu vào được thực hiện tốt đối với trường hợp bình thường, tuy nhiên, nó có
các vấn đề sau.

JIS 7 bit được nhận dạng bởi trình tự thoát nhất định. EUC và DEC giống nhau (tham khảo
như loạt EUC). Kana nửa băng thông của 8 bit JIS giống như kana nửa băng thông của Shift JIS
(được gọi là dòng Shift JIS). Tuy nhiên, loạt EUC và JIS, đều là 8 bit
mã hóa, đang chia sẻ rộng rãi các khu vực giống nhau. Vì vậy, vấn đề trong phát hiện tự động là
phát hiện 2 bảng mã này.

Việc phát hiện dòng EUC / dòng Shift JIS được thực hiện theo từng dòng một, Khi nhận thấy rằng
nó không phải là dòng Shift JIS hoặc không phải là dòng EUC, mã hóa được xác định. Khi nào
không nhất quán được tìm thấy, nó sẽ được coi là "dữ liệu" và nội dung của đầu ra không
Đảm bảo.

Trong khi được xác định giữa chuỗi EUC / chuỗi Shift JIS sau khi tìm thấy mã 8bit, các chuyển đổi
đang chờ xử lý và đưa dữ liệu đầu vào vào bộ đệm, tuy nhiên, bộ đệm đã đầy, nó giả định đó là EUC
chuỗi và các lực lượng để bắt đầu chuyển đổi. Cơ sở lý luận. Thông thường, chúng ta có thể cho rằng các tài liệu
với chữ kanji bao gồm JIS non-kanji hoặc JIS tiêu chuẩn đầu tiên, nó có thể được phát hiện trong một số trường hợp
đó là Shift JIS, không chia sẻ khu vực với EUC. Vì vậy, nếu nó không thể được xác định,
nó rất có thể là EUC.

JIS 8 bit và nó luôn có số lượng chuỗi kana nửa băng thông chẵn, khi đó nó sẽ là
bị phát hiện sai là chữ kanji EUC. Hãy kiên nhẫn.

Nếu mã hóa đầu vào không có kana nửa băng thông, hãy sử dụng -z và độ chính xác của phát hiện trở thành
tốt hơn nhiều. Điều này là do khu vực được chia sẻ bị hạn chế đối với khu vực của JIS thứ hai
tiêu chuẩn.

Khu vực mở rộng của Shift JIS khu vực do người dùng xác định của EUC, các ký tự điều khiển C1 của EUC,
vùng không xác định của kana nửa băng thông của EUC nằm ngoài phạm vi phát hiện tự động, vì vậy nó sẽ
không thể phát hiện các mã hóa nếu đầu vào có các ký tự này. Sử dụng -x tùy chọn để chỉ định
chế độ mở rộng hoặc chỉ định mã đầu vào.

Sử dụng kcc trực tuyến bằng các dịch vụ onworks.net


Ad


Ad