Đây là lệnh mbconv có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
mbconv - Trình chuyển đổi lược đồ mã hóa ký tự
SYNOPSIS
mbconv [tùy chọn] ...
MÔ TẢ
Đây là một ứng dụng của thư viện để xử lý mã hóa ký tự nhiều octet:
http://pub.ks-and-ks.ne.jp/prog/libmoe/
chủ yếu được viết để gỡ lỗi của thư viện.
Nó đọc octet theo octet từ các tệp được cung cấp trên dòng lệnh (hoặc đầu vào tiêu chuẩn nếu không có tệp
được chỉ định), chuyển đổi lược đồ mã hóa ký tự (CES) như được chỉ định bởi các tùy chọn dòng lệnh
(được mô tả bên dưới) và xuất ra đầu ra tiêu chuẩn (hoặc một tệp được chỉ định bởi -t tùy chọn hoặc -a
Tùy chọn).
Các lựa chọn
-?, -h, --Cứu giúp
hiển thị tóm tắt các tùy chọn và lối thoát.
-a hồ sơ, --đăng nhập=hồ sơ
đầu ra được thêm vào hồ sơ.
-c chuyển đổi, - chuyển đổi sang=chuyển đổi
chỉ định chuyển đổi mã hóa ký tự. chuyển đổi phải được phân tách bằng dấu phẩy danh sách
các từ được mô tả trong "Thông số kỹ thuật chuyển đổi".
-f cờ, --lá cờ=cờ
chỉ định các cờ để thay đổi hành vi chuyển đổi. cờ danh sách phải được phân tách bằng dấu phẩy
của các từ được mô tả trong "Các từ chỉ định cờ".
-i, --đầu vào
các tùy chọn thành công áp dụng cho luồng đầu vào.
-m chuỗi, --mime-bộ ký tự=chuỗi
mã hóa mime tuân theo RFC2047 được thực hiện. được sử dụng làm tên bộ ký tự.
-n, --số dòng
số dòng (> = 1) được chèn vào đầu mỗi dòng.
-o, - đầu ra
các tùy chọn thành công áp dụng cho luồng đầu ra.
-t hồ sơ, --đến=hồ sơ
xuất ra tệp (bị cắt bớt).
-w, --chiều rộng
chiều rộng đầu ra của mỗi dòng.
-cs , --bộ ký tự=chuỗi
chỉ định tên bộ ký tự. Một số đặc tả ngôn ngữ cũng được chấp nhận cũng như
Tên bộ ký tự MIME, được sử dụng để hạn chế các ứng cử viên của lược đồ mã hóa đầu vào
dòng. Các ngôn ngữ được chấp nhận được liệt kê trong "Các ngôn ngữ được chấp nhận".
--định dạng=chuỗi
chỉ định định dạng đầu ra
--cái mà
tên bộ ký tự đầu ra của mỗi luồng đầu vào sang stderr, ở dạng
hồ sơ tên"" bảng chữ cái tên
nếu hai hoặc nhiều tệp được chỉ định trên dòng lệnh, hoặc
bảng chữ cái tên
nếu không thì.
--regex=đều đặn biểu hiện
chỉ định biểu thức regeular để lọc đầu ra. Mã hóa ký tự của đều đặn
biểu hiện có thể được chỉ định bằng cách đặt chuỗi biểu mẫu
"*"bảng chữ cái tên"*"
ở đầu biểu thức chính quy, ngược lại UTF-8. Mã hóa ký tự của
biểu thức được chuyển đổi thành biểu thức của luồng đầu ra trước khi đối sánh.
Chuyển đổi chuyên gia
Chuyển đổi được áp dụng ngay trước khi mỗi ký tự được xuất ra luồng. Thiết lập chuyển đổi mới là
được thực hiện tự động dựa trên CES. Vì vậy, trong hầu hết các trường hợp, bạn không cần chỉ định bộ chuyển đổi
một cách rõ ràng.
ascii
ASCII trong nước được chuyển đổi sang US-ASCII,
CES được chuyển đổi một cách thích hợp theo CES ràng buộc với luồng đầu vào / đầu ra,
to-ucs
được chuyển đổi sang Unicode,
f2h, đầy đủ đến một nửa
Các ký tự tương thích toàn băng thông được chuyển đổi thành các ký tự nửa băng thông tương ứng,
h2f, nửa đến đầy
Các ký tự tương thích với nửa băng thông được chuyển đổi thành các ký tự có toàn độ rộng tương ứng,
jix0213
Các điểm mã trong JIS C 6226 hoặc trong JIS X 0208 bị ràng buộc không có ký tự nào là
được chuyển đổi thành mặt phẳng JIS X 0213 1,
jisx0213-hung hăng
Tất cả các điểm mã trong JIS C 6226 hoặc trong JIS X 0208 được chuyển đổi thành mặt phẳng JIS X 0213 1,
ms-latin1
Các ký tự Unicode của điểm mã giữa 0x80 và 0x9F (bao gồm cả hai) được chuyển đổi
sang các ký tự Unicode khác như thể chúng là các ký tự của điểm mã đó trong Microsoft
Bộ mã hóa Windows 1252.
ucs-to-jis0208-thêm, jis0208-to-ucs-thêm
Bộ chuyển đổi giữa một số ký tự JIS X 0208 và Unicode có glyph tương tự (bằng cách
sự lịch sự của Ambrose Li[email được bảo vệ]>).
Flag chuyên gia
use-0x28-for-94x94inG0, 28
sử dụng "1/11 2/4 2/8 F" thay vì "1/11 2/4 F" để chỉ định các bộ ký tự có octet cuối cùng
4/0, 4/1 hoặc 4/2 đến G0,
ac, kiểm soát ascii
trình tự thoát "1/11 2/8 4/2" được xuất trước mọi ký tự điều khiển,
không có gì, bỏ qua-7bit-đơn-shift
trình tự thoát cho dịch chuyển đơn 7 bit bị bỏ qua,
dnc, loại bỏ-notprefered-char
loại bỏ các ký tự mà CES liên kết với luồng đầu ra không thể giải mã.
Chấp nhận được ngôn ngữ
Các từ sau có thể được đưa ra thay vì tên bộ ký tự MIME cho luồng đầu vào. Trong đó
trường hợp, lược đồ mã hóa được tự động phát hiện (hy vọng) trong số các lược đồ kế tiếp.
c, cn, Trung Quốc, Trung Quốc
x-gb-18030-2000, cn-big5, utf-8 hoặc x-euc-tw.
j, ja, jp, Nhật Bản, tiếng Nhật
euc-jp, shift_jis hoặc utf-8.
k, ko, kr, korea, Hàn Quốc
euc-kr, x-johab, utf-8 hoặc x-united-hangul.
cjk iso-8859-1, x-gb-18030-2000, cn-big5, x-euc-tw, euc-jp, shift_jis, euc-kr, x-johab,
x-Unix-hangul hoặc utf-8.
Sử dụng mbconv trực tuyến bằng các dịch vụ onworks.net