Đây là lệnh konwert có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
konwert - giao diện cho các chuyển đổi mã hóa ký tự khác nhau
SYNOPSIS
không biết LỌC [FILE] ... [-o điểm đến | -O]
MÔ TẢ
Konwert cho phép lọc nhiều tệp qua nhiều bộ lọc. Nó lọc
quy định FILEs, hoặc stdin nếu không có.
Đơn giản LỌC là tên của một tệp thực thi từ thư mục ~ / .konwert / bộ lọc or
toàn hệ thống, bình thường / usr / share / konwert / filter. Chương trình như vậy tự nó lọc
stdin sang stdout.
Quy tắc lọc có thể phức tạp hơn:
không biết LỌC1+LỌC2 có nghĩa không biết LỌC1 | không biết LỌC2.
không biết ĐỊNH DẠNG1-ĐỊNH DẠNG2, trừ khi bộ lọc đó tồn tại, hãy cố gắng tìm một điểm chung ĐỊNH DẠNG3, như là
cả hai bộ lọc ĐỊNH DẠNG1-ĐỊNH DẠNG3 và ĐỊNH DẠNG3-ĐỊNH DẠNG1 tồn tại.
không biết LỌC/ARG/... chuyển các đối số vào bộ lọc. Các đối số cũng có thể được chỉ định
ở đây: ĐỊNH DẠNG1/ARGS-ĐỊNH DẠNG2. Ý nghĩa của các đối số phụ thuộc vào bộ lọc cụ thể.
không biết '(COMMAND ARGS...)' thực hiện lệnh shell tùy ý này. Điều này hữu ích với -o
or -O tùy chọn. Lệnh không được chứa chuỗi )+, điều này sẽ chấm dứt điều này
đặc điểm kỹ thuật của bộ lọc.
LỰA CHỌN
-o điểm đến đầu ra chuyển đến tệp / thư mục này thay vì stdout
-O mọi tệp đầu vào được thay thế bằng bản dịch của nó
--Cứu giúp hiển thị trợ giúp và thoát
--phiên bản thông tin phiên bản và thoát
Chuyển hướng đầu ra đến một trong các tệp nguồn bằng -o or > thay vì -O sẽ
làm hỏng nó! Lựa chọn -O tạo một tệp tạm thời trong / Tmp và sau đó sao chép nó trở lại
nguồn.
TÍNH CÁCH THƯỞNG THỨC CHUYỂN ĐỔI
Ví dụ: bạn có thể chuyển đổi văn bản giữa hai bảng mã bất kỳ không biết cp437-iso2.
Các ký tự không có sẵn trong bộ ký tự đích sẽ được thay thế bằng các ký tự gần đúng với
những cái có sẵn. Các giá trị gần đúng không cần phải là các ký tự đơn lẻ.
Các bộ ký tự sau hiện được hỗ trợ:
ascii 7 bit ASCII
utf8 = unicode Unicode UTF-8
iso1 = cô lập1
ISO-8859-1 hay còn gọi là ISO Latinh 1 (Tây Âu)
iso2 = cô lập2
ISO-8859-2 hay còn gọi là ISO Latinh 2 (Trung Âu)
iso3 = cô lập3
ISO-8859-3 hay còn gọi là ISO Latinh 3 (Quốc tế ngữ)
iso4 = cô lập4
ISO-8859-4 hay còn gọi là ISO Latinh 4 (Baltic)
iso5 = cô lập
ISO-8859-5 (Kirin)
iso6 = cô lập
ISO-8859-6 (tiếng Ả Rập)
iso7 = con lạch cô lập
ISO-8859-7 (tiếng Hy Lạp)
iso8 = cô lập
ISO-8859-8 (tiếng Do Thái)
iso9 = cô lập5 = cô lập
ISO-8859-9 hay còn gọi là ISO Latinh 5 (tiếng Thổ Nhĩ Kỳ)
iso10 = cô lập6 = tiếng cô lập
ISO-8859-10 hay còn gọi là ISO Latinh 6 (Bắc Âu)
iso12 = cô lập7 = cô lập
ISO-8859-12 hay còn gọi là ISO Latinh 6 (Celtic) - Bản nháp
iso13 = cô lập8 = cô lập
ISO-8859-13 hay còn gọi là ISO Latinh 6 (Baltic) - Bản nháp
iso14 = cô lập9 = cô lập
ISO-8859-14 hay còn gọi là ISO Latinh 6 (Sámi) - Bản nháp
iso15 ISO-8859-15 - Bản nháp
koi8r KOI8-R (tiếng Nga)
koi8u KOI8-U (tiếng Ukraina, tiếng Byelorussian)
koi8uni KOI8-Uni (Kirin)
cp1250 = nhăn = winlatin2 Windows CP-1250 hay còn gọi là Win Latin 2 (Trung Âu)
cp1251 = wincyr Windows CP-1251 (Kirin)
cp1252 = gió tây = winlatin1 Windows CP-1252 hay còn gọi là Win Latin 1 (Tây Âu)
cp1253 = cầu thủ chạy cánh Windows CP-1253 (tiếng Hy Lạp)
cp1254 = mùa đông Windows CP-1254 (tiếng Thổ Nhĩ Kỳ)
cp1255 = winhebrew Windows CP-1255 (tiếng Do Thái)
cp1256 = tiếng Ả Rập Windows CP-1256 (tiếng Ả Rập)
cp1257 = chiến thắng Windows CP-1257 (Baltic)
cp1258 = thắng việt Windows CP-1258 (Tiếng Việt)
cp437 = icmen DOS CP-437 (tiếng Anh)
cp737 = tiếng Do Thái DOS CP-737 (tiếng Hy Lạp)
cp775 = liều lượng DOS CP-775 (Baltic)
cp850 = miền tây = doslatin1 DOS CP-850 hay còn gọi là DOS Latin 1 (Tây Âu)
cp852 = liều lĩnh = doslatin2 DOS CP-852 hay còn gọi là DOS Latin 2 (Trung Âu)
cp855 = tài liệu DOS CP-855 (Kirin)
cp857 = nhà vệ sinh DOS CP-857 (tiếng Thổ Nhĩ Kỳ)
cp860 = Bồ Đào Nha DOS CP-860 (Bồ Đào Nha)
cp861 = Dosceland DOS CP-861 (tiếng Iceland)
cp862 = doshebrew DOS CP-862 (tiếng Do Thái)
cp863 = doscaadfr DOS CP-863 (tiếng Pháp thuộc Canada)
cp864 = dosarabic DOS CP-864 (tiếng Ả Rập)
cp865 = người Bắc Âu DOS CP-865 (Bắc Âu)
cp866 = tiếng dosrus DOS CP-866 (tiếng Nga)
cp869 = dosgreek2 DOS CP-869 (tiếng Hy Lạp2)
cp874 = dosthai DOS CP-874 (tiếng Thái)
mac Macintosh Roman (Tây Âu)
chùy Macintosh Trung Âu
maccyr Macintosh Kirin
macgreek Tiếng Hy Lạp Macintosh
xứ macice Macintosh tiếng Iceland
mactur Macintosh Thổ Nhĩ Kỳ
csk,
máy tính,
dhn,
fidomazovia,
iea,
logic,
mazovia,
lỗ nhỏ Bảng mã DOS cho tiếng Ba Lan
amigapl,
chất béo,
jx Bảng mã Amiga cho tiếng Ba Lan
kamenicky Bộ mã DOS cho tiếng Séc và tiếng Slovak
con lạch WinGreek (mã hóa dựa trên phông chữ Windows cho tiếng Hy Lạp cổ đại)
babelpl TeX [đánh bóng] {babel}: "a" c "e" l "n" o "s" z "r
đau bụng Tiền tố TeX \: / a / c / e / l / n / o / s / x / z
xmetodo Quốc tế ngữ: cx gx hx jx sx ux (vx w)
hmetodo Quốc tế ngữ: ch gh hh jh sh u
antauxcxap Quốc tế ngữ: ^c ^g ^h ^j ^s ^u (~u)
postcxap Quốc tế ngữ: c^ g^ h^ j^ s^ u^ (u~)
Aporofoj Quốc tế ngữ: c' g' h' j' s' u'
malapostrofoj Quốc tế ngữ: c` g` h` j` s` u`
visciii VISCII (Tiếng Việt)
viqri Trích dẫn tiếng Việt có thể đọc được ngầm hiểu
htmldec Tham chiếu ký tự SGML / HTML (thập phân): Æ ě →
htmlhex Tham chiếu ký tự SGML / HTML (hệ thập lục phân): Æ ě →
htmlent Các thực thể ký tự SGML / HTML (tên): Æ & ecaron →
html Cả ba ở trên (chỉ dưới dạng định dạng đầu vào)
tex TeX với một số phần mở rộng LaTeX hoặc AMS-TeX. Không có sự phân biệt giữa bình thường
và chế độ toán học - bạn có thể sẽ phải chèn một số $của thủ công.
ghi nhớ RFC 1345 ghi nhớ trước &
ghi nhớ1 RFC 1345 ghi nhớ trước `
không tí nào/NGÔN NGỮ (ví dụ any / pl-iso2)
Định dạng đầu vào đặc biệt này sẽ tự động phát hiện mã hóa, dựa trên
tần số của các ký tự được tìm thấy trong văn bản. Mọi ngôn ngữ đều được liên kết với một tập hợp
các mã hóa khả thi được sử dụng cho nó và tần số trung bình của các chữ cái của nó (không bao gồm
Chữ cái ASCII). Mã hóa phù hợp nhất được sử dụng để chuyển đổi. Hiện tại
ngôn ngữ được hỗ trợ là cs (Tiếng Séc), de (Tiếng Đức), el (Người Hy Lạp), eo (Quốc tế ngữ), es
(Người Tây Ban Nha), fr (Người Pháp), he (Tiếng Do Thái), it (Người Ý), pl (Đánh bóng), pt (Tiếng Bồ Đào Nha), ru
(Tiếng Nga), và sv (Tiếng Thụy Điển).
varpl Ba Lan hỗn hợp ISO-8859-2, CP-1250 và UTF-8. Nếu bạn đang đọc nhóm tin Ba Lan I
đề xuất đặt nó như một bộ lọc trong trình đọc tin tức của bạn (để cải thiện tốc độ, nó
tốt hơn nên gọi nó trực tiếp, thay vì thông qua konwert).
vareo Hỗn hợp các bảng mã Esperanto khác nhau.
LỰA CHỌN KIỂM SOÁT CÁC Ở TRÊN CHUYỂN ĐỔI
/1 (ví dụ không biết iso2-ascii / 1)
Mỗi ký tự không có sẵn sẽ chỉ được thay thế bằng một ký tự gần đúng duy nhất,
không phải chuỗi. Điều này hữu ích với chương trình filterm hoặc với văn bản được định dạng sẵn. Cái này
tùy chọn tự động được bật khi một bộ lọc được sử dụng làm đầu ra cho bộ lọc.
/ html Văn bản được giả định là HTML. Các nhân vật " & < > kết quả từ các ký tự khác '
xấp xỉ sẽ được thoát đúng như " & < >. Các <META http-
Equiv = "content-type" content = "text / html; bảng mã = ... "> tiêu đề sẽ được sửa nếu
hiện tại.
/ htmldec
Chuyển đổi META như trên. Các ký tự không khả dụng sẽ được mã hóa bằng & # Unicode ;.
/ htmlhex
Chuyển đổi META như trên. Các ký tự không khả dụng sẽ được mã hóa theo hệ thập lục phân
& # xUnicode ;.
/ tex Các ký tự không khả dụng sẽ được mô tả trong TeX. Nhân vật # $ % & ^ _ { | } ~
kết quả từ ước lượng của một số ký tự sẽ được thoát đúng cách thành \# \$
\% \& $ \ dấu gạch chéo ngược $ \ ^ {} _ \{ $ | $ \} \ ~ {}.
/ asciichar
Nhận dạng một số biểu diễn ASCII của các ký tự, ví dụ: (c) ... 1/2 >=.
/ rosyjski
Văn bản tiếng Nga sẽ được thay thế bằng phiên âm tiếng Ba Lan.
Một số bộ lọc đầu ra có thể sử dụng thông tin ngôn ngữ để chọn các giá trị gần đúng hơn
các chữ cái không có sẵn, ví dụ / de (Tiếng Đức): ä → ae thay vì a.
KHÁC LỌC
không tí nào/NGÔN NGỮ-kiểm tra
Phát hiện mã hóa, nhưng thay vì chuyển đổi văn bản, chỉ hiển thị mã hóa của
Tên. Các tùy chọn bổ sung /tất cả các hiển thị tất cả các mã hóa có thể có, được sắp xếp từ tốt hơn
đến những cái tồi tệ hơn.
cr
lf
crlf Bắt buộc quy ước điểm đánh dấu cuối dòng cụ thể. cr = Macintosh, lf = Unix và Amiga,
crlf = Windows và DOS. Quy ước đầu vào được phát hiện tự động.
mở rộng Mở rộng các tab thành khoảng trắng (sử dụng chương trình textutils mở rộng).
mở rộng
Nén khoảng trắng thành các tab (sử dụng chương trình textutils unxpand).
rmspacesateol
Loại bỏ khoảng trắng và tab ở cuối dòng.
qp-8bit
8bit-qp
Mã hóa có thể in được trích dẫn của MIME: = A3 = F3d = BC.
rtf-8bit
8bit-rtf
Định dạng văn bản phong phú: \ 'a3 \' f3d \ '9f.
txt-htmlchar
Thoát hiểm " & < > thành các thực thể SGML / HTML " & < >. Hữu ích cho
bao gồm một tệp văn bản bên trong HTML các thẻ.
htmlchar-txt
Đảo ngược.
thối13 Guvf vf và qrzbafgengvba bs ebg13.
người đi du lịch
hạ thấp
Tự giải thích. Hiện tại chỉ có ASCII.
prn7pl Chuyển đổi các ký tự đánh bóng để điều khiển trình tự cho máy in tương thích với EPSON. Chỉ sử dụng
Các ký tự 7-bit, đầu máy in backspacing và các ký tự định vị dọc,. ''
tạo gryph đánh bóng giả. Bạn có thể chỉ định các tùy chọn: / nlq (mặc định) cái nào
tối ưu hóa đầu ra cho máy in chất lượng tốt hơn và /bản thảo - hữu ích cho người yêu cũ. vì
Máy in 9 móng.
Sử dụng konwert trực tuyến bằng các dịch vụ onworks.net