InggrisPerancisSpanyol

Ad


favorit OnWorks

enca - Online di Awan

Jalankan enca di penyedia hosting gratis OnWorks melalui Ubuntu Online, Fedora Online, emulator online Windows, atau emulator online MAC OS

Ini adalah enca perintah yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS

PROGRAM:

NAMA


enca -- mendeteksi dan mengonversi encoding file teks

RINGKASAN


saudara [-L BAHASA] [PILIHAN]...[FILE] ...
percakapan [-L BAHASA] [PILIHAN]...[FILE] ...

PENGANTAR DAN CONTOH


Jika Anda cukup beruntung, hanya dua hal yang perlu Anda ketahui adalah: perintah

saudara FILE

akan memberi tahu Anda file penyandian mana FILE menggunakan (tanpa mengubahnya), dan

percakapan FILE

akan mengonversi file FILE ke pengkodean asli lokal Anda. Untuk mengonversi file ke yang lain
pengkodean menggunakan -x pilihan (lihat -x masuk di bagian PILIHAN dan bagian KONVERSI dan
pengkodean untuk lebih jelasnya).

Keduanya bekerja dengan banyak file dan input (output) standar juga. Misalnya

enca -x latin2

memastikan file `sometext' dalam ISO Latin 2 saat dikirim ke printer.

Alasan utama mengapa perintah ini akan gagal dan mengubah file Anda menjadi sampah adalah karena Enca
perlu tahu bahasa mereka untuk mendeteksi pengkodean. Ia mencoba untuk menentukan bahasa Anda
dan rangkaian karakter pilihan dari pengaturan lokal, yang mungkin bukan yang Anda inginkan.

Anda dapat (atau harus) menggunakan -L pilihan untuk mengatakannya dengan bahasa yang tepat. Misalkan, Anda mengunduh
beberapa file HTML Rusia, `file.htm', mengklaim itu windows-1251 tapi bukan. Jadi kamu lari

enca -L ru file.htm

dan cari tahu itu KOI8-R (misalnya). Berhati-hatilah, saat ini tidak banyak yang didukung
bahasa (lihat bagian BAHASA).

Peringatan lain menyangkut fakta beberapa fitur Enca, yaitu konversi charset-nya
kemampuan, sangat bergantung pada alat lain apa yang diinstal pada sistem Anda (lihat
bagian KONVERSI)--Lari

enca --versi

untuk mendapatkan daftar fitur (lihat bagian FITUR). Juga coba

enca --bantuan

untuk mendapatkan deskripsi dari semua opsi Enca lainnya (dan untuk menemukan sisa halaman manual ini
berulang).

DESKRIPSI


Enca membaca file teks yang diberikan, atau input standar ketika tidak ada yang diberikan, dan menggunakan pengetahuan
tentang bahasa mereka (harus didukung oleh Anda) dan campuran parsing, statistik
analisis, tebakan, dan ilmu hitam untuk menentukan pengkodean mereka, yang kemudian dicetak ke
keluaran standar (atau ia mengaku tidak tahu seperti apa pengkodeannya). Oleh
default, Enca menyajikan hasil sebagai deskripsi multiline yang dapat dibaca manusia, beberapa lainnya
format tersedia--lihat Selektor jenis keluaran di bawah.

Enca juga dapat mengonversi file ke beberapa pengkodean lainnya ENC ketika Anda memintanya--baik menggunakan a
built-in converter, beberapa perpustakaan konversi, atau dengan memanggil konverter eksternal.

Tujuan utama Enca adalah dapat digunakan tanpa pengawasan, sebagai alat konversi otomatis, meskipun itu
mungkin belum mencapai titik ini (silakan lihat bagian KEAMANAN).

Harap dicatat kecuali kasus yang jarang terjadi, Enca benar-benar harus mengetahui bahasa file input untuk diberikan
Anda jawaban yang dapat diandalkan. Di sisi lain, ia kemudian dapat mengatasi dengan cukup baik file yang
tidak murni tekstual atau bahkan mendeteksi charset dari string teks di dalam beberapa file biner; dari
tentu saja, itu tergantung pada karakter komponen non-teks.

Enca tidak peduli dengan struktur file input, ia memandangnya sebagai bagian yang seragam dari
teks/data. Dalam hal file multipart (misalnya kotak surat), Anda harus menggunakan beberapa alat untuk mengetahui
struktur untuk mengekstrak bagian-bagian individu terlebih dahulu. Ini adalah biaya kemampuan untuk mendeteksi
pengkodean file yang rusak, tidak lengkap, atau salah.

PILIHAN


Ada beberapa kategori opsi: opsi mode operasi, pemilih tipe keluaran,
menebak parameter, parameter konversi, opsi umum, dan daftar.

Semua opsi panjang dapat disingkat asalkan tidak ambigu, parameter wajib
opsi panjang wajib untuk opsi pendek juga.

Operasi mode
adalah berikut:

-c, --konversi otomatis
Setara dengan memanggil Enca sebagai percakapan.

Jika tidak ada pemilih tipe keluaran yang ditentukan, deteksi penyandian file, tebak
charset pilihan dari lokal, dan mengonversi file ke sana (hanya tersedia dengan
+fitur target-charset-auto).

-g, --Tebak
Setara dengan memanggil Enca sebagai saudara.

Jika tidak ada pemilih tipe keluaran yang ditentukan, deteksi pengkodean file dan laporkan.

Keluaran mengetik penyeleksi
pilih tindakan apa yang akan dilakukan Enca ketika menentukan pengkodean; kebanyakan dari mereka hanya
pilih di antara berbagai nama, format, dan konvensi bagaimana pengkodean dapat dicetak, tetapi
salah satu diantara mereka (-x) khusus: ia memberitahu Enca untuk mengkode ulang file ke beberapa pengkodean lainnya ENC.
Pilihan ini saling eksklusif; jika Anda menentukan lebih dari satu pemilih tipe keluaran
yang terakhir diutamakan.

Beberapa tipe output mewakili nama charset yang digunakan oleh beberapa program lain, tetapi tidak semua ini
program mengetahui semua rangkaian karakter yang dikenali Enca. Berhati-hatilah, Enca tidak ada bedanya
antara charset yang tidak dikenal dan charset yang tidak memiliki nama di namespace yang diberikan sedemikian
situasi.

-d, --detail
Itu digunakan untuk mencetak beberapa halaman detail tentang proses menebak, tetapi sejak Enca
hanyalah sebuah program yang ditautkan dengan perpustakaan Enca, ini tidak mungkin dan opsi ini
kira-kira setara dengan --dapat dibaca manusia, kecuali itu melaporkan alasan kegagalan ketika
Enca tidak mengenali pengkodean.

-e, --enca-nama
Mencetak nama bagus Enca dari rangkaian karakter, yaitu, mungkin yang paling umum diterima
dan lebih atau kurang pengidentifikasi charset yang dapat dibaca manusia, dengan permukaan yang ditambahkan.

Nama ini juga digunakan saat memanggil konverter eksternal.

-f, --dapat dibaca manusia
Mencetak deskripsi verbal dari rangkaian karakter dan permukaan yang terdeteksi--sesuatu yang manusiawi
paling mengerti. Ini adalah perilaku default.

Format tepatnya adalah sebagai berikut: baris pertama berisi nama rangkaian karakter saja, dan
diikuti oleh nol atau lebih garis indentasi yang berisi nama permukaan yang terdeteksi.
Namun, format ini tidak cocok atau dimaksudkan untuk pemrosesan mesin lebih lanjut,
dan deskripsi charset verbal ingin berubah di masa depan.

-i, --iconv-nama
Mencetak bagaimana iconv(3) (dan/atau iconv(1)) memanggil rangkaian karakter yang terdeteksi. Lebih tepatnya,
itu mencetak satu, kurang lebih dipilih secara sewenang-wenang, alias diterima oleh iconv. Sebuah rangkaian karakter
tidak diketahui oleh iconv dianggap tidak dikenal.

Jenis keluaran ini masuk akal hanya ketika Enca dikompilasi dengan dukungan iconv (fitur
+ikon-antarmuka).

-r, --rfc1345-nama
Mencetak nama rangkaian karakter RFC 1345. Ketika nama seperti itu tidak ada karena RFC 1345
tidak mendefinisikan pengkodean yang diberikan, beberapa nama lain didefinisikan dalam beberapa RFC lain atau hanya
nama yang penulis anggap 'paling kanonik', dicetak.

Karena RFC 1345 tidak mendefinisikan permukaan, tidak ada info permukaan yang ditambahkan.

-m, --nama-mime
Mencetak nama MIME pilihan dari rangkaian karakter yang terdeteksi. Ini adalah nama yang Anda harus
biasanya digunakan saat memperbaiki email atau halaman web.

Rangkaian karakter tidak ada di http://www.iana.org/assignments/character-sets dihitung sebagai
diketahui.

-s, --cstoc-name
Mencetak bagaimana cstoc(1) memanggil rangkaian karakter yang terdeteksi. Rangkaian karakter yang tidak diketahui oleh cstocs
dianggap tidak diketahui.

-n, --nama=KATA
Mencetak nama charset (encoding) yang dipilih oleh KATA (bisa disingkat asalkan
jelas). Untuk nama-nama yang tercantum di atas, --nama=KATA adalah setara dengan --KATA.

Menggunakan alias sebagai tipe keluaran menyebabkan Enca mencetak daftar semua alias yang diterima
dari rangkaian karakter yang terdeteksi.

-x, --konversi-ke=[..]ENC
Mengonversi file menjadi penyandian ENC.

Opsional `..' sebelum nama penyandian tidak memiliki arti khusus, kecuali Anda dapat menggunakan
itu untuk mengingatkan diri sendiri bahwa, tidak seperti di recode(1), Anda harus menentukan diinginkan
pengkodean, bukan saat ini.

Anda dapat menggunakan recode(1) rantai pengodean ulang atau jenis pengodean ulang braindead lainnya
spesifikasi untuk ENC, asalkan Anda memberi tahu Enca untuk menggunakan beberapa pemahaman alat
untuk konversi (lihat bagian KONVERSI).

Ketika Enca gagal untuk menentukan pengkodean, ia mencetak peringatan dan meninggalkan
berkas apa adanya; ketika dijalankan sebagai filter, ia mencoba melakukan yang terbaik untuk menyalin standar
input ke output standar tidak berubah. Namun demikian, Anda tidak harus bergantung padanya dan melakukannya
cadangan.

Menebak parameter
Hanya ada satu: -L pengaturan bahasa file input. Opsi ini wajib (tetapi lihat
bawah).

-L, --bahasa=BAHASA
Setel bahasa file input ke BAHASA.

Lebih tepatnya, BAHASA dapat berupa nama lokal yang valid (atau alias dengan +locale-alias
fitur) dari beberapa bahasa yang didukung. Anda juga dapat menentukan `none' sebagai nama bahasa,
hanya pengkodean multibyte yang dikenali. Lari

enca --daftar bahasa

untuk mendapatkan daftar bahasa yang didukung. Ketika Anda tidak menentukan bahasa apa pun yang dicoba Enca
untuk menebak bahasa Anda dari pengaturan lokal dan menganggap file input menggunakan ini
bahasa. Lihat bagian BAHASA untuk rincian.

Konversi parameter
memberi Anda kontrol yang lebih baik tentang bagaimana konversi rangkaian karakter akan dilakukan. Mereka tidak mempengaruhi
apa saja kapan -x tidak ditentukan sebagai tipe keluaran. Silakan lihat bagian KONVERSI untuk
rincian konversi berdarah.

-C, --coba-konverter=DAFTAR
Menambahkan dipisahkan koma DAFTAR ke daftar konverter yang akan dicoba saat Anda
meminta konversi. Nama mereka bisa disingkat asalkan ada
jelas. Lari

enca --daftar konverter

untuk mendapatkan daftar semua nama konverter yang valid (dan lihat bagian KONVERSI untuk mereka
keterangan).

Daftar default tergantung pada bagaimana Enca telah dikompilasi, jalankan

enca --bantuan

untuk mengetahui daftar konverter default.

Perhatikan daftar default hanya digunakan jika Anda tidak menentukan -C sama sekali. Sebaliknya,
daftar dibuat seolah-olah awalnya kosong dan setiap -C menambahkan konverter baru
untuk itu. Selain itu, menentukan tak satupun karena nama konverter menyebabkan pembersihan konverter
daftar.

-E, --program-konverter-eksternal=PATH
Setel nama program konverter eksternal ke PATH. Konverter eksternal default tergantung
tentang bagaimana enca telah dipatuhi, dan kemungkinan untuk menggunakan konverter eksternal mungkin
tidak akan tersedia sama sekali. Lari

enca --bantuan

untuk mengetahui program konverter default di enca build.

Umum Pilihan
tidak cocok dengan kategori pilihan lain...

-p, --dengan-nama file
Memaksa Enca untuk mengawali setiap hasil dengan nama file yang sesuai. Secara default, Enca
awalan hasil dengan nama file saat dijalankan di banyak file.

Masukan standar dicetak sebagai STDIN dan keluaran standar sebagai STDOUT (yang terakhir bisa jadi
mungkin terlihat dalam pesan kesalahan saja).

-P, --tanpa nama file
Memaksa Enca untuk tidak mengawali hasil dengan nama file. Secara default, Enca tidak diawali
hasil dengan nama file saat dijalankan pada satu file (termasuk input standar).

-V, --bertele-tele
Meningkatkan tingkat verbositas (setiap penggunaan meningkatkannya satu per satu).

Saat ini opsi ini tidak terlalu berguna karena berbagai bagian Enca merespons
berbeda dengan tingkat verbositas yang sama, kebanyakan tidak sama sekali.

Daftar
semuanya terminal, yaitu ketika Enca menemukan beberapa dari mereka, ia mencetak daftar yang diperlukan
dan berakhir tanpa memproses opsi berikut.

-h, --membantu
Mencetak bantuan penggunaan singkat.

-G, --lisensi
Mencetak lisensi Enca penuh (melalui pager, jika memungkinkan).

-l, --daftar=KATA
Daftar cetakan ditentukan oleh KATA (bisa disingkat asalkan jelas).
Daftar yang tersedia meliputi:

set karakter bawaan. Semua pengkodean dapat dikonversi oleh konverter bawaan, berdasarkan grup (keduanya
pengkodean input dan output harus dari daftar ini dan termasuk dalam grup yang sama untuk
konversi internal).

pengkodean bawaan. Setara dengan set karakter bawaan, tetapi dianggap usang; akan
diterima dengan peringatan, untuk sementara waktu.

konverter. Semua nama konverter yang valid (untuk digunakan dengan -C).

rangkaian karakter. Semua pengkodean (charset). Anda dapat memilih nama apa yang akan dicetak
dengan --nama atau pemilih jenis keluaran nama apa pun (tentu saja, hanya penyandian yang memiliki a
nama di namespace yang diberikan akan dicetak kemudian), pemilih harus ditentukan
sebelum --Daftar.

pengkodean. Setara dengan rangkaian karakter, tetapi dianggap usang; akan diterima dengan
peringatan, untuk sementara waktu.

bahasa. Semua bahasa yang didukung bersama dengan rangkaian karakter milik mereka. Catatan
tipe output memilih gaya nama bahasa, bukan gaya nama charset di sini.

nama. Semua nilai yang mungkin dari --nama .

daftar. Semua nilai yang mungkin dari opsi ini. (Gila?)

permukaan. Semua permukaan yang dikenali Enca.

-v, --Versi: kapan
Mencetak versi program dan daftar fitur (lihat bagian FITUR).

KONVERSI


Meskipun Enca awalnya dirancang sebagai alat untuk menebak pengkodean saja, sekarang
fitur beberapa metode konversi charset. Anda dapat mengontrol yang mana dari mereka yang akan menjadi
digunakan dengan -C.

Enca secara berurutan mencoba konverter dari daftar yang ditentukan oleh -C sampai menemukan beberapa itu
mampu melakukan konversi yang diperlukan atau sampai daftar habis. Anda harus menentukan
konverter pilihan terlebih dahulu, kurang disukai kemudian. Konverter eksternal (luar) seharusnya
selalu ditentukan terakhir, hanya sebagai upaya terakhir, karena biasanya tidak mungkin untuk memulihkan
ketika gagal. Daftar konverter default selalu dimulai dengan built-in lalu
berlanjut dengan yang pertama tersedia dari: kode gratis, iconv, Tidak ada apa-apa.

Perlu dicatat ketika Enca mengatakan tidak dapat melakukan konversi itu hanya berarti
tidak ada konverter yang dapat melakukannya. Masih mungkin untuk melakukan
diperlukan konversi dalam beberapa langkah, menggunakan beberapa konverter, tetapi untuk mengetahui caranya,
kecerdasan manusia mungkin diperlukan.

Built-in Converter
adalah yang paling sederhana dan jauh yang tercepat, hanya dapat melakukan beberapa byte-ke-byte
konversi dan memodifikasi file langsung di tempat (mungkin dianggap berbahaya, tetapi
cukup efisien). Anda bisa mendapatkan daftar semua penyandian yang dapat dikonversi dengan

enca --daftar bawaan

Selain kecepatan, keuntungan utamanya (dan juga kerugiannya) adalah tidak peduli: itu
cukup ubah karakter yang memiliki representasi dalam penyandian target, jangan sentuh
hal lain dan tidak pernah mencetak pesan kesalahan apa pun.

Konverter ini dapat ditentukan sebagai: built-in dengan -C.

kode gratis Converter
adalah antarmuka ke perpustakaan pengodean ulang GNU, yang melakukan pekerjaan pengodean ulang yang sebenarnya. Mungkin atau mungkin
tidak dikompilasi dalam; Lari

enca --versi

untuk mengetahui ketersediaannya di enca build Anda (fitur +librecode-interface).

Anda harus akrab dengan recode(1) sebelum menggunakannya, karena recode cukup
alat konversi charset yang canggih dan kuat. Anda mungkin mengalami masalah saat menggunakannya
bersama dengan Enca terutama karena dukungan Enca untuk permukaan tidak 100% kompatibel,
karena recode berusaha terlalu keras untuk membuat transformasi dapat dibalik, karena terkadang
diam-diam mengabaikan kesalahan I/O, dan karena itu sangat bermasalah. Silakan lihat kode ulang GNU
halaman info untuk detail tentang recode library.

Konverter ini dapat ditentukan sebagai: kode gratis dengan -C.

iconv Converter
adalah antarmuka ke UNIX98 iconv(3) fungsi konversi, yang melakukan pengodean ulang yang sebenarnya
pekerjaan. Ini mungkin atau mungkin tidak dikompilasi dalam; Lari

enca --versi

untuk mengetahui ketersediaannya di enca build Anda (fitur +iconv-interface).

Meskipun iconv hadir di sebagian besar sistem saat ini, ikonv jarang menawarkan beberapa set yang berguna
konversi yang tersedia, satu-satunya pengecualian adalah iconv dari GNU libc. Dia
biasanya cukup pilih-pilih tentang permukaan juga (sementara, pada saat yang sama, tidak menerapkan permukaan
konversi). Namun itu mungkin merupakan satu-satunya alat standar yang dapat melakukan
konversi dari/ke Unicode. Silakan lihat dokumentasi iconv tentang untuk detail tentangnya
kemampuan pada sistem khusus Anda.

Konverter ini dapat ditentukan sebagai: iconv dengan -C.

Luar Converter
adalah alat konversi eksternal arbitrer yang dapat ditentukan dengan -E pilihan (paling banyak satu
dapat ditentukan secara bersamaan). Ada beberapa standar yang disediakan bersama dengan enca:
cstoc, recode, peta, umap, dan piconv. Semua adalah skrip pembungkus: untuk cstoc(1) recode(1)
peta(1) umap(1), dan piconv(1).

Harap dicatat enca memiliki sedikit kontrol apa yang sebenarnya dilakukan oleh konverter eksternal. Jika Anda mengatur
untuk /bin/rm Anda bertanggung jawab penuh atas konsekuensinya.

Jika Anda ingin membuat konverter sendiri untuk digunakan dengan enca, Anda harus tahu itu selalu
bernama

KONVERTER ENC_CURRENT ENC FILE [-]

dimana KONVERTER adalah apa yang telah ditetapkan oleh -E, ENC_CURRENT terdeteksi pengkodean, ENC apa
telah ditentukan dengan -x, dan FILE adalah file yang akan dikonversi, yaitu dipanggil untuk masing-masing
berkas secara terpisah. Parameter keempat opsional, -, harus menyebabkan (bila ada) pengiriman
hasil konversi ke output standar alih-alih menimpa file FILE. itu
konverter juga harus berhati-hati agar tidak mengubah izin file, mengembalikan kode kesalahan 1
ketika gagal dan membersihkan file-file sementaranya. Silakan lihat standar eksternal
konverter untuk contoh.

Konverter ini dapat ditentukan sebagai: luar dengan -C.

Default target rangkaian karakter
Cara langsung untuk menentukan rangkaian karakter target adalah -x opsi, yang mengesampingkan apa pun
default. Ketika Enca disebut sebagai percakapan, rangkaian karakter target default dipilih persis dengan
sama seperti recode(1) melakukannya.

Jika DEFAULT_CHARSET variabel lingkungan diatur, itu digunakan sebagai rangkaian karakter target.

Jika tidak, jika sistem Anda menyediakan nl_langinfo(3) fungsi, asli lokal saat ini
charset digunakan sebagai charset target.

Ketika kedua metode gagal, Enca mengeluh dan berhenti.

Reversibilitas catatan
Jika reversibilitas sangat penting bagi Anda, Anda tidak boleh menggunakan enca sebagai konverter sama sekali (atau mungkin
Anda bisa, dengan desain yang sangat khusus recode(1) pembungkus). Jika tidak, Anda harus di
Setidaknya ketahuilah bahwa ada empat cara dasar untuk menangani entitas karakter yang tidak dapat diubah:

gagal--ini juga kemungkinan, dan kebetulan itu persis seperti libc GNU saat ini
implementasi iconv tidak (recode juga bisa disuruh melakukannya)

jangan sentuh mereka--inilah yang selalu dilakukan oleh konverter internal enca dan dapat dilakukan recode;
meskipun tidak dapat dibalik, manusia biasanya mampu merekonstruksi aslinya (pada
paling tidak pada prinsipnya)

perkiraan mereka--inilah yang dapat dilakukan cstocs, dan kode ulang juga, meskipun berbeda; dan
pilihan terbaik jika Anda hanya ingin membuat teks terkutuk itu dapat dibaca

lepaskan mereka--inilah yang dapat dilakukan oleh recode dan cstocs (cstocs juga dapat menggantikan ini
karakter oleh beberapa karakter tetap, bukan hanya mengabaikan); berguna ketika
karakter yang akan dihilangkan hanya berisi noise.

Silakan berkonsultasi dengan manual konverter favorit Anda untuk rincian masalah ini. Umumnya, jika
Anda tidak cukup beruntung untuk memiliki semua karakter konvertibel dalam file Anda, manual
intervensi tetap diperlukan.

Performance catatan
Performa buruk dari konverter yang tersedia telah menjadi salah satu alasan utama untuk menyertakan
konverter bawaan di enca. Cobalah untuk menggunakannya bila memungkinkan, yaitu ketika file masuk
pertimbangannya adalah charset-clean cukup atau charset-berantakan sehingga nol built-in
kecerdasan tidak penting. Tidak memerlukan ruang disk ekstra atau memori ekstra dan dapat
Mengungguli recode(1) lebih dari 10 kali pada file besar dan versi Perl (yaitu lebih cepat
satu dari cstoc(1) lebih dari 400 kali pada file kecil (sebenarnya hampir secepat hanya
cp(1)).

Cobalah untuk menghindari konverter eksternal ketika tidak benar-benar diperlukan karena semua forking
dan memindahkan barang-barang di sekitar sangat lambat.

pengkodean


Anda bisa mendapatkan daftar set karakter yang dikenali dengan

enca --daftar rangkaian karakter

dan menggunakan --nama parameter Anda dapat memilih nama yang ingin Anda gunakan dalam daftar.
Anda juga dapat membuat daftar semua permukaan dengan

enca --daftar permukaan

Pengkodean dan nama permukaan tidak peka huruf besar-kecil dan karakter non-alfanumerik tidak
diperhitungkan. Namun, karakter non-alfanumerik sebagian besar tidak diperbolehkan sama sekali.
Satu-satunya yang diperbolehkan adalah: `-', `_', `.', `:', dan `/' (sebagai pemisah charset/permukaan). Jadi
`ibm852' dan `IBM-852' adalah sama, sedangkan `IBM 852' tidak diterima.

rangkaian karakter
Daftar charset yang dikenali berikut menggunakan nama Enca (-e) dan deskripsi verbal sebagai
dilaporkan oleh Enca (-f):

ASCII 7bit karakter ASCII
ISO-8859-2 Standar ISO 8859-2; ISO Latin 2
ISO-8859-4 Standar ISO 8859-4; Latin 4
ISO-8859-5 Standar ISO 8859-5; ISO Sirilik
ISO-8859-13 Standar ISO 8859-13; ISO Baltik; Latin 7
ISO-8859-16 Standar ISO 8859-16
CP1125 MS-Windows kode halaman 1125
CP1250 MS-Windows kode halaman 1250
CP1251 MS-Windows kode halaman 1251
CP1257 MS-Windows kode halaman 1257; WinBaltRim
IBM852 Kode IBM/MS halaman 852; PC (DOS) Latin 2
IBM855 Halaman kode IBM/MS 855
IBM775 Halaman kode IBM/MS 775
IBM866 Halaman kode IBM/MS 866
baltik ISO-IR-179; Baltik
Pengkodean KEYBCS2 Kamenicky; KEYBCS2
macce Macintosh Eropa Tengah

maccyr Macintosh Sirilik
ECMA-113 Ecma Sirilik; ECMA-113
KOI-8_CS_2 Kode KOI8-CS2 (`T602')
KOI8-R KOI8-R Sirilik
KOI8-U KOI8-U Sirilik
KOI8-UNI KOI8-Sirilik Bersatu
Urutan kontrol TeX (La)TeX
UCS-2 Universal character set 2 byte; UCS-2; BMP
UCS-4 Universal character set 4 byte; UCS-4; ISO-10646
UTF-7 Format transformasi universal 7 bit; UTF-7
UTF-8 Format transformasi universal 8 bit; UTF-8
Pengkodean gabus gabus; T1
GBK Standar Nasional Cina Sederhana; GB2312
BIG5 Standar Industri Tradisional Cina; besar5
HZ HZ dikodekan GB2312
tidak dikenal Encoding tidak dikenal

dimana tidak dikenal bukan penyandian nyata, dilaporkan ketika Enca tidak dapat memberikan
jawaban yang dapat diandalkan.

Permukaan
Enca memiliki beberapa dukungan eksperimental untuk apa yang disebut permukaan (lihat di bawah). Ini mendeteksi
permukaan berikut (tidak semua dapat diterapkan ke semua rangkaian karakter):

/CR CR garis terminator
/LF LF line terminator
/ CRLF CRLF line terminator
NA Terminator garis campuran
NA Dikelilingi oleh/dicampur dengan data non-teks
/21 Urutan byte dibalik berpasangan (1,2 -> 2,1)
/4321 Urutan byte dibalik menjadi empat kali lipat (1,2,3,4 -> 4,3,2,1)
NA Potongan endian kecil dan besar, digabungkan
/qp Dikutip-printable disandikan

Perhatikan beberapa permukaan memiliki NA sebagai pengganti pengidentifikasi--mereka tidak dapat ditentukan pada perintah
baris, mereka hanya dapat dilaporkan oleh Enca. Ini disengaja karena mereka hanya memberi tahu Anda
mengapa file tidak dapat dianggap konsisten permukaan alih-alih mewakili yang nyata
permukaan.

Setiap rangkaian karakter memiliki permukaan alaminya (disebut `tersirat' dalam pengodean ulang) yang tidak dilaporkan,
misalnya, untuk charset IBM 852 ini adalah `terminator garis CRLF'. Untuk pengkodean UCS, big endian adalah
dianggap sebagai permukaan alami; pesanan byte yang tidak biasa dibangun dari 21 dan 4321
permutasi: 2143 dilaporkan hanya sebagai 21, sedangkan 3412 dilaporkan sebagai kombinasi 4321
dan 21.

UTF-8 yang dikodekan ganda bukanlah rangkaian karakter atau permukaan, itu hanya dilaporkan.

Tentang Kami rangkaian karakter, pengkodean dan permukaan
Charset adalah sekumpulan entitas karakter sedangkan encoding adalah representasinya dalam istilah
dari byte dan bit. Di Enca, kata encoding artinya sama dengan `representasi teks',
yaitu hubungan antara urutan entitas karakter yang membentuk teks dan
urutan byte (bit) yang merupakan file.

Jadi, pengkodean adalah kumpulan karakter dan apa yang disebut permukaan (terminator baris, urutan byte,
menggabungkan, transformasi Base64, dll.). Namun demikian, terbukti nyaman untuk bekerja dengan
beberapa {charset,surface} berpasangan dengan rangkaian karakter asli. Jadi, seperti pada recode(1), semua UCS- dan
Pengkodean UTF dari kumpulan karakter Universal disebut rangkaian karakter. Silakan lihat kode ulang
dokumentasi untuk detail lebih lanjut tentang masalah ini.

Satu-satunya hal yang baik tentang permukaan adalah: ketika Anda tidak mulai bermain dengannya, juga
Enca tidak akan mulai dan akan mencoba untuk berperilaku sebanyak mungkin sebagai permukaan-tidak sadar
program, bahkan ketika berbicara dengan recode.

BAHASA


Enca perlu mengetahui bahasa file input agar bekerja dengan andal, setidaknya dalam kasus
pengkodean 8bit biasa. Pengkodean multibyte harus dikenali untuk semua bahasa Latin, Cyrillic
atau bahasa Yunani.

Anda dapat (atau harus) menggunakan -L pilihan untuk memberitahu Enca bahasa. Karena orang paling sering
bekerja dengan file dalam bahasa yang sama dengan yang mereka konfigurasikan lokal, Enca mencoba
mencoba menebak bahasa dengan memeriksa nilai LC_CTYPE dan kategori lokal lainnya
(silahkan lihat Lokal(7)) dan menggunakannya untuk bahasa saat Anda tidak menentukannya. Dari
tentu saja, itu mungkin sepenuhnya salah dan akan memberi Anda jawaban yang tidak masuk akal dan merusak Anda
file, jadi jangan lupa untuk menggunakan -L pilihan. Anda juga bisa menggunakan MEMENUHI lingkungan Hidup
variabel untuk mengatur bahasa default (lihat bagian LINGKUNGAN).

Bahasa berikut didukung oleh Enca (setiap bahasa terdaftar bersama dengan yang didukung
pengkodean 8bit).

Belarusia CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855
CP1251 Bulgaria ISO-8859-5 IBM855 maccyr ECMA-113
Ceko ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
Estonia ISO-8859-4 CP1257 IBM775 ISO-8859-13 macce baltic
Kroasia CP1250 ISO-8859-2 IBM852 macce CORK
Hungaria ISO-8859-2 CP1250 IBM852 macce CORK
Lithuania CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
Latvia CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce baltic
Polandia ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 baltik CORK
Rusia KOI8-R CP1251 ISO-8859-5 IBM866 maccyr
Slowakia CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
Bahasa Slovenia ISO-8859-2 CP1250 IBM852 macce CORK
Ukraina CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccyr
GBK BIG5 HZ Cina
tak satupun

bahasa khusus tak satupun dapat disingkat menjadi __, tidak mengandung pengkodean 8bit, jadi hanya
pengkodean multibyte terdeteksi.

Anda juga dapat menggunakan nama lokal alih-alih bahasa:

bahasa Belarusia
bg . Bulgaria
bahasa Ceko
Estonia et
hr . Kroasia
hongaria hu
Lituania lt
lv . Latvia
bahasa Polandia
ru . Rusia
Slovakia sk
bahasa Slovenia
Inggris Ukraina
zh Cina

FITUR


Beberapa fitur Enca bergantung pada apa yang tersedia di sistem Anda dan bagaimana itu
dikompilasi. Anda bisa mendapatkan daftar mereka dengan

enca --versi

Tanda plus sebelum nama fitur berarti tersedia, tanda minus berarti build ini kurang
fitur tertentu.

librecode-antarmuka. Enca memiliki antarmuka ke GNU recode library charset konversi
fungsi.

ikonv-antarmuka. Enca memiliki antarmuka ke fungsi konversi charset iconv UNIX98.

konverter eksternal. Enca dapat menggunakan program konversi eksternal (jika Anda memiliki beberapa yang cocok)
terpasang).

deteksi bahasa. Enca mencoba menebak bahasa (-L) dari lokal. Anda tidak perlu
--bahasa pilihan, setidaknya pada prinsipnya.

lokal-alias. Enca mampu mendekripsi alias lokal yang digunakan untuk nama bahasa.

target-charset-otomatis. Enca mencoba mendeteksi rangkaian karakter pilihan Anda dari lokal. Pilihan
--konversi otomatis dan memanggil Enca sebagai percakapan bekerja, setidaknya pada prinsipnya.

MEMENUHI. Enca dapat mengurai variabel lingkungan ini dengan benar sebelum baris perintah
parameter. Hal-hal sederhana seperti ENCAOPT="-L inggris" akan bekerja bahkan tanpa fitur ini.

LINGKUNGAN


Variabel MEMENUHI dapat menahan set opsi Enca default. Isinya ditafsirkan
sebelum argumen baris perintah. Sayangnya, ini tidak berfungsi di semua tempat (harus ada
+fitur ENCAOPT).

LC_CTYPE, LC_COLLATE, LC_MESSAGES (mungkin diwarisi dari LC_SEMUA or BAHASA) digunakan untuk
menebak bahasa Anda (harus memiliki +fitur deteksi bahasa).

Variabel DEFAULT_CHARSET dapat digunakan oleh percakapan sebagai rangkaian karakter target default.

DIAGNOSTIK


Enca mengembalikan kode keluar 0 ketika semua file input berhasil diproses (yaitu semua
pengkodean terdeteksi dan semua file dikonversi ke pengkodean yang diperlukan, jika konversi
diminta). Kode keluar 1 dikembalikan ketika Enca tidak dapat menebak penyandian atau
melakukan konversi pada file input apa pun karena itu tidak cukup pintar. Kode keluar 2 adalah
dikembalikan jika terjadi masalah serius (misalnya I/O).

KEAMANAN


Seharusnya memungkinkan untuk membiarkan Enca bekerja tanpa pengawasan, itu tujuannya. Namun:

Tidak ada jaminan deteksi bekerja 100%. Jangan bertaruh, Anda bisa dengan mudah kalah
data berharga.

Jangan gunakan enca (program), link ke libenca sebagai gantinya jika Anda menginginkan sesuatu yang mirip
keamanan. Anda harus melakukan sendiri konversi akhirnya.

Jangan gunakan konverter eksternal. Idealnya, nonaktifkan waktu kompilasi.

Sadarilah MEMENUHI dan semua automagic built-in menebak berbagai hal dari
lingkungan, yaitu lokal.

Gunakan enca online menggunakan layanan onworks.net


Server & Workstation Gratis

Unduh aplikasi Windows & Linux

  • 1
    itop - Sumber Terbuka ITSM CMDB
    itop - Sumber Terbuka ITSM CMDB
    Portal Operasi TI: pembukaan lengkap
    sumber, ITIL, layanan berbasis web
    alat manajemen termasuk sepenuhnya
    CMDB yang dapat disesuaikan, sistem meja bantuan dan
    seorang pria dokumen...
    Unduh ittop - ITSM CMDB OpenSource
  • 2
    Clementine
    Clementine
    Clementine adalah musik multi-platform
    pemain dan penyelenggara perpustakaan terinspirasi oleh
    Amarok 1.4. Ini memiliki cepat dan
    antarmuka yang mudah digunakan, dan memungkinkan Anda untuk
    cari dan...
    Unduh Clementine.dll
  • 3
    XISMuS
    XISMuS
    PERHATIAN: Pembaruan kumulatif 2.4.3 telah
    telah dirilis!! Pembaruan berfungsi untuk semua
    versi 2.xx sebelumnya. Jika meningkatkan
    dari versi v1.xx, silakan unduh dan
    i ...
    Unduh XISMuS.dll
  • 4
    facetracknoir
    facetracknoir
    Program pelacakan kepala modular itu
    mendukung banyak pelacak wajah, filter
    dan protokol permainan. Di antara pelacak
    adalah SM FaceAPI, AIC Inertial Head
    Pelacak...
    Unduh facetracknoir.dll
  • 5
    Kode QR PHP
    Kode QR PHP
    Kode QR PHP adalah sumber terbuka (LGPL)
    perpustakaan untuk menghasilkan Kode QR,
    kode batang 2 dimensi. Berdasarkan
    libqrencode C library, menyediakan API untuk
    membuat batang Kode QR...
    Unduh Kode QR PHP
  • 6
    freeciv
    freeciv
    Freeciv adalah turn-based gratis
    game strategi multipemain, di mana masing-masing
    pemain menjadi pemimpin a
    peradaban, berjuang untuk mendapatkan
    tujuan akhir: menjadi...
    Unduh Freeciv.dll
  • Lebih banyak lagi »

Perintah Linux

Ad