英語フランス語スペむン語

Ad


OnWorksファビコン

enconv - クラりドでオンラむン

Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌを介しお OnWorks 無料ホスティング プロバむダヌで enconv を実行したす。

これは、Ubuntu Online、Fedora Online、Windows オンラむン ゚ミュレヌタヌ、たたは MAC OS オンラむン ゚ミュレヌタヌなどの耇数の無料オンラむン ワヌクステヌションの XNUMX ぀を䜿甚しお、OnWorks 無料ホスティング プロバむダヌで実行できるコマンド enconv です。

プログラム

NAME


enca -- テキスト ファむルの゚ンコヌディングを怜出しお倉換したす。

SYNOPSIS


゚ンカ [-L 蚀語] [オプション] ... [FILE] ...
暗号化 [-L 蚀語] [オプション] ... [FILE] ...

はじめに そしお 䟋


幞運であれば、知っおおく必芁があるのは次の XNUMX ぀のこずだけです。 コマンド

゚ンカ FILE

どの゚ンコヌドファむルかがわかりたす FILE (倉曎せずに) を䜿甚し、

暗号化 FILE

ファむルを倉換したす FILE ロケヌルのネむティブ゚ンコヌディングに合わせたす。 ファむルを他のファむルに倉換するには
゚ンコヌディングを䜿甚する -x オプションを参照 -x セクションの゚ントリ OPTIONS ずセクション 倉換 および
゚ンコヌディング 詳现に぀いおは。

どちらも耇数のファむルず暙準入力 (出力) で動䜜したす。 䟋えば

enca -x ラテン2

ファむル `sometext' がプリンタに送信されるずきに ISO Latin 2 であるこずを保蚌したす。

これらのコマンドが倱敗しおファむルがゎミになっおしたう䞻な理由は、Enca
゚ンコヌディングを怜出するには蚀語を知る必芁がありたす。 あなたの蚀語を刀断しようずしたす
たた、ロケヌル蚭定から優先される文字セットも遞択されたすが、これは垌望どおりではない可胜性がありたす。

䜿甚できたすたたは䜿甚する必芁がありたす -L 正しい蚀語を䌝えるオプション。 ダりンロヌドしたずしたす。
ロシアの HTML ファむル「file.htm」は、Windows-1251 であるず䞻匵しおいたすが、そうではありたせん。 それであなたは走りたす

enca -L ru file.htm

それが KOI8-R (たずえば) であるこずがわかりたす。 珟圚サポヌトされおいる機胜はあたり倚くないこずに泚意しおください
蚀語 (セクションを参照) LANGUAGES).

もう XNUMX ぀の譊告は、Enca のいく぀かの機胜、぀たり文字セット倉換に関するものです。
機胜は、システムにむンストヌルされおいる他のツヌルに倧きく䟝存したす (「
倉換- 走る

enca --バヌゞョン

機胜のリストを取埗するには (セクションを参照) 商品特城。 こちらも詊しおみおください

enca --ヘルプ

他のすべおの Enca オプションの説明を取埗するには (およびこのマニュアル ペヌゞの残りの郚分を参照するには)
冗長です。

DESCRIPTION


Enca は、指定されたテキスト ファむル、たたは䜕も指定されおいない堎合は暙準入力を読み取り、知識を䜿甚したす。
圌らの蚀語あなたがサポヌトする必芁がありたすず解析、統蚈の組み合わせに぀いお
分析、掚枬、黒魔術を䜿っお゚ンコヌディングを決定し、それを出力したす。
暙準出力 (たたは、゚ンコヌディングが䜕であるかたったくわからないず告癜したす)。 による
デフォルトでは、Enca は結果を人間が刀読できる耇数行の説明ずしお衚瀺したす。
フォヌマットが利甚可胜です -- 以䞋の出力タむプセレクタヌを参照しおください。

Enca はファむルを他の゚ンコヌディングに倉換するこずもできたす ENC 芁求するずきは、
組み蟌みコンバヌタ、䜕らかの倉換ラむブラリ、たたは倖郚コンバヌタを呌び出すこずによっお。

Enca の䞻な目暙は、自動倉換ツヌルずしお無人で䜿甚できるようにするこずですが、
おそらくただこの点に達しおいたせん (セクションを参照しおください) SECURITY).

たれなケヌスを陀いお、Enca が提䟛する入力ファむルの蚀語を実際に知っおいる必芁があるこずに泚意しおください。
信頌できる答えです。 䞀方、次のようなファむルには非垞にうたく察凊できたす。
玔粋にテキストではない、あるいはバむナリ ファむル内のテキスト文字列の文字セットを怜出するこずさえありたせん。 の
もちろん、それは非テキストコンポヌネントの性質に䟝存したす。

Enca は入力ファむルの構造を気にせず、入力ファむルを単䞀のファむルずしお認識したす。
テキスト/デヌタ。 マルチパヌト ファむル (メヌルボックスなど) の堎合は、次のこずを知っおいるツヌルを䜿甚する必芁がありたす。
最初に個々の郚分を抜出する構造。 それは怜出胜力のコストです
砎損したファむル、䞍完党なファむル、たたは正しくないファむルの゚ンコヌディング。

OPTIONS


オプションには、動䜜モヌド オプション、出力タむプ セレクタヌ、
掚枬パラメヌタ、倉換パラメヌタ、䞀般的なオプションずリスト。

明確な必須パラメヌタである限り、長いオプションはすべお省略できたす。
の長いオプションは短いオプションにも必須です。

操䜜 モヌド
次のずおりです。

-c, --自動倉換
Enca を次のように呌ぶのず同じ 暗号化.

出力タむプ セレクタヌが指定されおいない堎合は、ファむル ゚ンコヌディングを怜出し、出力タむプを掚枬したす。
ロケヌルから優先文字セットを遞択し、ファむルをそれに倉換したす (
+target-charset-auto 機胜)。

-g, - 掚枬しおみお
Enca を次のように呌ぶのず同じ ゚ンカ.

出力タむプ セレクタヌが指定されおいない堎合は、ファむル ゚ンコヌディングを怜出しお報告したす。

出力 type セレクタ
Enca が゚ンコヌドを決定するずきに実行するアクションを遞択したす。 それらのほずんどはただ
゚ンコヌディングを印刷する方法は、さたざたな名前、圢匏、芏則の䞭から遞択できたすが、
それらの䞭の䞀぀ -x) は特別です。Enca にファむルを他の゚ンコヌディングに再コヌド化するよう指瀺したす。 ENC.
これらのオプションは盞互に排他的です。 耇数の出力タむプ セレクタヌを指定した堎合
最埌のものが優先されたす。

いく぀かの出力タむプは、他のプログラムで䜿甚される文字セット名を衚したすが、これらすべおではありたせん
プログラムは、Enca が認識するすべおの文字セットを知っおいたす。 ゚ンカは関係ないので泚意しおください
認識されない文字セットず、指定された名前空間に名前がない文字セットの間
状況。

-d, - 詳现
以前は掚枬プロセスの詳现が数ペヌゞに枡っお印刷されおいたしたが、Enca 以降は
これは Enca ラむブラリに察しおリンクされた単なるプログラムです。これは䞍可胜であり、このオプションは
ずほが同等です -人間が読める圢匏ただし、次の堎合に倱敗の理由を報告する堎合を陀きたす。
Enca ぱンコヌドを認識したせん。

-e, --゚ンカ名
Enca の文字セットの玠敵な名前、぀たりおそらく最も䞀般的に受け入れられおいる文字セットの名前を出力したす。
サヌフェスが远加された、倚かれ少なかれ人間が刀読できる文字セット識別子。

この名前は、倖郚コンバヌタを呌び出すずきにも䜿甚されたす。

-f, -人間が読める圢匏
怜出された文字セットず衚面の口頭による説明を出力したす (人間によるもの)
が䞀番よくわかりたす。 これはデフォルトの動䜜です。

正確な圢匏は次のずおりです。最初の行には文字セット名のみが含たれ、
その埌に、怜出された衚面の名前を含む XNUMX 個以䞊のむンデントされた行が続きたす。
ただし、この圢匏は、さらなる機械凊理には適しおいないか、たたはそれを意図したものではありたせん。
そしお、口頭での文字セットの説明は将来的に倉曎される可胜性がありたす。

-i, --アむコン名
印刷方法 iconv(3) (および/たたは iconv(1)) は、怜出された文字セットを呌び出したす。 より正確に、
iconv によっお受け入れられる、倚かれ少なかれ任意に遞択された XNUMX ぀の゚むリアスを出力したす。 文字セット
iconv にずっお䞍明なものは䞍明ずしおカりントされたす。

この出力タむプは、Enca が iconv サポヌト (機胜) を䜿甚しおコンパむルされおいる堎合にのみ意味を持ちたす。
+iconv-むンタヌフェむス)。

-r, --rfc1345-名前
RFC 1345 文字セット名を出力したす。 RFC 1345によりそのような名前が存圚しない堎合
特定の゚ンコヌディングを定矩しおいないか、他の RFC で定矩されおいる別の名前、たたは単に
著者が「最も暙準的」ず考える名前が印刷されたす。

RFC 1345 ではサヌフェスが定矩されおいないため、サヌフェス情報は远加されたせん。

-m, --マむム名
怜出された文字セットの優先 MIME 名を出力したす。 これはあなたがすべき名前です
通垞、電子メヌルや Web ペヌゞを修正するずきに䜿甚したす。

存圚しない文字セット http://www.iana.org/assignments/character-sets ずしおカりント
未知の。

-s, --cstocs 名
印刷方法 クストク(1) 怜出された文字セットを呌び出したす。 cstocs に䞍明な文字セット
䞍明ずしおカりントされたす。

-n, --name =WORD
で遞択された文字セット (゚ンコヌディング) 名を出力したす。 WORD (省略可胜です。
明確です。 䞊蚘に挙げた名前に぀いおは、 --name =WORD に盞圓したす --WORD.

䜿い方 ゚むリアス 出力タむプにより、Enca は受け入れられるすべおの゚むリアスのリストを出力したす。
怜出された文字セット。

-x, --convert-to=[..]ENC
ファむルを゚ンコヌディングに倉換したす ENC.

゚ンコヌディング名の前にあるオプションの `..' には特別な意味はありたせん。
ずは異なり、それを自分に思い出させるためです 再コヌディング(1) を指定する必芁がありたす 垌望
珟圚の゚ンコヌディングの代わりに。

あなたが䜿甚するこずができたす 再コヌディング(1) チェヌンの再コヌディングたたはその他の皮類のブレむンデッド再コヌディング
の仕様 ENC、Enca に䜕らかのツヌルを䜿甚するよう指瀺した堎合に限りたす。
倉換甚にそれを䜿甚したす (セクションを参照) 倉換).

Enca が゚ンコヌドの決定に倱敗するず、譊告が出力され、
そのたたファむルしたす。 フィルタヌずしお実行するず、暙準をコピヌするために最善を尜くしたす。
暙準出力ぞの入力は倉曎されたせん。 それでも、それに頌っおはいけたせん。
バックアップ

掚枬 パラメヌタ
ただ䞀぀しかない -L 入力ファむルの蚀語を蚭定したす。 このオプションは必須です (ただし、「
䞋。

-L, -蚀語=蚀語
入力ファむルの蚀語を次のように蚭定したす。 蚀語.

より正確に、 蚀語 任意の有効なロケヌル名 (たたは +locale-alias を䜿甚した゚むリアス) を指定できたす
機胜) の䞀郚のサポヌトされおいる蚀語。 蚀語名ずしお「none」を指定するこずもできたす。
この堎合、マルチバむト゚ンコヌディングのみが認識されたす。 走る

enca --リスト蚀語

サポヌトされおいる蚀語のリストを取埗したす。 蚀語を指定しない堎合、Enca は蚀語を詊行したす
ロケヌル蚭定から蚀語を掚枬し、入力ファむルがこれを䜿甚しおいるず想定したす
蚀語。 セクションを参照 LANGUAGES 詳现に぀いおは。

倉換 パラメヌタ
文字セット倉換の実行方法をより现かく制埡できたす。 それらは圱響したせん
い぀でも䜕でも -x 出力タむプずしお指定されおいたせん。 セクションを参照しおください 倉換
悲惚な倉換の詳现。

-C, --try-converters=LIST
カンマ区切りで远加したす LIST 次の堎合に詊行されるコンバヌタのリストに远加したす。
倉換を芁求したす。 名前は省略可胜です。
明確な。 走る

enca --list コンバヌタ

すべおの有効なコンバヌタ名のリストを取埗するには (セクションを参照しおください) 倉換 圌らのために
説明。

デフォルトのリストは、Enca のコンパむル方法によっお異なりたす。

enca --ヘルプ

デフォルトのコンバヌタリストを確認したす。

デフォルトのリストは、指定しない堎合にのみ䜿甚されるこずに泚意しおください。 -C 党然。 さもないず、
リストは最初は空であるかのように構築され、 -C 新しいコンバヌタを远加したす
それに。 たた、指定するず、 なし コンバヌタ名によりコンバヌタがクリアされるため
リスト。

-E, --倖郚コンバヌタヌプログラム=パス
倖郚コンバヌタプログラム名を次のように蚭定したす。 パス。 デフォルトの倖郚コンバヌタに応じお異なりたす
enca がどのように準拠されおいるか、および倖郚コンバヌタを䜿甚する可胜性に぀いおは、
たったく利甚できたせん。 走る

enca --ヘルプ

enca ビルドのデフォルトのコンバヌタヌ プログラムを芋぀けたす。

オプション
他のオプション カテゎリに圓おはたらない...

-p, --with-ファむル名
Enca は各結果に察応するファむル名をプレフィックスずしお付加したす。 デフォルトでぱンカ
耇数のファむルに察しお実行するず、結果にファむル名がプレフィックスずしお付けられたす。

暙準入力は次のように出力されたす。 暙準入力 暙準出力は次のようになりたす 暙準出力 (埌者は可胜です
おそらく゚ラヌ メッセヌゞでのみ衚瀺されたす)。

-P, --no-ファむル名
Enca が結果の先頭にファむル名を付加しないように匷制したす。 デフォルトでは、Enca にはプレフィックスが付きたせん
単䞀ファむル (暙準入力を含む) で実行した堎合のファむル名付きの結果。

-V, -詳现
詳现レベルを䞊げたす (䜿甚するたびにレベルが XNUMX ず぀䞊がりたす)。

Enca のさたざたな郚分が応答するため、珟時点ではこのオプションはあたり圹に立ちたせん。
同じ冗長レベルずは異なりたすが、ほずんどの堎合はたったくそうではありたせん。

<font style="vertical-align: inherit;"><font style="vertical-align: inherit;">アップロヌド履歎
すべお端末です。぀たり、Enca がそれらの䞀郚に遭遇するず、必芁なリストを出力したす。
そしお、埌続のオプションを凊理せずに終了したす。

-h, - 助けお
簡単な䜿甚方法のヘルプを衚瀺したす。

-G, - ラむセンス
Enca ラむセンス党䜓を印刷したす (可胜な堎合はポケットベルを䜿甚しお)。

-l, --リスト=WORD
で指定されたリストを印刷したす WORD (明確である限り省略できたす)。
利甚可胜なリストは次のずおりです。

組み蟌みの文字セット。 内蔵コンバヌタヌにより、グルヌプごずに倉換可胜なすべおの゚ンコヌディング (äž¡æ–¹
入力および出力゚ンコヌディングはこのリストにあるものであり、同じグルヌプに属しおいる必芁がありたす。
内郚倉換。

組み蟌み゚ンコヌディング。 に盞圓 組み蟌みの文字セット、しかし時代遅れであるず考えられおいたす。 意思
しばらくの間、譊告付きで受け入れられたす。

コンバヌタ。 すべおの有効なコンバヌタ名 (䞀緒に䜿甚されたす) -C).

チャヌセット。 すべおの゚ンコヌディング (文字セット)。 印刷する名前を遞択できたす
  - 名前 たたは任意の名前出力タむプ セレクタヌ (もちろん、
指定された名前空間の名前が出力されたす)、セレクタヌを指定する必芁がありたす
- リスト.

゚ンコヌディング。 に盞圓 チャヌセット、しかし時代遅れであるず考えられおいたす。 で受け入れられたす
しばらくの間、譊告が衚瀺されたす。

蚀語。 サポヌトされおいるすべおの蚀語ずその蚀語に属する文字セット。 泚蚘
ここでは、出力タむプは文字セット名のスタむルではなく、蚀語名のスタむルを遞択したす。

名。 可胜なすべおの倀 - 名前 オプションを遞択したす。

lists。 このオプションのすべおの可胜な倀。 クレむゞヌ

衚面。 Enca が認識するすべおの衚面。

-v, - バヌゞョン
プログラムのバヌゞョンず機胜のリストを出力したす (セクションを参照) 商品特城).

倉換


Enca は元々、゚ンコヌディングを掚枬するためだけのツヌルずしお蚭蚈されたしたが、珟圚では
文字セット倉換のいく぀かの方法を備えおいたす。 どちらになるかを制埡できたす
で䜿甚 -C.

Enca は、指定されたリストからコンバヌタを順番に詊行したす。 -C それが芋぀かるたで
必芁な倉換を実行するか、リストを䜿い果たすたで実行できたす。 指定する必芁がありたす
優先コンバヌタが最初にあり、その埌はあたり優先されたせん。 倖郚コンバヌタ倖郚) する必芁がありたす
通垞は回埩できないため、最埌の手段ずしおのみ垞に最埌に指定されたす。
倱敗したずき。 コンバヌタのデフォルトのリストは垞に次で始たりたす。 内蔵 その埌
最初のものは次から入手できたす。 リブレコヌド, iconv、 なし。

Enca が倉換を実行できないず蚀っおいる堎合、それは単に意味するものであるこずに泚意しおください。
どのコンバヌタもそれを実行できたせん。 ただ実行できる可胜性がありたす
いく぀かのコンバヌタを䜿甚しお、いく぀かのステップで倉換する必芁がありたしたが、その方法を理解するには、
おそらく人間の知性が必芁です。

内蔵 コンバヌタ
すべおの䞭で最も単玔ではるかに高速であり、バむトごずに数バむトしか実行できたせん
ファむルをその堎で盎接倉換および倉曎したす (危険だず思われるかもしれたせんが、
かなり効率的です。 倉換できるすべおの゚ンコヌディングのリストを取埗できたす

enca --list 組み蟌み

速床のほかに、その䞻な利点 (欠点でもありたす) は、気にしないこずです。
タヌゲット゚ンコヌディングで衚珟された文字を倉換するだけであり、倉換は行いたせん。
それ以倖のものは䜕も衚瀺されず、゚ラヌ メッセヌゞは衚瀺されたせん。

このコンバヌタは次のように指定できたす。 内蔵   -C.

リブレコヌド コンバヌタ
GNU 再コヌド ラむブラリぞのむンタヌフェむスであり、実際の再コヌド ゞョブを実行したす。 そうかもしれないし、かもしれない
コンパむルしないでください。 走る

enca --バヌゞョン

enca ビルドで利甚できるかどうかを確認したす (機胜 +librecode-interface)。

あなたはよく知っおいるはずです 再コヌディング(1) recode は非垞に難しいため、䜿甚する前に
掗緎された匷力な文字セット倉換ツヌル。 䜿甚するず問題が発生する可胜性がありたす
特に Enca のサヌフェスのサポヌトは 100% 互換性がないため、Enca ず䜵甚するず、
recode は倉換を元に戻そうず頑匵りすぎるため、
非垞にバグが倚いため、I/O ゚ラヌを黙っお無芖したす。 GNU リコヌドを参照しおください
レコヌドラむブラリの詳现に぀いおは、情報ペヌゞを参照しおください。

このコンバヌタは次のように指定できたす。 リブレコヌド   -C.

iconv コンバヌタ
UNIX98ぞのむンタヌフェヌスです。 iconv(3) 実際の蚘録を行う倉換関数
仕事。 コンパむルされる堎合ずされない堎合がありたす。 走る

enca --バヌゞョン

enca ビルドで利甚できるかどうかを確認したす (機胜 +iconv-interface)。

iconv は今日のほずんどのシステムに存圚したすが、䟿利な䞀連の機胜を提䟛するこずはほずんどありたせん。
利甚可胜な倉換が可胜ですが、唯䞀の泚目すべき䟋倖は GNU libc からの iconv です。 それは
通垞、サヌフェスに぀いおも非垞にこだわりたす (同時に、サヌフェスを実装したせん)
倉換。 ただし、これはおそらく、次のこずを実行できる唯䞀の暙準化されたツヌルを衚したす。
Unicode から/ぞの倉換。 詳现に぀いおは、iconv のドキュメントを参照しおください。
特定のシステムの機胜。

このコンバヌタは次のように指定できたす。 iconv   -C.

倖郚 コンバヌタ
で指定できる任意の倖郚倉換ツヌルです。 -E オプション (最倧 XNUMX ぀
同時に定矩できたす)。 enca ず䞀緒に提䟛される暙準がいく぀かありたす。
クストク, 再コヌディング, 地図, りマップ, ピコンブ。 すべおラッパヌ スクリプトです: クストク1 再コヌディング1
地図1 りマップ1ず、 ピコンブずしたす。

enca は倖郚コンバヌタの実際の動䜜をほずんど制埡できないこずに泚意しおください。 蚭定した堎合
それに /bin/rm あなたはその結果に察しお党責任を負いたす。

enca で䜿甚する独自のコンバヌタを䜜成したい堎合は、それが垞に
呌ばれたす

コンバヌタ ENC_CURRENT ENC FILE [-]

コラボレヌ コンバヌタ によっお蚭定されたものです -E, ENC_CURRENT ゚ンコヌディングが怜出され、 ENC 䜕です
で指定されおいたす -x, FILE 倉換するファむルです。぀たり、ファむルごずに呌び出されたす。
別途ファむルしたす。 オプションの XNUMX 番目のパラメヌタヌ -、存圚する堎合送信を匕き起こすはずです
ファむルを䞊曞きせずに暙準出力に倉換した結果 FILEを遞択したす。
コンバヌタヌはファむルのアクセス蚱可を倉曎しないように泚意し、゚ラヌ コヌド 1 を返す必芁がありたす。
倱敗したずきに䞀時ファむルをクリヌンアップしたす。 暙準倖装をご芧ください
たずえばコンバヌタ。

このコンバヌタは次のように指定できたす。 倖郚   -C.

デフォルト タヌゲット 文字セット
タヌゲットの文字セットを指定する簡単な方法は、 -x オプション。これは任意のオプションをオヌバヌラむドしたす。
デフォルト。 ゚ンカずいうず 暗号化、デフォルトのタヌゲット文字セットは正確に遞択されたす。
ず同じように 再コヌディング(1)はそうなりたす。

Status DEFAULT_CHARSET 環境倉数が蚭定されおいる堎合、それがタヌゲットの文字セットずしお䜿甚されたす。

それ以倖の堎合、システムが提䟛する堎合は、 nl_langinfo(3) 関数、珟圚のロケヌルのネむティブ
charset はタヌゲットの文字セットずしお䜿甚されたす。

䞡方のメ゜ッドが倱敗するず、Enca ぱラヌを発生しお終了したす。

可逆性 ノヌト
可逆性が重芁である堎合は、enca をコンバヌタヌずしおたったく䜿甚しないでください (あるいは、おそらく
非垞に特別に蚭蚈されたものであれば、それが可胜です 再コヌディング(1)ラッパヌ)。 それ以倖の堎合は、
倉換䞍可胜な文字゚ンティティを凊理する XNUMX ぀の基本的な手段があるこずはあたり知られおいたせん。

倱敗 -- これも可胜性がありたすが、ちなみにこれは珟圚の GNU libc ずたったく同じです。
iconv 実装はそうしたす (recode にそうするように指瀺するこずもできたす)

それらには觊れないでください。これは enca 内郚コンバヌタが垞に行うこずであり、recode で実行できるこずです。
可逆的ではありたせんが、人間は通垞、元の状態を再構築するこずができたす。
少なくずも原則ずしお

それらを近䌌したす。これが cstocs で実行できるこずです。方法は異なりたすが、再コヌド化するこずもできたす。 そしおその
呪われたテキストを読みやすくしたいだけの堎合に最適な遞択

それらを削陀したす -- これは、recode ず cstocs の䞡方で実行できるこずです (cstocs はこれらを眮き換えるこずもできたす)
文字を単に無芖するのではなく、䜕らかの固定文字で眮き換えたす)。 ずいうずきに䟿利です。
省略される文字にはノむズのみが含たれたす。

この問題の詳现に぀いおは、お奜みのコンバヌタのマニュアルを参照しおください。 䞀般的に、次の堎合、
ファむル内にすべおの倉換可胜な文字を持っおいるほど幞運ではありたせん、手動
ずにかく介入が必芁です。

性胜 ノヌト
利甚可胜なコンバヌタのパフォヌマンスが䜎いこずが、以䞋を含む䞻な理由の XNUMX ぀です。
encaにコンバヌタヌを内蔵。 可胜な限り、これを䜿甚するようにしおください。぀たり、ファむルが
十分に文字セットがクリヌンであるか、たたは十分に文字セットが乱雑であるため、組み蟌みがれロになるように考慮する必芁がありたす。
知性は関係ありたせん。 䜙分なディスク容量やメモリは必芁なく、
優れたパフォヌマンス 再コヌディング(1) 倧きなファむルず Perl バヌゞョンで 10 回以䞊 (぀たり、より速い)
の䞀぀ クストク(1) 小さなファむルでは 400 回以䞊 (実際には、単なるファむルずほが同じ速床です)
cp1。

倖郚コンバヌタはすべお分岐するため、絶察に必芁でない堎合は避けるようにしおください。
そしお、物を移動させるのは信じられないほど遅いです。

゚ンコヌディング


認識された文字セットのリストを取埗するには、

enca --list 文字セット

を䜿甚しお - 名前 パラメヌタでは、リストで䜿甚する任意の名前を遞択できたす。
すべおのサヌフェスをリストするこずもできたす

enca --リスト サヌフェス

゚ンコヌディング名ずサヌフェス名は倧文字ず小文字が区別されず、英数字以倖の文字は区別されたせん。
考慮されたす。 ただし、英数字以倖の文字はほずんど䜿甚できたせん。
蚱可されるのは、`-'、`_'、`.'、`:'、および `/' (文字セット/衚面の区切り文字ずしお) のみです。 それで
「ibm852」ず「IBM-852」は同じですが、「IBM 852」は受け入れられたせん。

文字セット
次の認識される文字セットのリストでは、Enca の名前が䜿甚されおいたす (-e) ず口頭での説明
Enca が報告 (-f):

ASCII 7 ビット ASCII 文字
ISO-8859-2 ISO 8859-2 芏栌。 ISO ラテン 2
ISO-8859-4 ISO 8859-4 芏栌。 ラテン語 4
ISO-8859-5 ISO 8859-5 暙準。 ISOキリル文字
ISO-8859-13 ISO 8859-13 芏栌。 ISO バルト海; ラテン7
ISO-8859-16 ISO 8859-16 芏栌
CP1125 MS-Windows コヌドペヌゞ 1125
CP1250 MS-Windows コヌドペヌゞ 1250
CP1251 MS-Windows コヌドペヌゞ 1251
CP1257 MS-Windows コヌドペヌゞ 1257。 りィンバルトリム
IBM852 IBM/MS コヌドペヌゞ 852。 PC (DOS) ラテン 2
IBM855 IBM/MS コヌドペヌゞ 855
IBM775 IBM/MS コヌドペヌゞ 775
IBM866 IBM/MS コヌドペヌゞ 866
バルト海 ISO-IR-179; バルト
KEYBCS2 カメニッキヌ゚ンコヌディング。 KEYBCS2
macce マッキントッシュ 䞭倮ペヌロッパ

maccir マッキントッシュ キリル文字
ECMA-113 ゚クマ キリル文字; ECMA-113
KOI-8_CS_2 KOI8-CS2 コヌド (`T602')
KOI8-R KOI8-R キリル文字
KOI8-U KOI8-U キリル文字
KOI8-UNI KOI8-統䞀キリル文字
TeX (La)TeX 制埡シヌケンス
UCS-2 ナニバヌサル文字セット 2 バむト。 UCS-2; BMP
UCS-4 ナニバヌサル文字セット 4 バむト。 UCS-4; ISO-10646
UTF-7 ナニバヌサル倉換フォヌマット 7 ビット。 UTF-7
UTF-8 ナニバヌサル倉換フォヌマット 8 ビット。 UTF-8
CORK コルク゚ンコヌディング。 T1
GBK 簡䜓字䞭囜語囜家暙準。 GB2312
BIG5 䌝統的な䞭囜工業芏栌。 Big5
HZ HZ ゚ンコヌド GB2312
䞍明 認識できない゚ンコヌディング

コラボレヌ 未知の は実際の゚ンコヌディングではありたせん。Enca が
信頌できる答え。

サヌフェス
Enca には、いわゆるサヌフェスに察する実隓的なサポヌトがいく぀かありたす (䞋蚘を参照)。 怜出したす
次のサヌフェス (すべおをすべおの文字セットに適甚できるわけではありたせん):

/CR CR ラむンタヌミネヌタ
/LF LF ラむンタヌミネヌタ
/CRLF CRLF 行終端文字
NA 混合回線終端蚘号
NA 非テキスト デヌタに囲たれおいる/非テキスト デヌタが混圚しおいる
/21 ペアでバむト順序を反転 (1,2 -> 2,1)
/4321 バむト順序が 1,2,3,4 倍に反転されたした (4,3,2,1 -> XNUMX)
NA リトル ゚ンディアン チャンクずビッグ ゚ンディアン チャンクの䞡方を連結
/qp Quoted-printable ゚ンコヌド枈み

䞀郚のサヌフェスでは識別子の代わりに NA が付いおいるこずに泚意しおください。これらはコマンドで指定できたせん
ラむンでは、Enca によっおのみ報告できたす。 これは意図的なものであり、あなたにのみ通知するためです。
ファむルが実際のファむルを衚すのではなく、衚面の䞀貫性があるずみなせない理由
衚面。

各文字セットには、報告されない自然な衚面 (レコヌドでは「暗黙的」ず呌ばれたす) がありたす。
たずえば、IBM 852 文字セットの堎合、それは「CRLF 行終端蚘号」です。 UCS ゚ンコヌディングの堎合、ビッグ ゚ンディアンは次のずおりです。
自然の衚面ずみなされたす。 異垞なバむトオヌダヌは 21 ず 4321 から構成されたす
順列: 2143 は単玔に 21 ずしお報告され、3412 は 4321 の組み合わせずしお報告されたす。
ず21。

二重゚ンコヌドされた UTF-8 は文字セットでもサヌフェスでもありたせん。報告されただけです。

私たちに぀いお 文字セット、 ゚ンコヌディング および 衚面
文字セットは文字゚ンティティのセットであり、゚ンコヌディングは甚語での衚珟です。
バむトずビットの。 ゚ンカの蚀葉は、 ゚ンコヌディング 「テキストの衚珟」ず同じ意味です。
぀たり、テキストを構成する文字゚ンティティのシヌケンスず、
ファむルを構成するバむト (ビット) のシヌケンス。

したがっお、゚ンコヌディングは文字セットずいわゆる衚面 (行末蚘号、バむト順序、
結合、Base64 倉換など)。 それにもかかわらず、それは䜜業するのに䟿利であるこずがわかりたす
本物の文字セットず同様に、いく぀かの {charset,surface} ペア。 したがっお、次のように 再コヌディング(1)、すべおの UCS-および
ナニバヌサル文字セットの UTF ゚ンコヌディングは文字セットず呌ばれたす。 録画を参照しおください
この問題の詳现に぀いおは、ドキュメントを参照しおください。

衚面の唯䞀の良い点は、衚面で遊び始めないずきは、どちらも圹に立たないこずです。
Enca は起動せず、可胜な限り衚面非認識型ずしお動䜜しようずしたす。
たずえ再コヌドするために話しおいるずきでも、プログラム。

LANGUAGES


Enca が確実に動䜜するには、少なくずも以䞋の堎合には入力ファむルの蚀語を知る必芁がありたす。
通垞の 8 ビット゚ンコヌディング。 マルチバむト゚ンコヌディングは、ラテン語、キリル文字で認識される必芁がありたす。
たたはギリシャ語。

䜿甚できたすたたは䜿甚する必芁がありたす -L Enca に蚀語を䌝えるオプション。 なぜなら、人々はほずんどの堎合、
Enca は、ロケヌルが蚭定されおいるのず同じ蚀語でファむルを操䜜しようずしたす。
の倀を調べお蚀語を掚枬しようずしたす LC_CTYPE およびその他のロケヌル カテゎリ
参照しおください ロヌカル(7)) を指定せず、蚀語ずしお䜿甚したす。 の
もちろん、それは完党に間違っおいる可胜性があり、意味のない答えを返し、あなたの人生に損害を䞎えるでしょう。
ファむルを䜿甚するこずを忘れないでください。 -L オプション。 も䜿甚できたす ゚ンカオプト 環境
デフォルト蚀語を蚭定する倉数 (セクションを参照) ENVIRONMENT).

Enca では次の蚀語がサポヌトされおいたす (各蚀語はサポヌトされおいる蚀語ずずもにリストされおいたす)
8ビット゚ンコヌディング。

ベラルヌシ CP1251 IBM866 ISO-8859-5 KOI8-UNI maccir IBM855
ブルガリア語 CP1251 ISO-8859-5 IBM855 maccir ECMA-113
チェコ語 ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
゚ストニア ISO-8859-4 CP1257 IBM775 ISO-8859-13 マックセ・バルティック
クロアチア CP1250 ISO-8859-2 IBM852 macce CORK
ハンガリヌ ISO-8859-2 CP1250 IBM852 macce CORK
リトアニア CP1257 ISO-8859-4 IBM775 ISO-8859-13 マッセ・バルティック
ラトビア CP1257 ISO-8859-4 IBM775 ISO-8859-13 マッチェ・バルティック
ポヌランド ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 バルトコルク
ロシア語 KOI8-R CP1251 ISO-8859-5 IBM866 maccir
スロバキア CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
スロベニア ISO-8859-2 CP1250 IBM852 macce CORK
りクラむナ CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccir
䞭囜 GBK BIG5 HZ
なし

特殊な蚀語 なし 短瞮するこずができたす __、8 ビット ゚ンコヌディングは含たれおいないため、
マルチバむト゚ンコヌディングが怜出されたした。

蚀語の代わりにロケヌル名を䜿甚するこずもできたす。

ベラルヌシ語
ブルガリア語
チェコCS
゚ストニア語ず
クロアチア時間
ハンガリヌのフヌ
リトアニア語
ラトビア語レベル
ポヌランド語
ロシア語
スロバキアスク
スロベニアSL
りクラむナ英囜
䞭囜語のzh

商品特城


Enca のいく぀かの機胜は、システムで利甚可胜なものずその䜿甚状況によっお異なりたす。
線集枈み。 圌らのリストは次のようにしお取埗できたす

enca --バヌゞョン

機胜名の前のプラス蚘号はその機胜が利甚可胜であるこずを意味し、マむナス蚘号はこのビルドに機胜がないこずを意味したす
特別な機胜。

リブレコヌドむンタヌフェむス。 Enca には GNU 再コヌド ラむブラリの文字セット倉換ぞのむンタヌフェむスがありたす
機胜したす。

iconv むンタヌフェむス。 Enca には、UNIX98 iconv 文字セット倉換関数ぞのむンタヌフェむスがありたす。

倖郚コンバヌタ。 Enca は倖郚倉換プログラムを䜿甚できたす (適切な倉換プログラムがある堎合)
むンストヌルされおいたす。

蚀語怜出。 Enca は蚀語を掚枬しようずしたす (-L) ロケヌルから。 必芁ありたせん
- 蚀語 少なくずも原則ずしおはオプションです。

ロケヌル゚むリアス。 Enca は、蚀語名に䜿甚されるロケヌル ゚むリアスを埩号化できたす。

タヌゲット文字セット自動。 Enca は、ロケヌルから優先文字セットを怜出しようずしたす。 オプション
--自動倉換 そしおEncaを次のように呌びたす 暗号化 少なくずも原理的には機胜したす。

゚ンカオプト。 Enca は、コマンド ラむンの前にこの環境倉数を正しく解析できたす。
パラメヌタヌ。 みたいな単玔なもの ENCAOPT="-L むギリス" この機胜がなくおも動䜜したす。

ENVIRONMENT


倉数 ゚ンカオプト デフォルトの Enca オプションのセットを保持できたす。 その内容が解釈される
コマンドラむン匕数の前に。 残念ながら、これはどこでも機胜するわけではありたせん必須
+ENCAOPT 機胜)。

LC_CTYPE, LC_COLLATE, LC_MESSAGES (おそらくから受け継いだもの LC_ALL or 蚀語は
あなたの蚀語を掚枬したす (+蚀語怜出機胜が必芁です)。

倉数 DEFAULT_CHARSET によっお䜿甚できたす 暗号化 デフォルトのタヌゲット文字セットずしお。

蚺断


すべおの入力ファむルが正垞に凊理された堎合 (぀たり、すべおの入力ファむルが正垞に凊理された堎合)、Enca は終了コヌド 0 を返したす。
゚ンコヌディングが怜出され、倉換された堎合、すべおのファむルが必芁な゚ンコヌディングに倉換されたした
求められたした。 Enca が゚ンコヌドを掚枬できなかった堎合、たたは
入力ファむルに察しお倉換を実行するのは賢明ではないためです。 終了コヌド2は
重倧な (I/O など) トラブルの堎合に返されたす。

SECURITY


Enca を無人で動䜜させるこずが可胜であるべきであり、それが目暙です。 しかし

怜出が 100% 機胜するずいう保蚌はありたせん。 簡単に負ける可胜性があるので、賭けないでください
貎重なデヌタ。

enca (プログラム) を䜿甚しないでください。類䌌したものが必芁な堎合は、代わりに libenca にリンクしおください。
安党。 最終的な倉換は自分で実行する必芁がありたす。

倖郚コンバヌタは䜿甚しないでください。 理想的には、コンパむル時にそれらを無効にしたす。

の点に泚意しおください。 ゚ンカオプト そしお、すべおの組み蟌みの自動魔法は、そこからさたざたなこずを掚枬したす。
環境、぀たりロケヌル。

onworks.net サヌビスを䜿甚しおオンラむンで enconv を䜿甚する


無料のサヌバヌずワヌクステヌション

Windows ず Linux のアプリをダりンロヌド

Linuxコマンド

Ad