انجليزيالفرنسيةالإسبانية

Ad


OnWorks فافيكون

إنكا - عبر الإنترنت في السحابة

قم بتشغيل enca في موفر الاستضافة المجاني OnWorks عبر Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

هذا هو الأمر enca الذي يمكن تشغيله في موفر الاستضافة المجاني OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


enca - كشف وتحويل ترميز الملفات النصية

موجز


enca [-L لغة] [OPTION] ... [FILE] ...
enconv [-L لغة] [OPTION] ... [FILE] ...

مقدمة لأي لبس أمثلة


إذا كنت محظوظًا بما فيه الكفاية، فإن الشيئين الوحيدين اللذين ستحتاج إلى معرفتهما هما: الأمر

enca FILE

سيخبرك بملف الترميز FILE الاستخدامات (دون تغييره)، و

enconv FILE

سيتم تحويل الملف FILE إلى الترميز الأصلي للغتك. لتحويل الملف إلى بعض أخرى
الترميز يستخدم -x الخيار (انظر -x دخول في القسم OPTIONS والأقسام تحويلات و
الترميزات لمزيد من التفاصيل).

كلاهما يعمل مع ملفات متعددة والإدخال القياسي (الإخراج) أيضًا. على سبيل المثال

إنكا -x لاتينية2

يضمن أن الملف "sometext" موجود بصيغة ISO Latin 2 عند إرساله إلى الطابعة.

السبب الرئيسي وراء فشل هذه الأوامر وتحويل ملفاتك إلى قمامة هو أن Enca
يحتاج إلى معرفة لغتهم للكشف عن الترميز. يحاول تحديد لغتك
ومجموعة الأحرف المفضلة من الإعدادات المحلية، والتي قد لا تكون ما تريده.

يمكنك (أو يجب عليك) استخدامها -L خيار إخبارها باللغة الصحيحة. لنفترض أنك قمت بتحميل
بعض ملفات HTML الروسية، "file.htm"، تدعي أنها windows-1251 ولكنها ليست كذلك. لذلك تشغيل

enca -L ru file.htm

واكتشف أنه KOI8-R (على سبيل المثال). كن حذرًا، حاليًا لا يوجد الكثير من الدعم
اللغات (انظر القسم LANGUAGES).

هناك تحذير آخر يتعلق بحقيقة وجود العديد من ميزات Enca، وهي تحويل مجموعة الأحرف الخاصة بها
القدرات، تعتمد بشدة على الأدوات الأخرى المثبتة على نظامك (انظر
قسم تحويل)--يركض

إنكا --النسخة

للحصول على قائمة الميزات (انظر القسم المزايا). حاول ايضا

إنكا --مساعدة

للحصول على وصف لجميع خيارات Enca الأخرى (وللعثور على بقية صفحة الدليل هذه
متكرر).

الوصف


تقرأ Enca الملفات النصية المعطاة، أو المدخلات القياسية عندما لا يتم تقديم أي منها، وتستخدم المعرفة
حول لغتهم (يجب أن تدعمها أنت) ومزيج من التحليل الإحصائي
التحليل والتخمين والسحر الأسود لتحديد ترميزاتها، والتي يتم الطباعة عليها بعد ذلك
الإخراج القياسي (أو يعترف بأنه ليس لديه أي فكرة عما يمكن أن يكون عليه التشفير). بواسطة
بشكل افتراضي، تقدم Enca النتائج على شكل أوصاف متعددة الأسطر يمكن قراءتها بواسطة الإنسان، والعديد من الأوصاف الأخرى
التنسيقات متاحة - راجع محددات نوع الإخراج أدناه.

يمكن لـ Enca أيضًا تحويل الملفات إلى بعض الترميزات الأخرى ENC عندما تطلب ذلك - إما باستخدام ملف
محول مدمج، أو بعض مكتبات التحويل، أو عن طريق استدعاء محول خارجي.

الهدف الأساسي لشركة Enca هو أن تكون قابلة للاستخدام دون مراقبة، كأداة تحويل تلقائية
ربما لم نصل إلى هذه النقطة بعد (يرجى مراجعة القسم الأمن).

يرجى ملاحظة أنه باستثناء الحالات النادرة، يتعين على Enca حقًا معرفة لغة ملفات الإدخال التي يجب تقديمها
لك إجابة موثوقة. ومن ناحية أخرى، يمكنه بعد ذلك التعامل بشكل جيد مع الملفات الموجودة
لا نصية بحتة أو حتى الكشف عن مجموعة أحرف من السلاسل النصية داخل بعض الملفات الثنائية؛ ل
بالطبع، ذلك يعتمد على طبيعة المكون غير النصي.

لا تهتم شركة Enca ببنية ملفات الإدخال، بل تنظر إليها كقطعة موحدة
النص/البيانات. في حالة الملفات متعددة الأجزاء (مثل صناديق البريد)، يجب عليك استخدام بعض الأدوات لمعرفة ذلك
هيكل لاستخراج الأجزاء الفردية أولا. إنها تكلفة القدرة على الكشف
ترميزات أي ملفات تالفة أو غير كاملة أو غير صحيحة.

OPTIONS


هناك عدة فئات من الخيارات: خيارات وضع التشغيل، ومحددات نوع الإخراج،
معلمات التخمين ومعلمات التحويل والخيارات العامة والقوائم.

يمكن اختصار جميع الخيارات الطويلة طالما أنها معلمات إلزامية لا لبس فيها
من الخيارات الطويلة إلزامية للخيارات القصيرة أيضا.

عملية وسائط
يتبعون:

-c, --التحويل التلقائي
أي ما يعادل استدعاء Enca باسم enconv.

إذا لم يتم تحديد أي محدد لنوع الإخراج، فاكتشف ترميزات الملفات، وخمن ما تريد
مجموعة الأحرف المفضلة من اللغات، وتحويل الملفات إليها (متوفر فقط مع
+ ميزة الهدف-تشارت-تلقائي).

-g, --خمن
أي ما يعادل استدعاء Enca باسم enca.

إذا لم يتم تحديد أي محدد لنوع المخرجات، فاكتشف ترميزات الملفات وقم بالإبلاغ عنها.

الناتج نوع المحددات
حدد الإجراء الذي ستتخذه Enca عندما تحدد التشفير؛ معظمهم فقط
اختر من بين أسماء وتنسيقات واصطلاحات مختلفة حول كيفية طباعة الترميزات، ولكن
واحد منهم (-x) خاص: فهو يطلب من Enca إعادة ترميز الملفات إلى بعض الترميزات الأخرى ENC.
هذه الخيارات متنافية؛ إذا قمت بتحديد أكثر من محدد نوع الإخراج
الأخير له الأسبقية.

تمثل العديد من أنواع المخرجات اسم مجموعة الأحرف المستخدمة بواسطة بعض البرامج الأخرى، ولكن ليس جميعها
تعرف البرامج جميع مجموعات الأحرف التي تتعرف عليها Enca. كن حذرًا، إنكا لا يحدث فرقًا
بين مجموعة محارف غير معروفة ومجموعة محارف ليس لها اسم في مساحة الاسم المحددة في مثل هذه الحالة
مواقف.

-d, --تفاصيل
كان يستخدم لطباعة بضع صفحات من التفاصيل حول عملية التخمين، ولكن منذ Enca
هو مجرد برنامج مرتبط بمكتبة Enca، هذا غير ممكن وهذا الخيار
يعادل تقريبًا --انسان قارئ، باستثناء أنه يُبلغ عن سبب الفشل عندما
لا تتعرف Enca على الترميز.

-e, --enca-name
يطبع اسم Enca الجميل لمجموعة الأحرف، أي ربما الأكثر قبولًا بشكل عام
ومعرف مجموعة أحرف يمكن قراءته بشكل أو بآخر، مع إلحاق الأسطح.

يُستخدم هذا الاسم عند استدعاء محول خارجي أيضًا.

-f, --انسان قارئ
يطبع وصفًا لفظيًا للأحرف والأسطح المكتشفة - وهو شيء بشري
يفهم بشكل أفضل. هذا هو السلوك الافتراضي.

التنسيق الدقيق هو التالي: يحتوي السطر الأول على اسم مجموعة الأحرف فقط، و
ويتبعه صفر أو أكثر من الخطوط ذات المسافة البادئة التي تحتوي على أسماء الأسطح المكتشفة.
ومع ذلك، فإن هذا التنسيق ليس مناسبًا أو مخصصًا لمزيد من المعالجة الآلية،
وأوصاف الأحرف اللفظية ترغب في التغيير في المستقبل.

-i, --iconv-name
يطبع كيف iconv(3) (و/أو iconv(1)) يستدعي مجموعة الأحرف المكتشفة. أكثر دقة،
يقوم بطباعة اسم مستعار واحد، تم اختياره بشكل تعسفي إلى حد ما، ومقبول بواسطة Iconv. مجموعة محارف
غير معروف بالنسبة إلى Iconv يعتبر غير معروف.

يكون نوع الإخراج هذا منطقيًا فقط عندما يتم تجميع Enca بدعم Iconv (feature
+ واجهة أيقونة).

-r, --rfc1345-اسم
يطبع اسم مجموعة الأحرف RFC 1345. عندما لا يكون هذا الاسم موجودًا بسبب RFC 1345
لا يحدد ترميزًا معينًا، أو يتم تعريف بعض الأسماء الأخرى في بعض RFC الأخرى أو فقط
تتم طباعة الاسم الذي يعتبره المؤلف "الأكثر قانونية".

نظرًا لأن RFC 1345 لا يحدد الأسطح، فلا يتم إلحاق أي معلومات عن السطح.

-m, --اسم التمثيل الصامت
طباعة اسم MIME المفضل لمجموعة الأحرف المكتشفة. هذا هو الاسم الذي يجب عليك
يُستخدم عادةً عند إصلاح رسائل البريد الإلكتروني أو صفحات الويب.

مجموعة محارف غير موجودة في http://www.iana.org/assignments/character-sets يحسب على أنه
غير معروف.

-s, --cstocs-name
يطبع كيف com.cstocs(1) يستدعي مجموعة الأحرف المكتشفة. مجموعة محارف غير معروفة لـ cstocs
يعتبر غير معروف.

-n, - الاسم =WORD
طباعة اسم مجموعة الأحرف (الترميز) المحدد بواسطة WORD (يمكن اختصارها طالما أنها
خالية من الغموض). بالنسبة للأسماء المذكورة أعلاه - الاسم =WORD ما يعادل --WORD.

باستخدام اسماء مستعارة لأن نوع الإخراج يتسبب في قيام Enca بطباعة قائمة بجميع الأسماء المستعارة المقبولة
من مجموعة الأحرف المكتشفة.

-x, --تحويل إلى =[..]ENC
تحويل الملف إلى ترميز ENC.

ليس للعلامة الاختيارية `..' قبل تشفير الاسم أي معنى خاص، إلا أنه يمكنك استخدامها
لتذكير نفسك أنه، على عكس في إعادة رمز(١) يجب أن تحدد مطلوب
الترميز بدلا من الحالي.

يمكنك استخدام إعادة رمز(1) إعادة ترميز السلاسل أو أي نوع آخر من إعادة الترميز المتوقف عن التفكير
مواصفات ENC، بشرط أن تطلب من Enca استخدام بعض أدوات الفهم
للتحويل (انظر القسم تحويلات).

عندما تفشل Enca في تحديد التشفير، فإنها تطبع تحذيرًا وتترك الملف
الملف كما هو؛ عندما يتم تشغيله كمرشح فإنه يحاول بذل قصارى جهده لنسخ المعيار
الإدخال إلى الإخراج القياسي دون تغيير. ومع ذلك، لا ينبغي الاعتماد عليه والقيام به
دعم.

التخمين المعلمات
هناك واحد فقط: -L تحديد لغة ملفات الإدخال. هذا الخيار إلزامي (ولكن انظر
أدناه).

-L, - اللغة =لانج
يضبط لغة ملفات الإدخال على لانج.

أكثر دقة، لانج يمكن أن يكون أي اسم لغة صالح (أو اسم مستعار باستخدام +locale-alias
ميزة) لبعض اللغات المدعومة. يمكنك أيضًا تحديد "لا شيء" كاسم لغة،
يتم التعرف على الترميزات متعددة البايت فقط بعد ذلك. يجري

إنكا - قائمة اللغات

للحصول على قائمة اللغات المدعومة. عندما لا تحدد أي لغة تحاول Enca
لتخمين لغتك من الإعدادات المحلية ويفترض أن ملفات الإدخال تستخدم هذا
لغة. انظر القسم LANGUAGES للتفاصيل.

تحويل المعلمات
يمنحك تحكمًا أفضل في كيفية إجراء تحويل مجموعة الأحرف. لا يؤثرون
أي شيء عندما -x لم يتم تحديده كنوع الإخراج. يرجى الاطلاع على القسم تحويلات ل
تفاصيل تحويل دموية.

-C, --محاولة المحولات =قائمة
يُلحق مفصولة بفواصل قائمة إلى قائمة المحولات التي سيتم تجربتها عند
اطلب التحويل. يمكن اختصار أسمائهم طالما أنهم كذلك
خالية من الغموض. يجري

إنكا --قائمة المحولات

للحصول على قائمة بجميع أسماء المحولات الصالحة (راجع القسم تحويلات لمن
وصف).

تعتمد القائمة الافتراضية على كيفية تجميع Enca وتشغيله

إنكا --مساعدة

لمعرفة قائمة المحولات الافتراضية.

لاحظ أن القائمة الافتراضية تُستخدم فقط عندما لا تحددها -C على الاطلاق. خلاف ذلك،
تم بناء القائمة كما لو كانت فارغة في البداية وكل -C يضيف محول (محولات) جديدة
إليها. علاوة على ذلك، تحديد لا شيء لأن اسم المحول يؤدي إلى مسح المحول
قائمة.

-E, --external-converter-program=PATH
يضبط اسم برنامج المحول الخارجي على PATH. يعتمد المحول الخارجي الافتراضي
حول كيفية الالتزام بـ enca، وإمكانية استخدام محولات خارجية
لا تكون متاحة على الإطلاق. يجري

إنكا --مساعدة

لمعرفة برنامج المحول الافتراضي في بناء enca الخاص بك.

العلاجات العامة الخيارات
لا تتناسب مع فئات الخيارات الأخرى ...

-p, - مع اسم ملف
يفرض على Enca بادئة كل نتيجة باسم الملف المقابل. بشكل افتراضي، إنكا
تنتج البادئات بأسماء الملفات عند تشغيلها على ملفات متعددة.

تتم طباعة الإدخال القياسي كما ستدين والإخراج القياسي كما STDOUT (الأخير يمكن أن يكون
ربما تظهر في رسائل الخطأ فقط).

-P, --لا يوجد اسم ملف
يفرض على Enca عدم بادئة النتائج بأسماء الملفات. بشكل افتراضي، لا تستخدم Enca البادئة
ينتج عن ذلك اسم الملف عند تشغيله على ملف واحد (بما في ذلك الإدخال القياسي).

-V, - الإسراف
يزيد من مستوى اللفظ (كل استخدام يزيده بمقدار واحد).

حاليًا هذا الخيار ليس مفيدًا جدًا لأن أجزاء مختلفة من Enca تستجيب
بشكل مختلف لنفس مستوى الإسهاب، وفي الغالب لا على الإطلاق.

مصانع
كلها طرفية، أي عندما تواجه شركة Enca بعضًا منها فإنها تقوم بطباعة القائمة المطلوبة
وينتهي دون معالجة أي من الخيارات التالية.

-h, --مساعدة
يطبع تعليمات الاستخدام الموجزة.

-G, --رخصة
طباعة ترخيص Enca الكامل (من خلال جهاز النداء، إن أمكن).

-l, - قائمة =WORD
قائمة المطبوعات المحددة بواسطة WORD (يمكن اختصارها طالما أنها لا لبس فيها).
القوائم المتاحة تشمل:

مجموعات الأحرف المضمنة. جميع الترميزات قابلة للتحويل عن طريق المحول المدمج، حسب المجموعة (كلاهما
يجب أن يكون ترميز الإدخال والإخراج من هذه القائمة وينتمي إلى نفس المجموعة
التحويل الداخلي).

الترميزات المضمنة. أي ما يعادل مجموعات الأحرف المضمنة، لكنها تعتبر عفا عليها الزمن؛ سوف
يتم قبوله مع تحذير لفترة من الوقت.

المحولات. كافة أسماء المحولات الصالحة (لاستخدامها مع -C).

مجموعات الأحرف. جميع الترميزات (مجموعات الأحرف). يمكنك تحديد الأسماء التي سيتم طباعتها
مع --اسم أو أي محدد لنوع إخراج الاسم (بالطبع، فقط الترميزات التي تحتوي على ملحق
ستتم طباعة الاسم الموجود في مساحة الاسم المحددة بعد ذلك)، يجب تحديد المحدد
قبل --قائمة.

ترميزات. أي ما يعادل مجموعات الأحرف، لكنها تعتبر عفا عليها الزمن؛ سيتم قبول مع
تحذير لفترة من الوقت.

اللغات. جميع اللغات المدعومة مع مجموعات الأحرف التابعة لها. ملحوظة
يحدد نوع الإخراج نمط اسم اللغة، وليس نمط اسم مجموعة الأحرف هنا.

أسماء. جميع القيم الممكنة ل --اسم الخيار.

القوائم. جميع القيم الممكنة لهذا الخيار. (مجنون؟)

السطوح. جميع الأسطح التي تتعرف عليها شركة Enca.

-v, --الإصدار
طباعة إصدار البرنامج وقائمة الميزات (انظر القسم المزايا).

تحويلات


على الرغم من أن Enca قد تم تصميمه في الأصل كأداة لتخمين التشفير فقط، فقد أصبح الآن كذلك
يتميز بعدة طرق لتحويل مجموعة الأحرف. يمكنك التحكم في أي منهم سيكون
يستعمل مع -C.

تحاول Enca المحولات من القائمة المحددة بواسطة تسلسليًا -C حتى يجد بعض ذلك
قادر على إجراء التحويل المطلوب أو حتى يستنفد القائمة. يجب عليك تحديد
المحولات المفضلة أولاً، والأقل تفضيلاً لاحقًا. محول خارجي (خارجي) يجب ان يكون
يتم تحديده دائمًا كحل أخير، فقط كملاذ أخير، نظرًا لأنه عادةً لا يكون من الممكن استرداده
عندما تفشل. تبدأ القائمة الافتراضية للمحولات دائمًا بـ مدمج وثم
يستمر مع أول واحد متاح من: librecode, iconv، لا شئ.

تجدر الإشارة إلى أنه عندما تقول شركة Enca إنها غير قادرة على إجراء التحويل الذي يعنيه ذلك فقط
لا أحد من المحولات قادر على القيام بذلك. لا يزال من الممكن تنفيذ
التحويل المطلوب في عدة خطوات، باستخدام العديد من المحولات، ولكن لمعرفة كيفية القيام بذلك،
ربما تكون هناك حاجة إلى الذكاء البشري.

مدمج محول
هو الأبسط والأسرع على الإطلاق، ويمكنه تنفيذ عدد قليل فقط من البايتات
تحويلات وتعديل الملفات مباشرة في مكانها (قد تعتبر خطيرة، ولكنها كذلك
فعالة جدًا). يمكنك الحصول على قائمة بجميع الترميزات التي يمكنه التحويل بها

enca --list مدمجة

بجانب السرعة، ميزتها الرئيسية (وأيضًا عيوبها) هي أنها لا تهتم: فهي كذلك
ببساطة يحول الأحرف التي لها تمثيل في ترميز الهدف، ولا يلمس
أي شيء آخر ولا يطبع أي رسالة خطأ أبدًا.

يمكن تحديد هذا المحول كـ مدمج مع -C.

الكود الحر محول
هي واجهة لمكتبة إعادة ترميز GNU، والتي تقوم بمهمة إعادة الترميز الفعلية. قد يكون أو قد
لا يتم تجميعها في؛ يجري

إنكا --النسخة

لمعرفة مدى توفره في إصدار enca الخاص بك (الميزة + واجهة librecode).

يجب أن تكون على دراية إعادة رمز(1) قبل استخدامه، نظرًا لأن إعادة الترميز أمر جيد جدًا
أداة تحويل متطورة وقوية. قد تواجه مشاكل في استخدامه
مع Enca بشكل خاص لأن دعم Enca للأسطح غير متوافق بنسبة 100%،
لأن عملية إعادة الترميز تحاول جاهدة جعل التحويل قابلاً للعكس، لأنه في بعض الأحيان
يتجاهل بصمت أخطاء الإدخال/الإخراج، ولأنه عربات التي تجرها الدواب بشكل لا يصدق. من فضلك راجع إعادة ترميز جنو
صفحات المعلومات للحصول على تفاصيل حول مكتبة إعادة الترميز.

يمكن تحديد هذا المحول كـ librecode مع -C.

يكونف محول
هي واجهة لنظام UNIX98 iconv(3) وظائف التحويل، التي تقوم بالتسجيل الفعلي
وظيفة. قد يتم تجميعها أو لا يتم تجميعها في؛ يجري

إنكا --النسخة

لمعرفة مدى توفره في إصدار enca الخاص بك (الميزة +iconv-interface).

على الرغم من أن Iconv موجود في معظم الأنظمة الحالية، إلا أنه نادرًا ما يقدم مجموعة مفيدة من الملفات
التحويلات المتاحة، والاستثناء الوحيد الملحوظ هو Iconv من GNU libc. إنها
عادة ما تكون انتقائيًا تمامًا فيما يتعلق بالأسطح أيضًا (بينما لا تقوم في نفس الوقت بتنفيذ surface
تحويل). ومع ذلك، فمن المحتمل أنها تمثل الأداة القياسية (المخصصة) الوحيدة القادرة على الأداء
التحويل من/إلى Unicode. يرجى الاطلاع على وثائق Iconv للحصول على تفاصيل حولها
القدرات على نظامك الخاص.

يمكن تحديد هذا المحول كـ iconv مع -C.

خارجي محول
هي أداة تحويل خارجية تعسفية يمكن تحديدها باستخدام -E الخيار (واحد على الأكثر
يمكن تعريفها في وقت واحد). هناك بعض المعايير المقدمة مع enca:
com.cstocs, إعادة رمز, رسم خريطة, Umapو piconv. كلها نصوص مجمعة: for com.cstocs(1) إعادة رمز(1)
رسم خريطة(1) Umap(1)، و piconv(1).

يرجى ملاحظة أن enca ليس لديها سوى القليل من التحكم في ما يفعله المحول الخارجي بالفعل. إذا قمت بتعيين
إلى / بن / جمهورية مقدونيا أنت مسؤول مسؤولية كاملة عن العواقب.

إذا كنت ترغب في إنشاء محول خاص بك لاستخدامه مع enca، فيجب أن تعلم أن هذا هو الحال دائمًا
تسمى

محول ENC_CURRENT ENC FILE [-]

أين محول هو ما تم تعيينه من قبل -E, ENC_CURRENT تم الكشف عن الترميز، ENC هو ما
تم تحديده مع -xو FILE هو الملف المطلوب تحويله، أي أنه يسمى لكل منهما
ملف منفصل. المعلمة الرابعة الاختيارية -، يجب أن يتسبب في الإرسال (عند وجوده).
نتيجة التحويل إلى الإخراج القياسي بدلاً من الكتابة فوق الملف FILE.
يجب أن يحرص المحول أيضًا على عدم تغيير أذونات الملف، وإرجاع رمز الخطأ 1
عند فشله وتنظيف ملفاته المؤقتة. يرجى الاطلاع على المعيار الخارجي
المحولات على سبيل المثال.

يمكن تحديد هذا المحول كـ خارجي مع -C.

الترتيب الهدف محارف
الطريقة المباشرة لتحديد مجموعة الأحرف المستهدفة هي -x الخيار الذي يتجاوز أي
الإعدادات الافتراضية. عندما يتم استدعاء Enca باسم enconv، يتم تحديد مجموعة الأحرف الافتراضية المستهدفة بالضبط
بنفس الطريقة مثل إعادة رمز(١) يفعل.

إذا كان DEFAULT_CHARSET تم تعيين متغير البيئة، ويتم استخدامه كمجموعة أحرف الهدف.

خلاف ذلك، إذا كان النظام يوفر nl_langinfo(3) الوظيفة، اللغة المحلية الحالية
يتم استخدام مجموعة الأحرف كمجموعة الأحرف الهدف.

عندما تفشل كلتا الطريقتين، تشتكي شركة Enca وتنهي عملها.

مقلوبية ملاحظات
إذا كانت إمكانية الرجوع أمرًا بالغ الأهمية بالنسبة لك، فلا يجب عليك استخدام enca كمحول على الإطلاق (أو ربما
يمكنك، مع تصميم خاص للغاية إعادة رمز(١) الغلاف). خلاف ذلك يجب عليك في
على الأقل يعلم أن هناك أربع وسائل أساسية للتعامل مع كيانات الأحرف غير القابلة للتحويل:

فشل--هذا احتمال أيضًا، وبالمناسبة، هذا هو بالضبط ما هو GNU libc الحالي
تنفيذ Iconv يفعل (يمكن أيضًا أن يُطلب من إعادة الترميز القيام بذلك)

لا تلمسها - هذا ما يفعله المحول الداخلي enca دائمًا ويمكن أن يفعله إعادة الترميز؛
على الرغم من أنه لا يمكن عكسه، إلا أن الإنسان عادةً ما يكون قادرًا على إعادة بناء الأصل (في
الأقل من حيث المبدأ)

تقريبها - هذا ما يمكن لـ cstocs فعله، وإعادة ترميزه أيضًا، وإن كان بشكل مختلف؛ و ال
الخيار الأفضل إذا كنت تريد فقط جعل النص الملعون قابلاً للقراءة

قم بإسقاطها - وهذا ما يمكن أن يفعله كل من recode وcstocs (يمكن لـ cstocs أيضًا استبدالهما
الأحرف بواسطة بعض الأحرف الثابتة بدلاً من مجرد التجاهل)؛ مفيدة عندما
تحتوي الأحرف التي سيتم حذفها على ضجيج فقط.

يرجى الرجوع إلى دليل المحول المفضل لديك للحصول على تفاصيل حول هذه المشكلة. عموما إذا
أنت لست محظوظًا بما يكفي للحصول على جميع الأحرف القابلة للتحويل في ملفك يدويًا
التدخل مطلوب على أي حال.

الأداء ملاحظات
كان الأداء الضعيف للمحولات المتاحة أحد الأسباب الرئيسية لإدراجها
محول مدمج في enca. حاول استخدامه كلما أمكن ذلك، أي عند وجود الملفات
تعتبر مجموعة الأحرف نظيفة بما فيه الكفاية أو مجموعة الأحرف فوضوية بدرجة كافية بحيث تكون صفرًا مدمجًا
الذكاء لا يهم. لا يتطلب مساحة إضافية على القرص ولا ذاكرة إضافية ويمكنه ذلك
يتفوق على إعادة رمز(1) أكثر من 10 مرات على الملفات الكبيرة وإصدار Perl (أي كلما كان أسرع
واحد من com.cstocs(1) أكثر من 400 مرة على الملفات الصغيرة (في الواقع، إنها تقريبًا بنفس سرعة
cp(1)).

حاول تجنب المحولات الخارجية عندما لا يكون ذلك ضروريًا تمامًا نظرًا لكل التفرع
ونقل الأشياء بطيء بشكل لا يصدق.

الترميزات


يمكنك الحصول على قائمة بمجموعات الأحرف المعترف بها باستخدام

إنكا - قائمة مجموعات الأحرف

وباستخدام --اسم المعلمة يمكنك تحديد أي اسم تريد استخدامه في القائمة.
يمكنك أيضًا إدراج جميع الأسطح التي بها

إنكا --قائمة الأسطح

تعتبر أسماء الترميز والأسطح غير حساسة لحالة الأحرف، كما أن الأحرف غير الأبجدية الرقمية ليست كذلك
مأخوذ فى الإعتبار. ومع ذلك، في الغالب لا يُسمح باستخدام الأحرف غير الأبجدية الرقمية على الإطلاق.
العناصر الوحيدة المسموح بها هي: `-'، `_'، `.'، `:'، و`/' (كفاصل أحرف/سطح). لذا
"ibm852" و"IBM-852" هما نفس الشيء، في حين أن "IBM 852" غير مقبول.

مجموعات الأحرف
تستخدم القائمة التالية لمجموعات الأحرف المعترف بها أسماء Enca (-e) والأوصاف اللفظية كما
ذكرت من قبل إنكا (-f):

أحرف ASCII 7 بت ASCII
معيار ISO-8859-2 ISO 8859-2؛ آيزو لاتيني 2
معيار ISO-8859-4 ISO 8859-4؛ اللاتينية 4
معيار ISO-8859-5 ISO 8859-5؛ ايزو السيريلية
ISO-8859-13 معيار ISO 8859-13؛ ايزو البلطيق. اللاتينية 7
معيار ISO-8859-16 ISO 8859-16
CP1125 صفحة رموز MS-Windows 1125
CP1250 صفحة رموز MS-Windows 1250
CP1251 صفحة رموز MS-Windows 1251
CP1257 صفحة رموز MS-Windows 1257؛ WinBaltRim
IBM852 صفحة رموز IBM/MS 852؛ الكمبيوتر (DOS) اللاتينية 2
IBM855 صفحة الرموز IBM/MS 855
IBM775 صفحة الرموز IBM/MS 775
IBM866 صفحة الرموز IBM/MS 866
البلطيق ISO-IR-179 ؛ البلطيق
ترميز KEYBCS2 Kamenicky؛ KEYBCS2
Macce ماكنتوش أوروبا الوسطى

ماكير ماكنتوش السيريلية
ECMA-113 إكما السيريلية؛ إكما-113
كود KOI-8_CS_2 رمز KOI8-CS2 ('T602')
KOI8-R KOI8-R السيريلية
KOI8-U KOI8-U السيريلية
KOI8-UNI KOI8-السيريلية الموحدة
تسلسلات التحكم TeX (La)TeX
UCS-2 مجموعة أحرف عالمية 2 بايت؛ يو سي إس-2؛ بي إم بي
UCS-4 مجموعة أحرف عالمية 4 بايت؛ يو سي إس-4؛ ايزو-10646
UTF-7 تنسيق التحويل العالمي 7 بت؛ UTF-7
UTF-8 تنسيق التحويل العالمي 8 بت؛ UTF-8
ترميز الفلين؛ T1
GBK المعيار الوطني الصيني المبسط؛ GB2312
BIG5 المعيار الصناعي الصيني التقليدي؛ 5 كبيرة
هرتز هرتز مشفر GB2312
ترميز غير معروف

أين غير معروف ليس أي ترميز حقيقي، يتم الإبلاغ عنه عندما لا تكون Enca قادرة على تقديم ملف
إجابة موثوقة.

السطوح
لدى Enca بعض الدعم التجريبي لما يسمى بالأسطح (انظر أدناه). يكتشف
الأسطح التالية (لا يمكن تطبيقها كلها على جميع مجموعات الأحرف):

/CR نهايات خط CR
/ LF LF خط الإنهاء
/ CRLF CRLF إنهاء الخط
NA نهايات الخط المختلط
غير متوافر محاط/مختلط ببيانات غير نصية
/21 ترتيب البايت معكوس في أزواج (1,2 -> 2,1)
/4321 ترتيب البايت معكوس إلى أربعة أضعاف (1,2,3,4 -> 4,3,2,1)
غير متوافر: القطع النهائية الصغيرة والكبيرة متسلسلة
/qp مقتبس للطباعة المشفرة

لاحظ أن بعض الأسطح تحتوي على NA بدلاً من المعرف - ولا يمكن تحديدها عند الأمر
الخط، لا يمكن الإبلاغ عنها إلا بواسطة Enca. وهذا مقصود لأنهم يعلمونك فقط
لماذا لا يمكن اعتبار الملف متسقًا مع السطح بدلاً من تمثيله حقيقيًا
سطح - المظهر الخارجي.

كل مجموعة محارف لها سطحها الطبيعي (يُسمى "ضمنيًا" في إعادة الترميز) والذي لم يتم الإبلاغ عنه،
على سبيل المثال، بالنسبة لمجموعة أحرف IBM 852، فهي عبارة عن "أجهزة إنهاء سطر CRLF". بالنسبة لترميزات UCS، فإن endian الكبير هو
يعتبر سطحا طبيعيا. يتم إنشاء أوامر البايت غير العادية من 21 و4321
التباديل: تم الإبلاغ عن 2143 ببساطة كـ 21، بينما تم الإبلاغ عن 3412 كمجموعة من 4321
و 21

UTF-8 المشفر بشكل مزدوج ليس عبارة عن مجموعة محارف ولا سطحية، لقد تم الإبلاغ عنه للتو.

من نحن محارف, ترميزات و السطوح
مجموعة الأحرف عبارة عن مجموعة من كيانات الأحرف بينما يكون الترميز هو تمثيلها في المصطلحات
من البايتات والبتات. في إنكا، الكلمة ترميز يعني نفس "تمثيل النص"،
أي العلاقة بين تسلسل الكيانات الشخصية التي تشكل النص و
تسلسل البايتات (البتات) التي تشكل الملف.

لذا، فإن التشفير عبارة عن مجموعة أحرف وما يسمى بالسطح (إنهاء السطر، ترتيب البايت،
الجمع، تحويل Base64، وما إلى ذلك). ومع ذلك، فإنه يثبت أنه مناسب للعمل معه
بعض أزواج {charset,surface} كما هو الحال مع مجموعات الأحرف الأصلية. هكذا، كما في إعادة رمز(1)، جميع UCS- و
تسمى ترميزات UTF لمجموعة الأحرف العالمية مجموعات الأحرف. يرجى الاطلاع على إعادة ترميز
وثائق لمزيد من التفاصيل حول هذه المشكلة.

الشيء الجيد الوحيد فيما يتعلق بالأسطح هو: عندما لا تبدأ باللعب بها أيضًا
لن تبدأ شركة Enca وستحاول التصرف قدر الإمكان كسطح غير مدرك
البرنامج، حتى عند التحدث لإعادة ترميز.

LANGUAGES


تحتاج شركة Enca إلى معرفة لغة ملفات الإدخال حتى تعمل بشكل موثوق، على الأقل في حالة حدوث ذلك
ترميز 8 بت عادي. يجب التعرف على الترميزات متعددة البايت لأي لغة لاتينية أو سيريلية
أو اللغة اليونانية.

يمكنك (أو يجب عليك) استخدامها -L خيار إخبار Enca باللغة. منذ الناس في أغلب الأحيان
العمل مع الملفات بنفس اللغة التي تم تكوين اللغات لها، تحاول Enca
يحاول تخمين اللغة من خلال فحص قيمة LC_CTYPE والفئات المحلية الأخرى
(لطفا أنظر محلي(7)) واستخدامها للغة عندما لا تحدد أيًا منها. ل
بالطبع، قد يكون الأمر خاطئًا تمامًا وسيعطيك إجابات غير منطقية ويلحق الضرر بك
الملفات، لذا من فضلك لا تنسى استخدام -L خيار. تستطيع ايضا استخذام إنكاوبت بيئة
متغير لتعيين لغة افتراضية (انظر القسم البيئة).

اللغات التالية مدعومة من قبل Enca (يتم إدراج كل لغة مع اللغات المدعومة
ترميزات 8 بت).

البيلاروسية CP1251 IBM866 ISO-8859-5 KOI8-UNI maccyr IBM855
البلغارية CP1251 ISO-8859-5 IBM855 maccyr ECMA-113
التشيكية ISO-8859-2 CP1250 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
الإستونية ISO-8859-4 CP1257 IBM775 ISO-8859-13 macce البلطيق
الكرواتية CP1250 ISO-8859-2 IBM852 macce CORK
المجرية ISO-8859-2 CP1250 IBM852 macce CORK
الليتوانية CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce البلطيق
لاتفيا CP1257 ISO-8859-4 IBM775 ISO-8859-13 macce البلطيق
البولندية ISO-8859-2 CP1250 IBM852 macce ISO-8859-13 ISO-8859-16 الفلين البلطيقي
الروسية KOI8-R CP1251 ISO-8859-5 IBM866 ماكير
السلوفاكية CP1250 ISO-8859-2 IBM852 KEYBCS2 macce KOI-8_CS_2 CORK
السلوفينية ISO-8859-2 CP1250 IBM852 macce CORK
الأوكرانية CP1251 IBM855 ISO-8859-5 CP1125 KOI8-U maccyr
الصينية GBK BIG5 هرتز
لا شيء

اللغة الخاصة لا شيء يمكن تقصيرها إلى __، فهو لا يحتوي على ترميزات 8 بت، لذلك فقط
تم الكشف عن ترميزات متعددة البايت.

يمكنك أيضًا استخدام الأسماء المحلية بدلاً من اللغات:

البيلاروسية تكون
البلغارية ب
التشيكية CS
الإستونية وآخرون
ساعة كرواتية
المجري هو
الليتواني الملازم
لاتفيا المستوى
البولندية رر
رو الروسية
السلوفاكية كورونا
السلوفينية س
المملكة المتحدة الأوكرانية
الصينية ز

المزايا


تعتمد العديد من ميزات Enca على ما هو متاح في نظامك وكيف كان
تجميع وانتاج. يمكنك الحصول على قائمتهم مع

إنكا --النسخة

علامة الزائد قبل اسم الميزة تعني أنها متاحة، وعلامة الطرح تعني أن هذا الإصدار غير موجود
الميزة الخاصة.

واجهة librecode. لدى Enca واجهة لتحويل مجموعة أحرف مكتبة GNU
الوظائف.

iconv-interface. لدى Enca واجهة لوظائف تحويل مجموعة الأحرف UNIX98 Iconv.

محول خارجي. يمكن لشركة Enca استخدام برامج التحويل الخارجية (إذا كان لديك بعض البرامج المناسبة
المثبتة).

كشف اللغة. تحاول إنكا تخمين اللغة (-L) من المناطق. لا تحتاج إلى
--لغة الخيار، على الأقل من حيث المبدأ.

الاسم المستعار المحلي. Enca قادر على فك تشفير الأسماء المستعارة المحلية المستخدمة لأسماء اللغات.

الهدف-تشارت-تلقائي. تحاول Enca اكتشاف مجموعة الأحرف المفضلة لديك من اللغات. خيار
--التحويل التلقائي واستدعاء إنكا كـ enconv يعمل، على الأقل من حيث المبدأ.

إنكاوبت. إنكا قادرة على تحليل متغير البيئة هذا بشكل صحيح قبل سطر الأوامر
حدود. أشياء بسيطة مثل إنكاوبت = "-L المملكة المتحدة" سوف تعمل حتى من دون هذه الميزة.

البيئة


المتغير إنكاوبت يمكنه الاحتفاظ بمجموعة من خيارات Enca الافتراضية. يتم تفسير محتواه
قبل وسيطات سطر الأوامر. لسوء الحظ، هذا لا يعمل في كل مكان (يجب أن يكون لديك
+ ميزة إنكوبت).

LC_CTYPE, LC_COLLATE, رسائل LC (ربما ورثت من LC_ALL or لانج) يستخدم في
تخمين لغتك (يجب أن يكون لديك + ميزة اكتشاف اللغة).

المتغير DEFAULT_CHARSET يمكن استخدامها بواسطة enconv باعتبارها مجموعة الأحرف الهدف الافتراضية.

DIAGNOSTICS


تقوم Enca بإرجاع رمز الخروج 0 عند متابعة جميع ملفات الإدخال بنجاح (أي جميع ملفات الإدخال
تم الكشف عن الترميزات وتم تحويل جميع الملفات إلى الترميز المطلوب، في حالة التحويل
لقد سئل). يتم إرجاع رمز الخروج 1 عندما لا تتمكن Enca من تخمين التشفير أو
قم بإجراء التحويل على أي ملف إدخال لأنه ليس ذكيًا بدرجة كافية. رمز الخروج 2 هو
تم إرجاعها في حالة حدوث مشكلات خطيرة (مثل الإدخال/الإخراج).

الأمن


ينبغي أن يكون من الممكن ترك شركة Enca تعمل دون مراقبة، فهذا هو هدفها. لكن:

ليس هناك ضمان أن الكشف يعمل بنسبة 100%. لا تراهن عليه، فمن الممكن أن تخسره بسهولة
بيانات قيمة.

لا تستخدم enca (البرنامج)، قم بالارتباط بـ libenca بدلاً من ذلك إذا كنت تريد أي شيء مشابه
حماية. يجب عليك إجراء التحويل النهائي بنفسك بعد ذلك.

لا تستخدم المحولات الخارجية. من الناحية المثالية، قم بتعطيل وقت الترجمة لهم.

يكون على بينة من إنكاوبت وجميع التخمينات التلقائية المدمجة في الأشياء المختلفة
البيئة، أي المناطق.

استخدم enca عبر الإنترنت باستخدام خدمات onworks.net


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

  • 1
    itop - المصدر المفتوح ITSM CMDB
    itop - المصدر المفتوح ITSM CMDB
    بوابة عمليات تكنولوجيا المعلومات: مفتوحة بالكامل
    المصدر ، ITIL ، الخدمة المستندة إلى الويب
    بما في ذلك أداة إدارة بشكل كامل
    CMDB قابل للتخصيص ونظام مكتب المساعدة و
    رجل وثيقة ...
    قم بتنزيل itop - ITSM CMDB OpenSource
  • 2
    كليمنتين
    كليمنتين
    كليمنتين هي موسيقى متعددة المنصات
    مشغل ومنظم مكتبة مستوحى من
    أمروك 1.4 لديها سريع و
    واجهة سهلة الاستخدام ، وتتيح لك
    البحث و ...
    تحميل كليمنتين
  • 3
    XISMuS
    XISMuS
    تنبيه: التحديث التراكمي 2.4.3 له
    أطلق سراحه !! التحديث يعمل لأي
    الإصدار 2.xx السابق. في حالة الترقية
    من الإصدار v1.xx ، يرجى التنزيل و
    ط ...
    تنزيل XISMuS
  • 4
    الوجه
    الوجه
    برنامج تتبع الرأس المعياري أن
    يدعم العديد من أدوات تتبع الوجوه والمرشحات
    وبروتوكولات اللعبة. بين المتعقبين
    هم SM FaceAPI ، رئيس AIC بالقصور الذاتي
    تعقب ...
    تنزيل facetracknoir
  • 5
    كود PHP QR
    كود PHP QR
    PHP QR Code مفتوح المصدر (LGPL)
    مكتبة لتوليد رمز الاستجابة السريعة ،
    الباركود ثنائي الأبعاد. مرتكز على
    مكتبة libqrencode C ، توفر API لـ
    إنشاء شريط رمز الاستجابة السريعة ...
    تنزيل PHP QR Code
  • 6
    مجاني
    مجاني
    Freeciv هو حر قائم على الدور
    لعبة استراتيجية متعددة اللاعبين ، وفي كل منها
    يصبح اللاعب قائدًا لـ
    الحضارة تقاتل من أجل الحصول على
    الهدف النهائي: أن تصبح ...
    تنزيل Freeciv
  • أكثر "

أوامر لينكس

Ad