عربيالفرنسيةالإسبانية

Ad


OnWorks فافيكون

html2text - عبر الإنترنت في السحابة

قم بتشغيل html2text في مزود الاستضافة المجاني OnWorks عبر Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

هذا هو الأمر html2text الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة على الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


html2text - محول متقدم من HTML إلى نص

موجز


html2text -مساعدة
html2text -الإصدار
html2text [ غير متفرغ | -التحقق من ] [ الماسح الضوئي ] [ -debug-parser ] [ -rcfile مسار ] [
على غرار ( اتفاق | جميل )] [ -عرض عرض ] [ -o ملف إلاخراج ] [ -العقاب ] [ -اسكي |
-utf8 ] [ -وميتا ] [ ملف الإدخال ...]

الوصف


html2text يقرأ مستندات HTML من ملف ملف الإدخالs ، تنسيقات كل منها في دفق من
أحرف النص العادي ، ويكتب النتيجة إلى الإخراج القياسي (أو إلى ملف إلاخراج، إذا
ال -o يتم استخدام خيار سطر الأوامر).

إذا كانت الإجابة بلا ملف الإدخالs محددة في سطر الأوامر ، html2text يقرأ من المدخلات القياسية.
شرطة مثل ملف الإدخال هي طريقة بديلة لتحديد المدخلات القياسية.

html2text يفهم جميع بنيات HTML 3.2 ، لكن يمكنه عرض جزء منها فقط بسبب امتداد
قيود تنسيق إخراج النص. ومع ذلك ، يحاول البرنامج تقديم الخير
بدائل للعناصر التي لا يمكن عرضها. html2text يوزع إدخال HTML 4 أيضًا ، ولكن
ليس دائمًا ناجحًا مثل معالجات HTML الأخرى. كما أنه يقبل غير صحيح نحويًا
المدخلات ، وتحاول تفسيرها "بشكل معقول".

الطريقة html2text تنسيقات مستندات HTML يتم التحكم فيها عن طريق قراءة خصائص التنسيق
من ملف RC. html2text يحاول القراءة $ HOME / .html2textrc (أو الملف المحدد بواسطة
ال -rcfile خيار سطر الأوامر) ؛ إذا كان هذا الملف لا يمكن قراءته ، html2text يحاول القراءة
/ etc / html2textrc. إذا لم يكن بالإمكان قراءة ملف RC (أو إذا كان ملف RC لا يتجاوز كل ملفات
خصائص التنسيق) ، ثم يتم افتراض القيم الافتراضية "المعقولة". تنسيق ملف RC هو
الموصوفة في html2textrc(5) صفحة دليل.

نسخة دبيان من html2text يمكن أيضًا القيام بإعادة ترميز الإدخال والإخراج (انظر
/usr/share/doc/html2text/README.Debian لمزيد من المعلومات). html2text يحاول جلب الترميز
من مستند HTML. إذا لم يتم تحديد الترميز ، يمكنك استخدام -اسكي و -utf8 خيارات.
يتم تحويل الإخراج إلى مجموعة أحرف اللغة الخاصة بالمستخدم (LC_CTYPE).

OPTIONS


-وميتا
بشكل افتراضي ، يكون إصدار دبيان من html2text استخدم علامة "meta http-equiv" للإدخال
التسجيل. هذا الخيار يلغي هذا السلوك.

-اسكي بشكل افتراضي ، متى -وميتا تم توفيره، html2text يستخدم UTF-8 للإخراج.
تحديد هذا الخيار ، عادي ASCII يستخدم بدلا من ذلك. لمعرفة كيفية عدم وجود ASCII
يتم تقديم الأحرف ، راجع ملف "ascii.substitutes".

-utf8 بشكل افتراضي ، متى -وميتا تم توفيره، html2text يستخدم ISO 8859-1 للمدخلات.
تحديد هذا الخيار ، UTF-8 يستخدم بدلاً من ذلك (لكل من المدخلات والمخرجات). هذه
الخيار يعني -العقاب.

-التحقق من هذا الخيار لأغراض التشخيص: يتم تحليل مستند HTML فقط وليس
معالجتها بطريقة أخرى. في وضع التشغيل هذا ، html2text سيبلغ عن التحليل
الأخطاء وأخطاء المسح ، وهو ما لا يحدث في أوضاع التشغيل الأخرى. لاحظ أن
تحليل الأخطاء والمسح الضوئي ليست قاتلة ل html2text، ولكن قد يتسبب في سوء التفسير
من كود HTML و / أو أجزاء من المستند يتم ابتلاعها.

-debug-parser
اسمحوا html2text تقرير حول الرموز المميزة التي يتم تغييرها ، والقواعد التي يتم تطبيقها ، وما إلى ذلك ، بينما
مسح مستند HTML. هذا الخيار لأغراض التشخيص.

الماسح الضوئي
اسمحوا html2text تقرير عن كل رمز مميز تم مسحه ضوئيًا ، أثناء فحص HTML
وثيقة. هذا الخيار لأغراض التشخيص.

-مساعدة طباعة ملخص سطر الأوامر والخروج.

-العقاب بشكل افتراضي ، الأصل html2text يجعل الأحرف التي تحتها خط مع تسلسل مثل
"تسطير أسفل السطر- backspace-character" وأحرف غامقة مثل "character-backspace-
حرف ". بسبب مشاكل مع UTF-8 ، إصدار دبيان من html2text لا
ينتج عنه مسافات خلفية ، لذا فإن هذا الخيار لا يفعل شيئًا حقًا.

-o ملف إلاخراج
اكتب الإخراج إلى ملف إلاخراج بدلاً من الإخراج القياسي. شرطة مثل
ملف إلاخراج هي طريقة بديلة لتحديد الإخراج القياسي.

-rcfile مسار
محاولة قراءة الملف المحدد في مسار كملف RC.

على غرار ( اتفاق | جميل )
الطراز جميل يغير بعض القيم الافتراضية لمعلمات التنسيق
موثقة في html2textrc(5). لمعرفة أي معلمة التنسيق وكيف
تم تغيير الإعدادات الافتراضية ، تحقق من الملف "pretty.style". إذا تم حذف هذا الخيار ،
نمط اتفاق يفترض على أنه افتراضي.

غير متفرغ
هذا الخيار لأغراض التشخيص: بدلاً من تنسيق المستند الذي تم تحليله ،
إنشاء كود HTML ، وهذا مضمون ليكون صحيحًا من الناحية التركيبية. لو html2text
لديه مشاكل في تحليل مستند HTML غير صحيح من الناحية النحوية ، قد يساعد هذا الخيار
عليك أن تفهم ماذا html2text يعتقد أن كود HTML الأصلي يعني.

-الإصدار
طباعة نسخة البرنامج والخروج.

-عرض عرض
افتراضيا، html2text لتنسيق مستندات HTML لعرض شاشة يبلغ 79
الشخصيات. في حالة إعادة توجيه الإخراج إلى ملف ، أو إذا كان عرض الجهاز الخاص بك
بخلاف 80 حرفًا ، أو إذا كنت ترغب فقط في تكوين فكرة عن كيفية القيام بذلك html2text عروض
بجداول كبيرة وعرض طرفي مختلف ، قد ترغب في تحديد ملف
مختلف عرض.

استخدم html2text عبر الإنترنت باستخدام خدمات onworks.net


خوادم ومحطات عمل مجانية

قم بتنزيل تطبيقات Windows و Linux

أوامر لينكس

Ad