این دستور html2pdbtxt است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
html2pdbtxt - مبدل متن HTML به Doc برای Palm Pilots
خلاصه
html2pdbtxt [ -bتانک ها ] [ -tعنوان ] [ -uURL ] file.html [ file.txt ]
html2pdbtxt -v
شرح
html2pdbtxt HTML را به متن مناسب برای تبدیل به a تبدیل می کند توضیحات(4) فایل از طریق
txt2pdbdoc(1). اگر نام فایل متنی داده نشود، متن تولید شده به استاندارد ارسال می شود
خروجی.
HTML گزينه ها
تگ های HTML زیر (و تگ های پایانی مربوطه) شناسایی می شوند: ADDRESS، A NAME،
BLOCKQUOTE، BR، CENTER، DIV، DL، DT، H1، H2، H3، H4، H5، H6، OL، OPTION، PRE، P، SELECT،
SCRIPT، STYLE، TABLE، TITLE، UL. در همه موارد، «معقولترین» کار انجام میشود
با توجه به محدودیت های توضیحات(4) قالبی که اساساً متن ساده است. ALT
ویژگی ها (معمولاً در تگ های IMG یافت می شوند) متن آنها استخراج شده و بین آنها قرار می گیرد
براکت [مثل این]. تمام تگ های HTML دیگر حذف می شوند.
شخصیت اشخاص
هم کاراکتر HTML و هم ارجاعات موجودیت عددی (اعشاری و هگزادسیمی) تبدیل می شوند
به مقدار بایت آنها مطابق با مجموعه کاراکترهای ISO 8859-1 (لاتین 1) به طوری که آنها ظاهر شوند
به درستی روی خلبان برای مثال، «رزومه» به «رزومه» با
حرف e با تاکید
سند عنوان
مگر اینکه با -t گزینه، فایل HTML اسکن می شود ...
برچسب ها و در صورت یافتن، عنوان استخراج شده و در خط 1 فایل تولید شده قرار می گیرد.
توسعه
نشانکها در فایل تولید شده در هر کجا که برچسبها در آن یافت میشوند قرار میگیرند
فایل HTML.
OPTIONS
-bتانک ها دنباله کاراکتری را که قرار است به عنوان نشانک نشانک عمل کند، مشخص کنید. در
پیش فرض (*) است. (به اخطارها مراجعه کنید.)
-tعنوان عنوان سندی را که قرار است در خط 1 تولید شده ظاهر شود، مشخص کنید
فایلی که هر عنوانی را که در داخل فایل HTML یافت میشود، لغو میکند ...
برچسب ها
-uآدرس نشانی اینترنتی فایل HTML که ظاهراً از آن آمده است را مشخص کنید و آن را در خط بعد قرار دهید
عنوان، در صورت وجود، در فایل تولید شده.
-v شماره نسخه را در خروجی استاندارد چاپ کنید و از آن خارج شوید.
مثال
برای تبدیل یک فایل HTML به Doc:
html2pdbtxt -u http://www.wonderland.org/ alice.html alice.txt
txt2pdbdoc "`head -1 alice.txt"" alice.txt alice.pdb
هشدارها
1. برخی از خوانندگان Doc یک «ویژگی» دارند که به موجب آن، در مرحله اسکن برای نشانکها، آنها
دنباله نشانک کاراکترها را تشخیص دهید هر جا در متن و نه فقط در
ابتدای یک خط
2. برخی از خوانندگان Doc اجازه نمی دهند که دنباله نشانک حاوی کاراکتر > باشد
آنها تفسیر می کنند که به عنوان جدا کننده دنباله، به عنوان مثال، <->> به عنوان تفسیر خواهد شد
دنباله بودن صرفا -.
3. لیست های مرتب شده (از طریق برچسب OL) به عنوان لیست های نامرتب در نظر گرفته می شوند (مانند تگ UL)
زیرا کد را تا حد زیادی پیچیده می کند زیرا باید بیشتر تجزیه شود
از تعویض های ساده ای که انجام می شود.
با استفاده از خدمات onworks.net از html2pdbtxt به صورت آنلاین استفاده کنید