pdf2htmlEX - آنلاین در ابر

این دستور pdf2htmlEX است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


pdf2htmlEX - PDF را بدون از دست دادن متن و فرمت به HTML تبدیل می کند.

طریقه استفاده


pdf2htmlEX [گزینه‌ها] [ ]

شرح


pdf2htmlEX ابزاری است که فایل های PDF را به فایل های HTML تبدیل می کند.

pdf2htmlEX تمام تلاش خود را می کند تا PDF را به طور دقیق ارائه کند، در حالی که یک ظاهر طراحی مناسب را حفظ کند
حفظ متن و بهینه سازی برای وب

فونت ها به صورت PDF استخراج می شوند و سپس در HTML، متن در فایل HTML تبدیل شده جاسازی می شوند
معمولا قابل انتخاب و کپی است.

سایر اشیاء به صورت تصویر و همچنین تعبیه شده اند.

OPTIONS


صفحات
-f، --صفحه اول (پیش فرض: 1)
صفحه اول را برای پردازش مشخص کنید

-ل، --آخرین صفحه (پیش فرض: آخرین صفحه)
آخرین صفحه را برای پردازش مشخص کنید

ابعاد
--بزرگنمایی ، - عرض مناسب ، -- قد مناسب
--zoom فاکتور بزرگنمایی را مستقیماً مشخص می کند. --fit-width/height حداکثر را مشخص می کند
عرض/ارتفاع یک صفحه، مقادیر بر حسب پیکسل هستند.

اگر چندین مقدار مشخص شده باشد، از حداقل یک استفاده می شود.

اگر هیچ کدام مشخص نشده باشد، صفحات به صورت 72DPI ارائه می شوند.

--use-cropbox <0|1> (پیش فرض: 1)
از CropBox به جای MediaBox برای خروجی استفاده کنید.

--hdpi ، --vdpi (پیش فرض: 144)
DPI افقی و عمودی را برای تصاویر مشخص کنید

تولید
-- جاسازی
--embed-css <0|1> (پیش فرض: 1)
- embed-font <0|1> (پیش فرض: 1)
- embed-image <0|1> (پیش فرض: 1)
--embed-javascript <0|1> (پیش فرض: 1)
- embed-outline <0|1> (پیش فرض: 1)
مشخص کنید کدام عناصر باید در فایل HTML خروجی جاسازی شوند.

در صورت خاموش شدن، فایل های جدا شده به همراه فایل HTML برای آن تولید می شود
عناصر مربوطه

--embed یک رشته را به عنوان آرگومان می پذیرد. هر حرف از رشته باید یکی از حروف باشد
«cCfFiIjJoO»، که مربوط به یکی از سوئیچ‌های --embed-*** است. حروف کوچک
حروف برای 0 و حروف بزرگ برای 1. به عنوان مثال، «--embed cFIJo» به معنای
همه چیز را به جز فایل های CSS و خطوط کلی جاسازی کنید.

--split-pages <0|1> (پیش فرض: 0)
اگر روشن باشد، محتوای هر صفحه در یک فایل جداگانه ذخیره می شود.

اگر می خواهید صفحات به صورت جداگانه و پویا بارگیری شوند این سوئیچ مفید است -- a
سرور پشتیبانی ممکن است لازم باشد.

همچنین به --page-filename مراجعه کنید.

--dest-direct (پیش فرض: .)
پوشه مقصد را مشخص کنید

--css-نام فایل (پیش فرض: )
نام فایل فایل css تولید شده را در صورت عدم تعبیه مشخص کنید.

اگر خالی باشد، نام فایل به طور خودکار تعیین می شود.

--page-name (پیش فرض: )
الگوی نام فایل را برای صفحاتی که --split-pages 1 است مشخص کنید

برای نشان دادن مکان شماره صفحه، ممکن است %d متغیری در «نام فایل» گنجانده شود
باید قرار گیرد. مکان نگهدار از زیرمجموعه محدودی از اعداد عادی پشتیبانی می کند
متغیرهایی، از جمله عرض مشخص شده و لایه صفر.

اگر «نام فایل» حاوی یک مکان نگهدار برای شماره صفحه نباشد، شماره صفحه
مستقیماً قبل از پسوند فایل درج می شود. اگر نام فایل ندارد
یک پسوند، شماره صفحه در انتهای نام فایل قرار می گیرد.

اگر -page-filename مشخص نشده باشد، برای خروجی استفاده خواهد شد
نام فایل، جایگزینی پسوند با .page و افزودن مستقیم شماره صفحه
قبل از تمدید

مثال ها

pdf2htmlEX --split-pages 1 foo.pdf

فایل های صفحه foo1.page، foo2.page و غیره را ارائه می دهد.

pdf2htmlEX --split-pages 1 foo.pdf --page-name bar.baz

فایل های صفحه bar1.baz، bar2.baz و غیره را به دست می دهد.

pdf2htmlEX --split-pages 1 foo.pdf --page-name صفحه%dbar.baz

فایل های صفحه page1bar.baz، page2bar.baz و غیره را به دست می دهد.

pdf2htmlEX --split-pages 1 foo.pdf --page-name bar%03d.baz

فایل های صفحه bar001.baz، bar002.baz و غیره را به دست می دهد.

--outline-نام فایل (پیش فرض: )
نام فایل فایل طرح کلی تولید شده را در صورت عدم تعبیه مشخص کنید.

اگر خالی باشد، نام فایل به طور خودکار تعیین می شود.

--process-nontext <0|1> (پیش فرض: 1)
آیا برای پردازش اشیاء غیر متنی (به عنوان تصویر)

--فرآیند-طرح کلی <0|1> (پیش فرض: 1)
آیا برای نشان دادن طرح کلی در HTML تولید شده

--process-annotation <0|1> (پیش فرض: 0)
آیا برای نمایش حاشیه نویسی در HTML ایجاد شده

--فرآیند-فرم <0|1> (پیش فرض: 0)
آیا شامل فیلدهای متنی و دکمه‌های رادیویی در HTML تولید شده است

-- چاپ <0|1> (پیش فرض: 1)
فعال کردن پشتیبانی از چاپ غیرفعال کردن این گزینه ممکن است اندازه CSS را کاهش دهد.

-- بازگشتی <0|1> (پیش فرض: 0)
خروجی در حالت بازگشتی، برای دقت بهتر و سازگاری با مرورگر، اما
اندازه بزرگتر می شود

--tmp-file-size-limit (پیش فرض: -1)
این حجم کل فایل‌های موقت (بر حسب کیلوبایت) را محدود می‌کند که این نیز محدود می‌شود
اندازه کل فایل خروجی این یک تخمین است و پس از یک صفحه متوقف می شود،
زمانی که حجم کل فایل های موقت از این عدد بیشتر شود.

-1 به معنای بدون محدودیت است و پیش فرض است.

فونت
- embed-external-font <0|1> (پیش فرض: 1)
مشخص کنید که آیا فونت‌های همسان محلی، برای فونت‌هایی که در PDF تعبیه نشده‌اند، باید باشند یا خیر
در HTML تعبیه شده است.

اگر این سوئیچ خاموش باشد، فقط نام فونت‌ها صادر می‌شود تا مرورگرهای وب سعی کنند
برای پیدا کردن فونت های مناسب خود، و این ممکن است باعث مشکلات مربوط به فونت نادرست شود
معیارهای.

-- فونت-قالب (پیش فرض: واف)
فرمت فونت های استخراج شده از فایل PDF را مشخص کنید.

--تجزیه-رباط <0|1> (پیش فرض: 0)
لیگاتورها را تجزیه کنید. به عنوان مثال 'fi' -> 'f'i'.

-- اشاره خودکار <0|1> (پیش فرض: 0)
اگر روی 1 تنظیم شود، نکاتی برای فونت ها با استفاده از FontForge ایجاد می شود.

ممکن است قبل از آن --external-hint-tool باشد.

---external-hint-tool (پیش فرض: )
اگر مشخص شده باشد، این ابزار به منظور افزایش اشاره برای فونت ها فراخوانی می شود
قبل از --auto-hint خواهد بود.

ابزار به نام " '، جایی که پسوند خواهد بود
همان چیزی است که برای --font-format مشخص شده است.

--کشش-باریک-گلیف <0|1> (پیش فرض: 0)
اگر روی 1 تنظیم شود، علامت های باریک تر از آنچه در PDF توضیح داده شده است، کشیده می شوند. در غیر این صورت
فضا در سمت راست علامت‌ها قرار می‌گیرد

--فشرده-واید-گلیف <0|1> (پیش فرض: 1)
اگر روی 1 تنظیم شود، حروف عریض تر از آنچه در PDF توضیح داده شده است فشرده می شوند. در غیر این صورت خواهد شد
کوتاه شود.

-- override-fstyle <0|1> (پیش فرض: 0)
بیت های ftype را در فونت های TTF/OTF پاک کنید.

اگر اینترنت اکسپلورر از «مجوز باید قابل نصب باشد» شکایت کرد این را روشن کنید
و شما اجازه این کار را دارید.

--process-type3 <0|1> (پیش فرض: 0)
اگر روشن باشد، pdf2htmlEX سعی می کند فونت های نوع 3 را به گونه ای تبدیل کند که متن می تواند باشد
به صورت بومی در HTML ارائه شده است. در غیر این صورت تمام متن با فونت نوع 3 ارائه خواهد شد
به عنوان تصویر

این ویژگی بسیار آزمایشی است.

متن
--هپس ، -- veps (پیش فرض: 1)
حداکثر افست افقی/عمودی قابل تحمل (بر حسب پیکسل) را مشخص کنید.

pdf2htmlEX سعی می کند فایل HTML تولید شده را در حال جابجایی متن در این بهینه سازی کند
مسافت

--آستانه فضا (پیش فرض: 0.125)
pdf2htmlEX یک کاراکتر فضای خالی " " را در صورت فاصله بین دو وارد می کند
حروف متوالی در یک خط پهن تر از نسبت * font_size است.

--font-size-multiplier (پیش فرض: 4.0)
بسیاری از مرورگرهای وب حداقل اندازه فونت را محدود می کنند و بسیاری فونت داده شده را گرد می کنند
اندازه، که منجر به رندر نادرست می شود.

تعیین نسبت بزرگتر از 1 این مشکل را حل می کند، اما ممکن است ثابت شود
برخی از مرورگرها

با این حال، برای برخی از نسخه های فایرفاکس، هنگام اندازه فونت مشکلی وجود خواهد داشت
خیلی بزرگ است، در این صورت باید مقدار کوچکتری در اینجا مشخص شود.

--space-as-offset <0|1> (پیش فرض: 0)
اگر روی 1 تنظیم شود، کاراکترهای فاصله به‌عنوان جابه‌جایی در نظر گرفته می‌شوند که امکان بهتر شدن را فراهم می‌کند
بهينه سازي.

برای فایل‌های PDF با کدگذاری بد، روشن کردن این گزینه ممکن است باعث از دست رفتن شود
کاراکتر باشد.

--تونیکد <-1|0|1> (پیش فرض: 0)
یک نقشه ToUnicode ممکن است برای هر فونت در PDF ارائه شود که "معنا" را نشان می دهد.
از شخصیت ها با این حال اغلب اطلاعات "ToUnicode" بهتری در نوع 0/1 وجود دارد
فونت ها، و گاهی اوقات نقشه ToUnicode ارائه شده اشتباه است. اگر این مقدار روی
1، نقشه ToUnicode همیشه اعمال می شود، اگر به صورت PDF ارائه شود، و کاراکترها ممکن است نباشند
در صورت وجود برخورد، به درستی در HTML ارائه شود.

اگر روی -1 تنظیم شود، از یک نقشه سفارشی شده استفاده می شود تا رندر در HTML صحیح باشد
(از لحاظ بصری یکسان است)، اما ممکن است با انتخاب و کپی کردن کاراکترهای صحیح دریافت نکنید
چسباندن

اگر روی 0 تنظیم شود، pdf2htmlEX تمام تلاش خود را می کند تا دو روش بالا را متعادل کند.

--بهینه سازی متن <0|1> (پیش فرض: 0)
اگر روی 1 تنظیم شود، pdf2htmlEX سعی خواهد کرد تعداد عناصر HTML مورد استفاده را کاهش دهد
متن اگر مشکلی پیش آمد آن را خاموش کنید.

-صحیح-متن-قابلیت مشاهده <0|1> (پیش فرض: 0)
اگر روی 1 تنظیم شود، pdf2htmlEX سعی می کند متون تحت پوشش دیگر گرافیک ها را شناسایی کند
آنها را به درستی مرتب کنید، یعنی متون پوشیده شده در لایه متن شفاف می شوند و
روی لایه پس زمینه کشیده می شوند.

زمینه تصویر
--bg-قالب (پیش فرض: png)
فرمت تصویر پس زمینه را مشخص کنید. برای بررسی همه موارد پشتیبانی شده، «pdf2htmlEX -v» را اجرا کنید
فرمت.

--svg-node-count-limit (پیش فرض: -1)
اگر تعداد گره ها در یک تصویر پس زمینه svg از این حد بیشتر شد، این صفحه را به آن بازگردانید
پس زمینه بیت مپ; مقدار منفی به معنای بدون محدودیت است. این گزینه فقط زمانی مفید است که
'--bg-format svg' مشخص شده است. توجه داشته باشید که تعداد گره ها در svg فقط محاسبه می شود
تقریبا

--svg-embed-bitmap <0|1> (پیش فرض: 1)
آیا بیت مپ ها را در تصویر پس زمینه svg جاسازی کنید. 1: قرار دادن بیت مپ در پس زمینه svg.
0: در صورت امکان، بیت مپ ها را به فایل های خارجی بریزید.

این گزینه فقط زمانی مفید است که «--bg-format svg» و «--embed-image» مشخص شده باشد.
خاموش است

در حال حاضر، بیت مپ های RGB یا خاکستری JPEG در PDF را می توان حذف کرد، در حالی که آن ها در سایر موارد
فرمت ها یا فضاهای رنگی هنوز تعبیه شده اند. اگر بیت مپ ها همانطور که انتظار می رود ریخته نمی شوند،
سعی کنید PDF خود را با ghostscript یا acrobat از قبل پردازش کنید و مطمئن شوید که بیت مپ در آن وجود دارد
به فرمت RGB/Gray JPEG تبدیل می شوند. برای جزئیات بیشتر به ویکی پروژه مراجعه کنید.

PDF حفاظت
-و ، --مالک-رمز عبور
رمز عبور مالک را مشخص کنید

-u، --user-password
رمز عبور کاربر را مشخص کنید

--no-drm <0|1> (پیش فرض: 0)
تنظیمات DRM سند را لغو کنید

فقط زمانی که اجازه دارید این را روشن کنید.

متفرقه.
-- تمیز-tmp <0|1> (پیش فرض: 1)
اگر خاموش باشد، فایل‌های میانی در نهایت پاک نمی‌شوند.

--data-dir (پیش فرض: /usr/share/pdf2htmlEX)
پوشه ای که مانیفست و سایر فایل ها را در خود نگه می دارد را مشخص کنید (برای مشاهده مانیفست به زیر مراجعه کنید
فایل)`

--tmp-dir (پیش فرض: دایرکتوری / tmp or $TMPDIR if تنظیم)
پوشه موقت مورد استفاده برای فایل های موقت را مشخص کنید

--css-draw <0|1> (پیش فرض: 0)
طراحی CSS آزمایشی و پشتیبانی نشده

- رفع اشکال <0|1> (پیش فرض: 0)
چاپ اطلاعات اشکال زدایی

-- اثبات <0|1|2> (پیش فرض: 0)
خروجی نسخه اثبات اگر مقدار مثبت مشخص شده باشد، متون روی هر دو رسم می شوند
لایه متن و تصویر پس زمینه برای مقایسه. اگر 2 مشخص شده باشد، متن روشن است
پس زمینه در رنگ های مختلف است. اگر از فرمت پس‌زمینه png/jpg استفاده می‌شود، بالاتر است
hdpi/vdpi (مثلا 288) برای خوانایی توصیه می شود.

متا
-v، - نسخه
کپی رایت و اطلاعات نسخه را چاپ کنید

--کمک اطلاعات استفاده چاپ

MANIFEST و DATA-DIR


وقتی split-pages 0 باشد، فایل manifest توضیح می‌دهد که صفحه html نهایی چگونه باید باشد
تولید شده

به‌طور پیش‌فرض، pdf2htmlEX از مانیفست در data-dir پیش‌فرض استفاده می‌کند («pdf2htmlEX -v» را اجرا کنید
برای بررسی)، که یک نسخه ی نمایشی ساده از نحو آن را ارائه می دهد.

می توانید پیش فرض را تغییر دهید یا می توانید یک مورد جدید ایجاد کنید و درست را مشخص کنید
data-dir در خط فرمان.

همه فایل های ارجاع شده توسط مانیفست باید در data-dir قرار داشته باشند.

مثال


pdf2htmlEX /path/to/file.pdf
فایل.pdf را به file.html تبدیل کنید

pdf2htmlEX -- تمیز-tmp 0 - رفع اشکال 1 /path/to/file.pdf
file.pdf را تبدیل کنید و تمام فایل های میانی را رها کنید.

pdf2htmlEX --dest-direct خارج -- جاسازی fi /path/to/file.pdf
file.pdf را به out/file.html تبدیل کنید و فایل های فونت/تصویر را جدا کنید.

کپی رایت


حق چاپ 2012,2013،XNUMX لو وانگcoolwanglu@gmail.com>

pdf2htmlEX تحت مجوز GPLv3 با شرایط اضافی، مجوز را برای جزئیات بخوانید.

با استفاده از خدمات onworks.net از pdf2htmlEX به صورت آنلاین استفاده کنید



جدیدترین برنامه های آنلاین لینوکس و ویندوز