यह कमांड पीडीएफटोटेक्स्ट है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
पीडीएफटोटेक्स्ट - पोर्टेबल दस्तावेज़ प्रारूप (पीडीएफ) से टेक्स्ट कनवर्टर (संस्करण 3.03)
SYNOPSIS
पीडीएफटीओटेक्स्ट [विकल्प] [पीडीएफ फाइल [पाठ फ़ाइल]]
वर्णन
पीडीएफटीओटेक्स्ट पोर्टेबल दस्तावेज़ प्रारूप (पीडीएफ) फ़ाइलों को सादे पाठ में परिवर्तित करता है।
Pdftotext पीडीएफ फाइल को पढ़ता है, पीडीएफ फाइल, और एक टेक्स्ट फ़ाइल लिखता है, पाठ फ़ाइल. अगर पाठ फ़ाइल
निर्दिष्ट नहीं है, pdftotext परिवर्तित होता है फ़ाइल.पीडीएफ सेवा मेरे फ़ाइल.txt. अगर पाठ फ़ाइल ´-', पाठ है
stdout को भेजा जाता है।
विकल्प
-f संख्या
कनवर्ट करने के लिए पहला पृष्ठ निर्दिष्ट करता है।
-l संख्या
कनवर्ट करने के लिए अंतिम पृष्ठ निर्दिष्ट करता है।
-r संख्या
डीपीआई में रिज़ॉल्यूशन निर्दिष्ट करता है। डिफ़ॉल्ट 72 DPI है.
-x संख्या
फसल क्षेत्र के ऊपरी बाएँ कोने के x-निर्देशांक को निर्दिष्ट करता है
-y संख्या
फसल क्षेत्र के ऊपरी बाएँ कोने के y-निर्देशांक को निर्दिष्ट करता है
-W संख्या
पिक्सेल में फसल क्षेत्र की चौड़ाई निर्दिष्ट करता है (डिफ़ॉल्ट 0 है)
-H संख्या
फसल क्षेत्र की ऊंचाई पिक्सेल में निर्दिष्ट करता है (डिफ़ॉल्ट 0 है)
-बेलआउट
पाठ के मूल भौतिक लेआउट को (यथासंभव सर्वोत्तम) बनाए रखें।
डिफ़ॉल्ट भौतिक लेआउट (कॉलम, हाइफ़नेशन, आदि) को 'पूर्ववत' करना और आउटपुट करना है
पढ़ने के क्रम में पाठ.
फिक्स्ड संख्या
निर्दिष्ट वर्ण चौड़ाई (इंच) के साथ निश्चित-पिच (या सारणीबद्ध) पाठ मानें
अंक). यह भौतिक लेआउट मोड को बाध्य करता है।
-कच्चा टेक्स्ट को कंटेंट स्ट्रीम क्रम में रखें। यह एक हैक है जो अक्सर कॉलम को "पूर्ववत" कर देता है
फ़ॉर्मेटिंग, आदि। रॉ मोड का उपयोग अब अनुशंसित नहीं है।
-एचटीएमएलमेटा
मेटा जानकारी सहित एक सरल HTML फ़ाइल बनाएं। यह बस लपेटता है
में पाठ करें और और मेटा हेडर को प्रीपेन्ड करता है।
-बीबॉक्स प्रत्येक शब्द के लिए बाउंडिंग बॉक्स जानकारी युक्त एक XHTML फ़ाइल बनाएं
फ़ाइल.
-bbox-लेआउट
प्रत्येक ब्लॉक, लाइन के लिए बाउंडिंग बॉक्स जानकारी युक्त एक XHTML फ़ाइल बनाएं
और फ़ाइल में शब्द.
-एन सी एन्कोडिंग-नाम
टेक्स्ट आउटपुट के लिए उपयोग हेतु एन्कोडिंग सेट करता है। यह डिफ़ॉल्ट रूप से "UTF-8" है।
-सुनो
उपलब्ध एन्कोडिंग को प्रकाशित करता है
-ईओएल यूनिक्स | डॉस | मैक
टेक्स्ट आउटपुट के लिए उपयोग के लिए एंड-ऑफ़-लाइन कन्वेंशन सेट करता है।
-nopgbrk
पृष्ठों के बीच पृष्ठ विराम (फ़ॉर्म फ़ीड वर्ण) न डालें।
-ओपीडब्ल्यूई पासवर्ड
पीडीएफ फाइल के लिए मालिक का पासवर्ड निर्दिष्ट करें। इसे प्रदान करने से सभी बायपास हो जाएंगे
सुरक्षा प्रतिबंध।
-उपवे पासवर्ड
पीडीएफ फाइल के लिए यूजर पासवर्ड निर्दिष्ट करें।
-q कोई संदेश या त्रुटि प्रिंट न करें।
-v कॉपीराइट और संस्करण जानकारी प्रिंट करें।
-h उपयोग की जानकारी प्रिंट करें। (-मदद और --मदद समकक्ष हैं।)
onworks.net सेवाओं का उपयोग करके ऑनलाइन pdftotext का उपयोग करें