अंग्रेज़ीफ्रेंचस्पेनिश

सर्वर चलाएं | Ubuntu > | Fedora > |


ऑनवर्क्स फ़ेविकॉन

हेरोल्ड - क्लाउड में ऑनलाइन

उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर पर ऑनवर्क्स मुफ्त होस्टिंग प्रदाता में हेरोल्ड चलाएं

यह कमांड हेरोल्ड है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर में से एक का उपयोग करके ऑनवर्क्स मुफ्त होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


हेरोल्ड - एचटीएमएल से डॉकबुक कनवर्टर

SYNOPSIS


सूचना देना [विकल्प]

वर्णन


प्रस्तुति-तटस्थ रूप में HTML सामग्री का पुन: उपयोग एक आम समस्या है। एक संभव
समाधान HTML को DocBook XML में बदलना है, क्योंकि DocBook एक अर्थपूर्ण मार्कअप भाषा है
दस्तावेज़ीकरण के लिए, जो अपने उपयोगकर्ताओं को दस्तावेज़ सामग्री बनाने में सक्षम बनाता है जो कैप्चर करता है
सामग्री की तार्किक संरचना। कमांड लाइन टूल हेरोल्ड का उपयोग HTML को कन्वर्ट करने के लिए किया जा सकता है
डॉकबुक को। चूंकि HTML तत्वों का उपयोग अक्सर अपेक्षित रूप से नहीं किया जाता है, इसके लिए संभावनाएं
ऐसा परिवर्तन कुछ हद तक सीमित है। हेरोल्ड उपकरण के dbdoclet सूट का हिस्सा है।
अधिक जानकारी के लिए पर जाएं http://www.dbdoclet.org.

विकल्प


--docbook-ऐड-इंडेक्स, -x
दस्तावेज़ के अंत में स्वचालित रूप से एक अनुक्रमणिका तत्व जोड़ें।

--docbook-डीकंपोज़-टेबल, -T
HTML कोड से तालिकाओं को एकल पैराग्राफ में विघटित करता है। यह उपयोगी हो सकता है,
यदि किसी दस्तावेज़ में स्वरूपण कारणों से बहुत सारी तालिकाएँ हैं।

--docbook-एन्कोडिंग, -d
जेनरेट की गई डॉकबुक एक्सएमएल फाइलों के एन्कोडिंग को निर्दिष्ट करता है।

--docbook-रूट-तत्व, -r
दस्तावेज़ का मूल तत्व। संभावित मान हैं: पुस्तक, लेख, संदर्भ, भाग,
अध्याय या खंड। इस विकल्प के लिए डिफ़ॉल्ट मान 'लेख' है

--docbook-शीर्षक, -t
परिणामी दस्तावेज़ के लिए शीर्षक।

--इन, -आई
HTML इनपुट फ़ाइल निर्दिष्ट करता है।

--सहायता, -हो
कंसोल पर एक सहायता पृष्ठ प्रिंट करता है।

--html-एन्कोडिंग, -s
HTML स्रोत फ़ाइलों के एन्कोडिंग को निर्दिष्ट करता है, जैसे कि ISO-8859-1।

--आउट, -ओ
DocBook XML गंतव्य फ़ाइल निर्दिष्ट करता है।

--प्रोफाइल, -पी
पूर्वनिर्धारित सेटिंग्स के साथ एक प्रोफ़ाइल फ़ाइल।

--वर्बोज़, वी
कंसोल आउटपुट के लिए वर्बोसिटी सक्षम करता है।

--संस्करण, -V
हेरोल्ड का संस्करण प्रदर्शित करता है।

विन्यास


परिवर्तन का विवरण प्रोफ़ाइल फ़ाइल द्वारा नियंत्रित किया जाता है। एक प्रोफ़ाइल फ़ाइल ऑफ़र करती है
कमांड लाइन तर्कों की तुलना में परिवर्तन को प्रभावित करने की अधिक संभावनाएं। NS
निम्न उदाहरण एक विशिष्ट प्रोफ़ाइल फ़ाइल दिखाता है।

परिवर्तन html2docbook;

अनुभाग अनुभाग-पहचान {
विशेषता-वर्ग = ["^ MsoHeading(\d+)$"];
सेक्शन-नंबरिंग-पैटर्न = "((\d+\.)+)?\d*\.?\p{Z}*";
}

अनुभाग सूची-पहचान {
आइटमीकृत-विशेषता-वर्ग = ["^MsoListBullet(\w*)$", "Aufzhlung(\w+)$];
आइटमीकृत-पट्टी-उपसर्ग = [ "-", "ओ", "\u00b7"];
आदेशित-विशेषता-वर्ग = ["^MsoListNumbered(\w*)$"];
आदेशित-पट्टी-उपसर्ग = [ "\d+\.\s+" ];
}

अनुभाग एचटीएमएल {
एन्कोडिंग = "विंडोज़-1252";
बहिष्कृत = [ "// पी [शुरू होता है (@ वर्ग, 'एमएसओटोक')]", ""];
}

अनुभाग डॉकबुक {
सार = """ लोरेम इप्सम
लोरेम इप्सम डोलर सिट एमेट, कॉन्सेक्टेटूर एडिपिसिसिंग एलीट, सेड
डू ईउसमॉड टेम्पर इनसिडिडंट यूट लेबर एट डोलोरे मैग्ना एलिका। केन्द्र शासित प्रदेशों
एनिम एड मिनिम वेनिअम, क्विस नोस्ट्रुड एक्सर्सिटेशन उलमको लेबरिस
निसि यूट एलिक्विप पूर्व ईए कमोडो परिणाम। ड्यूस औटे इरुरे डोलर इन
voluptate velit esse cillum dolore eu fugiat nulla में रिप्रेनेंडरिट
परियातुर एक्सेप्युर सिंट ओसीकैट कपिडेटैट नॉन प्रोडेंट, सन इन
अपराधी क्यूई ऑफिसिया डेसेरुंट मोलिट एनिम आईडी इस्ट लेबरम। सेड, डोलर
आमेट """;
ऐड-इंडेक्स = सच;
लेखक-ईमेल = "me@somewhere.de";
लेखक-पहला नाम = "माइकल";
लेखक-उपनाम = "फुच्स";
पतन-संरक्षित-स्थान = "सत्य";
कॉपीराइट-धारक = "इनजेनियूरब्यूरो माइकल फुच्स";
कॉपीराइट-वर्ष = "2012";
निगम = "";
निर्माण-शर्त-विशेषता = झूठा;
क्रिएट-प्रोलॉग = सच;
बनाएं-रीमैप-विशेषता = झूठा;
क्रिएट-एक्सरेफ-लेबल = झूठा;
विघटित-सारणी = असत्य;
डिटेक्ट-ट्रैप्ड-बीआर = सच;
प्रलेखन-आईडी = "doc01";
दस्तावेज़-तत्व = "पुस्तक";
एन्कोडिंग = "यूटीएफ -8";
हाइफ़नेशन-चार = "सॉफ्ट-हाइफ़न";
छवि-डेटा-प्रारूप = ["gif", "base64"];
छवि-पथ = "./आंकड़े";
भाषा = "डी";
रिलीज-जानकारी = "संस्करण 3.1";
टेबल-शैली = "सभी";
शीर्षक = "ट्यूटोरियल";
शीर्षक-सामान्यीकरण-स्थान = सत्य;
उपयोग-पूर्ण-छवि-पथ = झूठा;
}

वाक्य - विन्यास
एक प्रोफ़ाइल फ़ाइल में मुख्य रूप से अनुभाग होते हैं। अनुभागों का उपयोग पैरामीटरों को समूहीकृत करने के लिए किया जाता है जो
एक ही संदर्भ साझा करें। प्रत्येक अनुभाग कीवर्ड से शुरू होना चाहिए अनुभाग द्वारा पीछा किया
खंड का नाम। नाम के बाद पैरामीटर का ब्लॉक आता है, जो चारों ओर से घिरा हुआ है
घुंघराले ब्रेसिज़। पैरामीटर स्ट्रिंग, संख्या, बूलियन या ऐरे प्रकार के हो सकते हैं। स्ट्रिंग्स होना चाहिए
दोहरे उद्धरण चिह्नों के साथ तैयार किया गया। यदि स्ट्रिंग में नई पंक्तियाँ हैं, तो तीन दोहरे उद्धरण चिह्नों का उपयोग करें
एक के बजाय। वर्गाकार कोष्ठकों के साथ सरणियाँ तैयार की जाती हैं। एक सरणी के अंदर, तत्वों को होना चाहिए
अल्पविराम से अलग होना। प्रत्येक असाइनमेंट अर्धविराम से समाप्त होना चाहिए। मल्टी लाइन टिप्पणियाँ
फॉर्म है /* my टिप्पणी */ , सिंगल लाइन टिप्पणियाँ इस तरह दिखती हैं // my टिप्पणी\n.

अनिवार्य तत्व
हेरोल्ड के लिए एक प्रोफ़ाइल लाइन ट्रांसफ़ॉर्मेशन html2docbook; से शुरू होनी चाहिए।

अनुभाग खंड-पहचान
अनुभाग खंड-पहचान HTML कोड में सेक्शन एलिमेंट का पता लगाने और स्ट्रिप करने के लिए उपयोग किया जाता है
शीर्षकों से किसी भी नंबरिंग उपसर्ग को हटा दें।

कई संलेखन उपकरण गहराई से नेस्टेड अनुभागों की अनुमति देते हैं। HTML निर्यात करते समय, ऐसा होता है, कि
घोंसला छह स्तरों से गहरा हो जाता है। HTML छह तक के हेडर तत्व प्रदान करता है
स्तर, h1-h6, लेकिन कोई h7 या इससे भी अधिक नहीं। इस बिंदु पर, स्वरूपण सामान्य रूप से किया जाता है
CSS और div या p तत्वों की मदद से। हेरोल्ड के शीर्ष लेख तत्व का पता लगाने में सक्षम है
HTML, लेकिन यह किसी विशिष्ट टूल के निर्यात प्रारूप के बारे में नहीं जान सकता है। इसे हल करने के लिए
कुछ मामलों के लिए भी समस्या, आप पैरामीटर निर्दिष्ट कर सकते हैं विशेषता-वर्ग। यह मिश्रण है
नियमित अभिव्यक्तियों की एक सूची, जो प्रत्येक HTML की वर्ग विशेषता से मेल खाती हैं
तत्व। यदि कोई मिलान पाया जाता है, तो तत्व को अनुभाग तत्व के रूप में माना जाता है। नियमित
अभिव्यक्ति में समूह हो सकता है, जिसे स्तर संकेतक के रूप में व्याख्या किया जाता है। समूह होना चाहिए
पहला समूह और इसे किसी संख्या से मेल खाना चाहिए, उदाहरण के लिए ^heading(\d+)$। यदि स्तर नहीं कर सकते हैं
पता लगाया जा सकता है, सात का स्तर माना जाता है।

क्योंकि DocBook XSL स्टाइलशीट में परिवर्तन करते समय सेक्शन नंबरिंग का ध्यान रखा जाता है
एक विशिष्ट आउटपुट के लिए डॉकबुक एक्सएमएल, पहले से ही नंबरिंग को स्ट्रिप करना अक्सर आवश्यक होता है
एचटीएमएल पेज में परिभाषित। अन्यथा आप अपने सामने दो नंबरिंग टेक्स्ट के साथ समाप्त होते हैं
शीर्षक। हेरोल्ड को नंबरिंग पैटर्न का पता लगाने में मदद करने के लिए, पैरामीटर का उपयोग करें
सेक्शन-नंबरिंग-पैटर्न.

विशेषता-वर्ग
एक रेगुलर एक्सप्रेशन, जो हर p और div एलिमेंट पर लागू होता है। यदि अभिव्यक्ति
मेल खाता है, वर्तमान तत्व को एक अनुभाग तत्व के रूप में नियंत्रित किया जाता है। यदि नियमित
अभिव्यक्ति में समूह हैं, पहले समूह का उपयोग नेस्टिंग स्तर के रूप में किया जाएगा, अन्यथा स्तर
सात माना जाता है।

सेक्शन-नंबरिंग-पैटर्न
आम तौर पर आप HTML डेटा के साथ आने वाले सेक्शन नंबरिंग से छुटकारा पाना चाहते हैं,
क्योंकि यह डॉकबुक में शीर्षक टेक्स्ट का हिस्सा बन जाता है। अनुभाग संख्याएँ होंगी
अपने लक्षित मीडिया में दो बार दिखाई दें। एक HTML से और एक DocBook XSL से
प्रसंस्करण। पैरामीटर सेक्शन-नंबरिंग-पैटर्न एक रेगुलर एक्सप्रेशन को परिभाषित करता है,
जो हर खंड के शीर्षक की शुरुआत से मेल खाता है। यदि यह मेल खाता है, तो
मिलान भाग हटा दिया जाता है।

अनुभाग सूची-पहचान
कभी-कभी सूचियों को उल, ओएल या डीएल टैग के साथ प्रदर्शित नहीं किया जाता है, लेकिन उन्हें पी के रूप में दर्शाया जाता है
अतिरिक्त सीएसएस स्वरूपण के साथ टैग। यदि आप किसी ऐसे टूल का उपयोग करते हैं, जो HTML को बनाता या निर्यात करता है
इस तरह के एक निर्माण, रूपांतरण के बजाय पैरा तत्वों के साथ समाप्त हो जाएगा
DocBook में संबंधित सूची तत्व। कुछ मामलों में सूचियों को फिर से बनाने के लिए, आप इसका उपयोग कर सकते हैं
अनुभाग सूची-पहचान। मापदंडों आइटमीकृत-विशेषता-वर्ग और
आदेश-विशेषता-वर्ग आपको रेगुलर एक्सप्रेशन की सूचियों को परिभाषित करने देता है, जो इसके विरुद्ध मेल खाती हैं
एचटीएमएल में सूची आइटम। हेरोल्ड इससे उचित सूची संरचना के पुनर्निर्माण की कोशिश करता है
जानकारी, यहां तक ​​कि नेस्टेड सूचियों के लिए भी।

अनुभाग एचटीएमएल
अनुभाग HTML पैरामीटर को परिभाषित करता है, जो HTML की लोडिंग और पार्सिंग को नियंत्रित करता है
इनपुट डेटा।

एन्कोडिंग
इनपुट स्ट्रीम को पढ़ने के लिए इस्तेमाल किया जाने वाला कैरेक्टर सेट।

निकालना
xpath अभिव्यक्तियों की एक सरणी को परिभाषित करता है। सभी मैच HTML DOM ट्री से हटा दिए जाते हैं
परिवर्तन से पहले।

अनुभाग DocBook
सार
जानकारी अनुभाग के सार तत्व के लिए पाठ। यदि टेक्स्ट के साथ संरचित है
न्यूलाइन, तीन दोहरे उद्धरण चिह्नों को सीमांकक के रूप में उपयोग करें। यदि टेक्स्ट "<" से शुरू होता है
चरित्र, यह एक सार तत्व में अंतर्निहित है, अन्यथा पाठ एम्बेडेड है
एक सार तत्व के अंदर एक पैरा तत्व में। पाठ को पार्स किया जाएगा और कर सकते हैं
डॉकबुक तत्व शामिल हैं।

ऐड-इंडेक्स
यदि सत्य पर सेट किया जाता है, तो DocBook XML के अंत में एक अनुक्रमणिका तत्व डाला जाता है।

बनाएं-xref-लेबल
यदि गलत पर सेट किया जाता है, तो एंकर तत्वों को xreflabel विशेषता नहीं मिलती है।

विघटित-सारणी
यदि सही पर सेट किया जाता है, तो टेबल संरचनाओं को अनदेखा कर दिया जाएगा। तालिका कोशिकाओं की सामग्री
DocBook XML में अनुच्छेदों के अनुक्रम के रूप में सम्मिलित किया जाना चाहिए। यह पैरामीटर हो सकता है
उपयोगी है यदि आपके HTML में फ़ॉर्मेटिंग उद्देश्यों के लिए तालिकाएँ हैं। आम तौर पर आप प्राप्त करना चाहते हैं
उनसे छुटकारा पाएं, क्योंकि वे तार्किक संरचना से छेड़छाड़ करते हैं।

दस्तावेज़-तत्व
वह दस्तावेज़ तत्व जिसका आप उपयोग करना चाहते हैं। लेख, पुस्तक, भाग या संदर्भ में से एक होना चाहिए।

एन्कोडिंग
कैरेक्टर सेट जिसका उपयोग आउटपुट फाइल लिखने के लिए किया जाएगा।

छवि-डेटा-प्रारूप
छवि प्रारूपों की एक सरणी। इन प्रारूपों को इमेजऑब्जेक्ट तत्वों के रूप में डाला जाएगा,
इसके अतिरिक्त संबंधित img . के src विशेषता में पाए गए प्रारूप के लिए
तत्व। मूल प्रारूप "html" और "fo" भूमिकाओं के साथ दो बार डाला जाता है। NS
अन्य प्रारूपों को "html- "और" के लिए- ".

शीर्षक
परिणामी दस्तावेज़ का शीर्षक। यदि यह पैरामीटर अपरिभाषित है, तो हेरोल्ड कोशिश करता है
एचटीएमएल डेटा के मुख्य भाग से शीर्षक का पता लगाया।

उपयोग-पूर्ण-छवि-पथ
यदि आप imagedata तत्व की fileref विशेषता में पूर्ण छवि पथ चाहते हैं,
इस पैरामीटर को सत्य पर सेट करें।

कॉपीराइट


कॉपीराइट 2001-2013 माइकल फुच्स। लाइसेंस GPLv3+: GNU GPL संस्करण 3 या बाद का संस्करण
http://gnu.org/licenses/gpl.html. यह मुफ्त सॉफ्टवेयर है: आप बदलने के लिए स्वतंत्र हैं और
इसे पुनर्वितरित करें। कानून द्वारा अनुमत सीमा तक कोई वारंटी नहीं है।

onworks.net सेवाओं का उपयोग करके ऑनलाइन हेरोल्ड का उपयोग करें


Ad


Ad