यह hxindex कमांड है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि Ubuntu ऑनलाइन, Fedora ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या MAC OS ऑनलाइन एमुलेटर का उपयोग करके OnWorks मुफ्त होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
hxindex - HTML दस्तावेज़ में एक अनुक्रमणिका डालें
SYNOPSIS
hxइंडेक्स [ -t ] [ -x ] [ -n ] [ -f ] [ -r ] [ -c कक्षाएं ] [ -b आधार ] [ -i Indexdb ] [ -s
टेम्पलेट ] [ -u वाक्यांश ] [--] [ फ़ाइल-या-यूआरएल ]
वर्णन
RSI hxइंडेक्स दस्तावेज़ में अनुक्रमित किए जाने वाले शब्दों को खोजता है, उन्हें एकत्रित करता है, उन्हें परिवर्तित करता है
लक्ष्य एंकर और एक HTML सूची के रूप में एक सॉर्टेड इंडेक्स बनाता है, जिसे जगह पर डाला जाता है
दस्तावेज़ में प्लेसहोल्डर का। परिणामी दस्तावेज़ मानक आउटपुट में लिखा जाता है।
सूचकांक को टिप्पणी के स्थान पर डाला जाता है
या फॉर्म की दो टिप्पणियों के बीच
...
बाद के मामले में, दो टिप्पणियों के बीच की सभी मौजूदा सामग्री पहले हटा दी जाती है।
सूचकांक शब्द या तो प्रकार के तत्व हैं या वर्ग विशेषता वाले तत्व
"अनुक्रमणिका"। (पिछड़े संगतता के लिए, वर्ग विशेषताएँ भी "इंडेक्स-इंस्ट" और "इंडेक्स-डेफ़"
मान्यता प्राप्त हैं।) तत्व (और वर्ग "इंडेक्स-डेफ़") को अधिक महत्वपूर्ण माना जाता है
वर्ग के साथ तत्व "अनुक्रमणिका" और उत्पन्न सूचकांक में बोल्ड में दिखाई देगा।
विकल्प -c अतिरिक्त कक्षाएं जोड़ता है, जो उपनाम हैं "अनुक्रमणिका".
डिफ़ॉल्ट रूप से, तत्व की सामग्री को इंडेक्स टर्म के रूप में लिया जाता है। यहाँ दो हैं
सूचकांक शब्द "जूता" की घटनाओं के उदाहरण:
जूता एक वस्त्र है जो...
चमड़े के जूते द्वारा पूरा किया गया ...
यदि अनुक्रमित किया जाने वाला शब्द तत्व की सामग्री के बराबर नहीं है, तो शीर्षक गुण
सही शब्द देने के लिए इस्तेमाल किया जा सकता है:
... जूते कपड़े का एक टुकड़ा है जो...
...दो चमड़े के जूतों के साथ...
RSI शीर्षक विशेषता का उपयोग तब भी किया जाना चाहिए जब सूचकांक शब्द किसी अन्य का उप-शब्द हो।
उप-शब्द अपने शीर्ष शब्द के नीचे इंडेक्स में इंडेंटेड दिखाई देते हैं। उप-शब्द को परिभाषित करने के लिए, का उपयोग करें
शीर्षक शब्द और उपशब्द के बीच दो विस्मयादिबोधक चिह्न ("!!") के साथ विशेषता, जैसे
इस:
...
...
...
जैसा कि ऊपर दिए गए अंतिम उदाहरण से पता चलता है, उप-उपशब्दों के कई स्तर हो सकते हैं।
RSI शीर्षक विशेषता एकाधिक सूचकांक शब्दों को एक ही सूचकांक से संबद्ध करने की भी अनुमति देती है
घटना। कई शब्दों को एक ऊर्ध्वाधर पट्टी ("|") से अलग किया जाता है। तुलना करें
उपरोक्त उदाहरणों के साथ निम्नलिखित उदाहरण:
...
...
ये दोनों तत्व इंडेक्स में दो शब्द सम्मिलित करते हैं। ध्यान दें कि दूसरा उदाहरण
उपरोक्त उप-पदों और एकाधिक पदों को जोड़ता है।
ऐसी फ़ाइल पर इंडेक्स चलाना संभव है जिसमें पहले से ही इंडेक्स मौजूद हो। पुराने लक्ष्य एंकर
और पुराने सूचकांक को पुनः उत्पन्न करने से पहले हटा दिया जाएगा।
विकल्प
निम्नलिखित विकल्प समर्थित हैं:
-t डिफ़ॉल्ट रूप से, hxइंडेक्स उस तत्व में एक आईडी विशेषता जोड़ता है जिसमें शामिल है
एक शब्द का घटित होना और भी सम्मिलित करता है इसके अंदर एक तत्व है नाम
विशेषता को ID के बराबर रखें। यह पुराने ब्राउज़रों को अनुमति देने के लिए है जो ID को अनदेखा करते हैं
लक्ष्य को खोजने के लिए नेटस्केप 4 जैसी विशेषताओं का भी उपयोग किया जा सकता है। -t विकल्प
दबाता है तत्व।
-x यह विकल्प XML सिंटैक्स कन्वेंशन को चालू करता है: खाली तत्व समाप्त हो जाएंगे />
के बजाय > जैसा कि HTML में है. -x का तात्पर्य -टी।
-i Indexdb
hxइंडेक्स किसी फ़ाइल से प्रारंभिक अनुक्रमणिका पढ़ सकते हैं और उसका मर्ज किया गया संग्रह लिख सकते हैं
इंडेक्स शब्दों को उस फ़ाइल में वापस ले जाएँ। इससे इंडेक्स को कई दस्तावेज़ों में फैलाया जा सकता है।
RSI -i विकल्प का उपयोग उस फ़ाइल का नाम देने के लिए किया जाता है जिसमें इंडेक्स होता है।
-b आधार यह विकल्प निम्नलिखित के संयोजन में उपयोगी है -i का आधार URL संदर्भ देने के लिए
दस्तावेज़. डिफ़ॉल्ट रूप से, hxइंडेक्स में होने वाली घटनाओं के लिंक संग्रहीत करेगा Indexdb
फॉर्म में फाइल करें #लंगर, लेकिन जब -b दिया गया है, लिंक इस तरह दिखेंगे
आधार#लंगर बजाय.
जब के साथ संयोजन में उपयोग किया जाता है -n, लिंक के शीर्षक विशेषताओं में शामिल होंगे
उस दस्तावेज़ का शीर्षक जिसमें शब्द शामिल है। शीर्षक पहले डाला जाता है
la टेम्पलेट (विकल्प देखें -s) को अल्पविराम और रिक्त स्थान से अलग करें।
जैसे, अगर hxइंडेक्स के साथ कहा जाता है
hxindex -i टर्मडीबी -n -बेस myfile.html myfile.html
और termdb में पहले से ही अनुभाग "3.1" में "foo" के लिए एक प्रविष्टि शामिल है
"file2.html" नामक दस्तावेज़ जिसका शीर्षक "The foos" है, फिर उत्पन्न सूचकांक
इसमें इस प्रकार की प्रविष्टि होगी:
फू,
title="फूज़, अनुभाग 3.1">3.1
-c वर्ग[,वर्ग[,...]]
सामान्य सूचकांक पदों को मान्यता दी जाती है क्योंकि उनका एक वर्ग होता है "अनुक्रमणिका"। RSI -c
विकल्प अतिरिक्त, अल्पविराम से अलग किए गए वर्ग नाम जोड़ता है जिन पर विचार किया जाएगा
उपनाम "अनुक्रमणिका". जैसे, -c उदाहरण यह सुनिश्चित किया जाएगा कि
class="instance">शब्द सूचकांक के लिए एक शब्द के रूप में मान्यता प्राप्त है।
-n डिफ़ॉल्ट रूप से, इंडेक्स में एंकर टेक्स्ट के रूप में "#" वाले लिंक होते हैं। विकल्प -n
लिंक टेक्स्ट में उन अनुभागों की अनुभाग संख्याएँ शामिल हो जाती हैं जिनमें
ये शब्द आते हैं, "बिना संख्या के" पर वापस आते हैं (विकल्प देखें -u नीचे) यदि नहीं
सेक्शन नंबर पाया जा सकता है। सेक्शन नंबर ढूंढ़ने से मिलते हैं
"secno" या "no-num" वर्ग के साथ निकटतम पूर्ववर्ती प्रारंभ टैग। के मामले में
"secno" में, उस तत्व की सामग्री को अनुभाग संख्या के रूप में लिया जाता है।
"नो-नंबर" के मामले में यह माना जाता है कि अनुभाग में कोई संख्या नहीं है और hxइंडेक्स प्रिंट करेंगे
इसके बजाय "बिना नंबर" का इस्तेमाल किया जाता है। इन क्लासों का इस्तेमाल भी किया जाता है hxसंख्या(1), तो यह है
चलाने के लिए उपयोगी hxइंडेक्स बाद hxसंख्या, जैसे,
hxnum myfile.html | hxindex -n >mynewfile.html
-s टेम्पलेट
जब विकल्प -n उपयोग किया जाता है, लिंक में एक शीर्षक विशेषता होगी और टेम्पलेट
यह निर्धारित करता है कि इसमें क्या शामिल है। डिफ़ॉल्ट "सेक्शन %s" है, जहाँ %s एक है
सेक्शन नंबर के लिए प्लेसहोल्डर। दूसरे शब्दों में, इंडेक्स में शामिल होगा
इस प्रकार की प्रविष्टियाँ:
अवधि, 7.8
कुछ उदाहरण:
hxindex -n -s 'अध्याय %s'
hxindex -n -s 'भाग %s'
hxindex -n -s 'hoofdstuk %s' -u 'ज़ोंडर संख्या'
यह विकल्प केवल इनके संयोजन में ही उपयोगी है -n
-u वाक्यांश जब विकल्प -n अनुभाग संख्या प्रदर्शित करने के लिए उपयोग किया जाता है, जिसके लिए कोई संदर्भ नहीं है
अनुभाग संख्या पाई जा सकती है जो इस प्रकार दिखाई जाती है वाक्यांश इसके बजाय. डिफ़ॉल्ट "??" है.
यह विकल्प केवल इनके संयोजन में ही उपयोगी है -n
-f हटाना शीर्षक विशेषताएँ जो इंडेक्स के साथ-साथ टिप्पणियों के लिए भी उपयोग की गईं
जो डाले गए इंडेक्स को सीमित करते हैं। इससे ब्राउज़र को इन्हें प्रदर्शित करने से बचना पड़ता है
विशेषताएँ. ध्यान दें कि hxइंडेक्स इसे अपने आउटपुट पर दोबारा नहीं चलाया जा सकता यदि यह
विकल्प का उपयोग किया जाता है. (स्मृति सहायक: "fरीज़" या "f(इनाल).)
-r इंडेक्स शब्दों को छांटते समय अंतिम विराम चिह्नों को नज़रअंदाज़ न करें। उदाहरण के लिए, यदि दो शब्द
के रूप में लिखे गए हैं
फू, ... फू
hxइंडेक्स आम तौर पर अल्पविराम को नजरअंदाज कर दिया जाएगा और उन्हें एक ही शब्द के रूप में माना जाएगा, लेकिन
-आर, उन्हें अलग-अलग माना जाता है। यह अनुगामी अल्पविराम (,), अर्धविराम को प्रभावित करता है
(;), कोलन (:), विस्मयादिबोधक चिह्न (!), प्रश्न चिह्न (?) और पूर्ण विराम (.).
यदि पद में दो या अधिक पूर्ण विराम हों तो अंतिम पूर्ण विराम को कभी नज़रअंदाज़ नहीं किया जाता है।
संक्षिप्तीकरण ("बीसी") और एलिप्सिस ("अधिक...") की सुरक्षा करें। यह नहीं को प्रभावित
सूचकांक शब्द कैसे मुद्रित किया जाता है (यह हमेशा उसी रूप में मुद्रित किया जाता है जैसा कि पाठ में दिखाई देता है),
केवल यह कि इसकी तुलना समान शब्दों से कैसे की जाती है। (स्मृति सहायक: "rओह")
ऑपरेंड
निम्नलिखित ऑपरेंड समर्थित है:
फ़ाइल-या-यूआरएल
HTML या XML फ़ाइल का नाम या उसका URL। यदि अनुपस्थित है, या यदि फ़ाइल है
"-", के स्थान पर मानक इनपुट पढ़ा जाता है।
बाहर निकलें स्थिति
निम्नलिखित निकास मान लौटाए जाते हैं:
0 सफल समापन।
>0 HTML फ़ाइल को पार्स करते समय एक त्रुटि हुई.
वातावरण
इनपुट को UTF-8 में माना जाता है, लेकिन वर्तमान लोकेल का उपयोग इनपुट निर्धारित करने के लिए किया जाता है।
सूचकांक शब्दों का क्रम क्रमबद्ध करना। अर्थात, hxइंडेक्स LANG, LC_ALL और/या को देखता है
LC_COLLATE पर्यावरण चर। देखें स्थानीय(1).
दूरस्थ फ़ाइलों को पुनर्प्राप्त करने के लिए प्रॉक्सी का उपयोग करने के लिए, पर्यावरण चर सेट करें http प्रॉक्सी or
एफ़टीपी_प्रॉक्सी. जैसे, http_proxy="http://localhost:8080/"
onworks.net सेवाओं का उपयोग करके hxindex ऑनलाइन उपयोग करें