यह कमांड ग्राइंड है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
ग्राइंड - वर्डनेट लेक्सियोग्राफर फ़ाइलों को संसाधित करें
SYNOPSIS
पीसना [ -v ] [ -s ] [ -Lलॉग फ़ाइल ] [ -a ] [ -d ] [ -i ] [ -o ] [ -n ] फ़ाइल का नाम [
फ़ाइल का नाम...]
वर्णन
पिसना() वर्डनेट लेक्सियोग्राफर फ़ाइलों को संसाधित करता है, उपयोग के लिए उपयुक्त डेटाबेस फ़ाइलों का निर्माण करता है
वर्डनेट खोज और इंटरफ़ेस कोड और अन्य अनुप्रयोगों के साथ। वाक्यविन्यास और
इनपुट फ़ाइलों की संरचनात्मक अखंडता सत्यापित की जाती है। चेतावनियाँ और त्रुटियाँ इसके माध्यम से रिपोर्ट की जाती हैं
stderr और एक रन-टाइम लॉग तैयार किया जाता है stdout. एक डेटाबेस तभी तैयार होता है जब वहाँ
कोई त्रुटि नहीं हैं.
निवेश फ़ाइलें
इनपुट फ़ाइलें वर्डनेट में लागू सिंटैक्टिक श्रेणियों से मेल खाती हैं - संज्ञा, क्रिया,
विशेषण और क्रिया विशेषण. प्रत्येक इनपुट लेक्सियोग्राफर फ़ाइल में पर्यायवाची सेटों की एक सूची होती है
(synsets) भाषण के एक भाग के लिए। हालाँकि मूल सिंसेट सिंटैक्स सभी के लिए समान है
भाषण के भाग, वाक्य-विन्यास के कुछ भाग केवल भाषण के किसी विशेष भाग पर लागू होते हैं।
देख wninput(5WN) इनपुट फ़ाइल स्वरूप के विवरण के लिए।
से प्रत्येक फ़ाइल का नाम निर्दिष्ट प्रपत्र का है:
पथ नाम/पद.प्रत्यय
जहां पथ नाम वैकल्पिक है और पद या तो संज्ञा, क्रिया, adj or adv. प्रत्यय उपयोग किया जा सकता है
उदाहरण के लिए, सिंसेट के समूहों को अलग-अलग फ़ाइलों में अलग करना संज्ञा.जानवर और
संज्ञा.पौधा. वाक्यात्मक श्रेणियों के किसी भी संयोजन में एक या अधिक इनपुट फ़ाइलें हो सकती हैं
निर्दिष्ट. देखना लेक्सनाम(5WN) के निर्माण में प्रयुक्त कोशकार फ़ाइलों की सूची के लिए
संपूर्ण वर्डनेट डेटाबेस।
उत्पादन फ़ाइलें
पिसना() निम्नलिखित आउटपुट फ़ाइलें उत्पन्न करता है:
┌────────────┬─────────────────────── ───────── ────┐
│ फ़ाइल का नाम │ विवरण │
├────────────┼─────────────────────── ───────── ────┤
│सूचकांक.पद │ प्रत्येक वाक्यात्मक श्रेणी के लिए अनुक्रमणिका फ़ाइल │
│डेटा.पद │ प्रत्येक वाक्यात्मक श्रेणी के लिए डेटा फ़ाइल │
│अनुक्रमणिका.बोध │ सेंस इंडेक्स │
└────────────┴─────────────────────── ───────── ────┘
देख wndb(5WN) डेटाबेस फ़ाइल स्वरूपों के विवरण के लिए।
हर बार पिसना() चलाया जाता है, तो किसी भी मौजूदा डेटाबेस फ़ाइल को डेटाबेस के साथ अधिलेखित कर दिया जाता है
निर्दिष्ट इनपुट फ़ाइलों से उत्पन्न फ़ाइलें। यदि किसी वाक्यविन्यास से कोई इनपुट फ़ाइल नहीं है
श्रेणी निर्दिष्ट हैं, संबंधित डेटाबेस फ़ाइलें अधिलेखित नहीं हैं।
भावना नंबर
इंद्रियों को आम तौर पर सबसे अधिक से कम से कम बार उपयोग किए जाने का आदेश दिया जाता है, सबसे सामान्य के साथ
इंद्रिय क्रमांकित 1. उपयोग की आवृत्ति किसी भाव को टैग किए जाने की संख्या से निर्धारित होती है
विभिन्न अर्थ संगति ग्रंथों में। जिन इंद्रियों को शब्दार्थ रूप से टैग नहीं किया गया है वे अनुसरण करते हैं
मनमाने ढंग से क्रमबद्ध इंद्रियाँ। ध्यान दें कि यह ऑर्डर केवल एक अनुमान है
एक छोटे कोष में उपयोग के आधार पर।
RSI tagsense_cnt में प्रत्येक प्रविष्टि के लिए फ़ील्ड सूचकांक.पद फ़ाइलें इंगित करती हैं कि इनमें से कितनी
सूची में इंद्रियों को टैग किया गया है।
RSI cntlist डेटाबेस के साथ प्रदान की गई फ़ाइल प्रत्येक इंद्रिय को टैग किए जाने की संख्या को सूचीबद्ध करती है
शब्दार्थ संगति में. पिसना() से डेटा का उपयोग करता है cntlist की इंद्रियों को आदेश देना
प्रत्येक शब्द। जब अनुक्रमणिका.पद फ़ाइलें उत्पन्न होती हैं, synset_offsets अर्थ में आउटपुट हैं
संख्या क्रम, सूची में प्रथम भाव 1 के साथ। अर्थ की समान संख्या वाले भाव
टैग को अद्वितीय लेकिन लगातार अर्थ संख्याएँ निर्दिष्ट की जाती हैं। वर्डनेट अवलोकन यहाँ खोजें
निर्दिष्ट शब्द के सभी अर्थों को सभी वाक्यात्मक श्रेणियों में प्रदर्शित करता है, और इंगित करता है
शब्दार्थ रूप से टैग किए गए पाठों में कौन सी इंद्रियों का प्रतिनिधित्व किया गया है।
विकल्प
-v डेटाबेस जनरेट किए बिना इनपुट की अखंडता सत्यापित करें।
-s चेतावनी संदेशों की पीढ़ी को रोकें। आम तौर पर पीसना इससे चलाया जाता है
तब तक विकल्प जब तक सभी वाक्यविन्यास और संरचनात्मक त्रुटियों को ठीक नहीं कर लिया जाता
चेतावनी संदेशों से त्रुटि संदेशों का पता लगाना कठिन हो सकता है।
-Lलॉग फ़ाइल सभी संदेश लिखें लॉग फ़ाइल के बजाय stderr.
-a संसाधित इनपुट फ़ाइलों पर सांख्यिकीय रिपोर्ट तैयार करें।
-d इनपुट फ़ाइलों पर स्ट्रिंग लंबाई रिपोर्ट द्वारा इंद्रियों का वितरण उत्पन्न करें
संसाधित।
-i सेंस इंडेक्स फ़ाइल जनरेट करें.
-o इंद्रियों का उपयोग करके आदेश दें cntlist.
-n डेटाबेस में नामीकरण (व्युत्पन्न आकृति विज्ञान) लिंक उत्पन्न करें।
फ़ाइल का नाम में वर्णित फॉर्म की इनपुट फ़ाइल निवेश फ़ाइलें।
onworks.net सेवाओं का उपयोग करके ऑनलाइन ग्राइंड का उपयोग करें