यह कमांड lt-proc है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
lt-proc - यह एप्लिकेशन लेक्सिकल प्रोसेसिंग मॉड्यूल और टूल का हिस्सा है ( lttoolbox
)
यह उपकरण एपर्टियम मशीन अनुवाद वास्तुकला का हिस्सा है:
http://www.apertium.org.
SYNOPSIS
lt-proc [ -a | -b | -o | -c | -d | -e | -g | -n | -p | -s | -t | -v | -h -z -w ] fst_file
[इनपुट_फ़ाइल [आउटपुट_फ़ाइल]]
lt-proc [ --विश्लेषण | --द्विभाषी | --सर्फ-द्विभाषी | --अक्षर संवेदनशील | --डीबग्ड-जेन
| --विघटन-संज्ञा | --पीढ़ी | --गैर-चिह्नित-जीन | --टैग-जीन | --उत्तर-पीढ़ी |
--साओ | -- लिप्यंतरण | --शून्य-फ्लश --शब्दकोश-मामला --विघटित-यौगिक |
--संस्करण | --मदद ] fst_file [इनपुट_फ़ाइल [आउटपुट_फ़ाइल]]
वर्णन
lt-proc यह एप्लिकेशन चार शाब्दिक प्रसंस्करण प्रदान करने के लिए जिम्मेदार है
कार्यक्षमताओं
· रूपात्मक विश्लेषक ( विकल्प -a )
· शाब्दिक स्थानांतरण ( विकल्प -n )
· रूपात्मक जनक ( विकल्प -g )
· पोस्ट-जनरेटर ( विकल्प -p )
यह कॉम्पैक्ट और कुशल बाइनरी फ़ाइलों को पढ़कर इन कार्यों को पूरा करता है
शब्दकोशों का प्रतिनिधित्व (परिमित-राज्य ट्रांसड्यूसर का एक वर्ग जिसे संवर्धित कहा जाता है
पत्र ट्रांसड्यूसर)। ये फ़ाइलें किसके द्वारा जनरेट की जाती हैं लेफ्टिनेंट-कॉम्प(1).
यह उल्लेख करना उचित है कि कुछ पात्र (`[', `]', `$', `^', `/', `+') हैं विशेष
प्रारूप और एनकैप्सुलेशन के लिए उपयोग किए जाने वाले वर्ण। यदि उनका उपयोग करना ही है तो उनसे बचना चाहिए
वस्तुतः, उदाहरण के लिए: `['...']' को नजरअंदाज कर दिया जाता है और ए का प्रारूप रेखा भरण है `^...$'.
विकल्प
-ए --विश्लेषण
पाठ को सतही रूपों में टोकनाइज़ करता है (पाठ में दिखाई देने वाली शाब्दिक इकाइयाँ) और
प्रत्येक सतही रूप के लिए, लेम्मा से युक्त एक या अधिक शाब्दिक रूप प्रदान करता है,
शाब्दिक श्रेणी और रूपात्मक विभक्ति जानकारी। टोकनाइजेशन नहीं है
अस्तित्व के कारण सीधा, एक ओर, संकुचन का, और, दूसरी ओर
दूसरी ओर, बहु-शब्द शाब्दिक इकाइयों की। संकुचन के लिए, सिस्टम एक में पढ़ता है
एकल सतह रूप और शाब्दिक रूपों के संगत अनुक्रम को प्रस्तुत करता है।
बहु-शब्द सतही रूपों का विश्लेषण बाएँ से दाएँ, सबसे लंबे समय तक मेल खाने वाले तरीके से किया जाता है।
बहु-शब्द सतही रूप अपरिवर्तनीय हो सकते हैं (जैसे कि बहु-शब्द पूर्वसर्ग या
संयोजन) या विभक्ति (उदाहरण के लिए, es में, "ईचबन de मेनोस", "वे चूक गए",
क्रिया के अपूर्ण सूचक काल का एक रूप है "एचर de मेनोस", "को
मिस")। कुछ प्रकार की असंतत बहु-शब्द इकाइयों के लिए भी सीमित समर्थन है
उपलब्ध। एकल-शब्द सतह रूपों का विश्लेषण इनमें से एक की तरह आउटपुट उत्पन्न करता है
उदाहरण: "कैंटर" -> `^कैंटर/कैंटर $' या `"दबा" ->
`^डाबा/दार /डार $'.
-बी, --द्विभाषी
शाब्दिक स्थानांतरण करता है, रूपात्मक प्रतीकों की कतारों को संलग्न करना निर्दिष्ट नहीं है
शब्दकोशों में. विश्लेषण विधा के रूप में, कई शाब्दिक रूपों का समर्थन करता है
स्रोत भाषा में दिए गए शाब्दिक रूप के लिए लक्ष्य भाषा। टिपिकली काम करता है
एपर्टियम-प्रीट्रांसफर के आउटपुट के साथ।
-ओ, --सर्फ-द्विभाषी
-बी के साथ, लेकिन एपर्टियम-टैगर -पी से इनपुट लेता है, सतह के रूपों के साथ, और यदि
शाब्दिक रूप द्विभाषी शब्दकोश में नहीं पाया जाता है, यह सतह को आउटपुट करता है
शब्द का रूप.
-सी, --अक्षर संवेदनशील
आने वाले वर्णों के शाब्दिक मामले का उपयोग करें
-डी, --डीबग्ड-जेन
रूप. सभी चीज़ों के साथ पीढ़ी
-e, --विघटित-यौगिक
अज्ञात शब्दों को यौगिक मानने का प्रयास करें और उन्हें विघटित करें।
-डब्ल्यू, --शब्दकोश-मामला
सतही मामले के बजाय शब्दकोष में मौजूद मामले की जानकारी का उपयोग करें
(केवल विश्लेषण मोड में लागू)।
-जी, --पीढ़ी
प्रत्येक लक्ष्य-भाषा शाब्दिक रूप के लिए एक लक्ष्य-भाषा सतही रूप प्रदान करता है
इसे उपयुक्त रूप से विभक्त करना।
-एन, --गैर-चिह्नित-जीन
रूपात्मक पीढ़ी (जैसे -g) लेकिन अज्ञात शब्द चिह्नों के बिना (तारांकन `*')।
-बी, --टैग-जीन
रूपात्मक पीढ़ी (जैसे -g) लेकिन पार्ट-ऑफ़-स्पीच टैग को बरकरार रखना।
-पी, --उत्तर-पीढ़ी
संकुचन और एपोस्ट्रोफ़ेशन जैसे ऑर्थोग्राफ़िक ऑपरेशन करता है।
पोस्ट-जनरेटर आमतौर पर होता है निष्क्रिय (सिर्फ इनपुट को आउटपुट में कॉपी करता है) जब तक कि a
विशेष अलार्म कुछ लक्ष्य-भाषा सतह रूपों में निहित प्रतीक पर सक्रिय यह तक
यदि आवश्यक हो तो एक विशेष स्ट्रिंग परिवर्तन करें; फिर यह वापस चला जाता है
स्लीप
-एस, --साओ
इनपुट प्रोसेसिंग चालू है ऑर्थोएपिकॉन (पहले `साओ') एनोटेशन सिस्टम प्रारूप:
http://orthoepikon.sf.net.
-टी, -- लिप्यंतरण
लिप्यंतरण शब्दकोश लागू करें
-में, --शून्य-फ्लश
शून्य वर्ण पर फ्लश आउटपुट
-में, --संस्करण
संस्करण संख्या प्रदर्शित करें.
-एच, --मदद
इस सहायता को प्रदर्शित करें।
onworks.net सेवाओं का उपयोग करके ऑनलाइन lt-proc का उपयोग करें