अंग्रेज़ीफ्रेंचस्पेनिश

Ad


ऑनवर्क्स फ़ेविकॉन

एफएसटी-कंपाइलर - क्लाउड में ऑनलाइन

उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर पर ऑनवर्क्स फ्री होस्टिंग प्रदाता में एफएसटी-कंपाइलर चलाएं।

यह कमांड एफएसटी-कंपाइलर है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


एफएसटी-कंपाइलर, एफएसटी-कंपाइलर-यूटीएफ8 - एसएफएसटी कार्यक्रमों के लिए दो कंपाइलर

SYNOPSIS


fst-संकलक व्याकरण-फ़ाइल [ निर्गम संचिका ]
fst-कंपाइलर-utf8 व्याकरण-फ़ाइल [ निर्गम संचिका ]

विकल्प


-c ट्रांसड्यूसर को कॉम्पैक्ट फॉर्मेट में स्टोर करें जिसका उपयोग fst-infl2 द्वारा किया जाता है।

-l ट्रांसड्यूसर को लोमेम फॉर्मेट में स्टोर करें।

-s ट्रांसड्यूसर की सतह और विश्लेषण परत को स्विच करें। आपको इस स्विच का उपयोग करना होगा
उपयोग करने का आदेश fst-infl (एफएसटी-infl2, एफएसटी-infl3) विश्लेषण के बजाय पीढ़ी के लिए।

वर्णन


fst-संकलक परिमित-अवस्था ट्रांसड्यूसर प्रोग्राम के लिए एक कंपाइलर है। यह एक न्यूनतम उत्पन्न करता है
परिमित अवस्था ट्रांसड्यूसर जिसका उपयोग किया जा सकता है एफएसटी-मोर, एफएसटी-इन्फ्ल, एफएसटी-प्रिंट, एफएसटी-तुलना,
एफएसटी-पार्स, और fst-जाली. कॉम्पैक्ट ट्रांसड्यूसर प्रतिनिधित्व जिसके साथ उत्पन्न होता है
-सी ध्वज, द्वारा समर्थित है एफएसटी-infl2, एफएसटी-ट्रेन, और fst-मैच। स्मृति-कुशल
ट्रांसड्यूसर प्रतिनिधित्व जो -l ध्वज के साथ उत्पन्न होता है, केवल द्वारा समर्थित है एफएसटी-
infl3.

पहला प्रोग्राम तर्क उस फ़ाइल का नाम है जिसमें ट्रांसड्यूसर प्रोग्राम शामिल है।
प्रोग्रामिंग भाषा का वर्णन नीचे दिया गया है। दूसरा तर्क फ़ाइल का नाम है
जिसके परिणामी ट्रांसड्यूसर को बाइनरी रूप में लिखा जाएगा। यदि दूसरा तर्क है
अनुपलब्ध, आउटपुट को लिखा जाएगा स्टडआउट

fst-कंपाइलर-utf8 इससे अलग fst-संकलक केवल वर्ण एन्कोडिंग में। एफएसटी-कंपाइलर-
utf8 जबकि स्रोत फ़ाइलों की UTF8 एन्कोडिंग का समर्थन करता है fst-संकलक के लिए उपयोग किया जाना है
लैटिन8 जैसे 1-बिट कैरेक्टर कोड जो ASCII कोड का विस्तार हैं। जानकारी
एन्कोडिंग के बारे में ट्रांसड्यूसर फ़ाइलों में संग्रहीत किया जाता है और अन्य एसएफएसटी कार्यक्रमों द्वारा उपयोग किया जाता है।

फ़ाइल प्रारूप


एक ट्रांसड्यूसर प्रोग्राम में एक (वैकल्पिक) अनुक्रम होता है वर्णमाला और परिवर्तनशील
एकल के बाद परिभाषाएँ ट्रांन्सड्यूसर अभिव्यक्ति जो परिणाम को परिभाषित करता है
ट्रांसड्यूसर।

वर्णमाला

वर्णमाला की परिभाषा में कीवर्ड ALPHABET और उसके बाद = और कुछ ट्रांसड्यूसर शामिल होते हैं
अभिव्यक्ति उदा

वर्णमाला = [एज़]:[एज़]

यह आदेश वर्णमाला को प्रतीक युग्मों के सेट के रूप में पुनः परिभाषित करता है
ट्रांसड्यूसर का संक्रमण. दो-स्तरीय ऑपरेटरों, निषेध ऑपरेटरों और की घटनाएँ
गैर-उद्धृत अवधियों के पहले हमेशा एक वर्णमाला परिभाषा होनी चाहिए।

चर

चर दो भिन्न प्रकार के होते हैं। आइकॉन सेट चर हैश से घिरे हुए हैं
चिह्न (#) और प्रतीक अनुक्रम (नीचे देखें) को मान के रूप में लें:

#UC# = AZ
#एलसी# = एज़

ट्रांन्सड्यूसर चर डॉलर चिह्नों से घिरे हुए हैं और ट्रांसड्यूसर अभिव्यक्तियों को इस रूप में लेते हैं
मान:

$MAP$ = [az]:[AZ]+
$ एमएपी $ = [#LC#]:[#UC#]+

वे वेरिएबल जिनका नाम `=' चिह्न से शुरू होता है, विशेष होते हैं समझौता चर। यदि एक
ट्रांसड्यूसर एक्सप्रेशन में एग्रीमेंट वेरिएबल एक से अधिक बार आता है, यह हमेशा रहेगा
वही मूल्य. निम्नलिखित ट्रांसड्यूसर प्रोग्राम पर विचार करें:

$=1$ = [एबीसी]
$=1$

परिणाम ट्रांसड्यूसर स्ट्रिंग्स aXa, bXb, और cXc को पहचानता है। केवल अचक्रीय ट्रांसड्यूसर
(यानी स्ट्रिंग मैपिंग के एक सीमित सेट वाले ट्रांसड्यूसर) को समझौते के लिए सौंपा जा सकता है
चर।

चिह्न

एक प्रतीक या तो है

- A s 5 जैसा एकल वर्ण,

- एक उद्धृत वर्ण जैसे \* या \_,

- जैसे एक बहु-अक्षर प्रतीक या (जो हमेशा होता है
कोण कोष्ठक में संलग्न) या

- एक बैकस्लैश के बाद एक संख्या आती है जो कि संख्यात्मक कोड है
निर्दिष्ट चरित्र

- शून्य प्रतीक <>.

प्रतीक क्रम

प्रतीक अनुक्रम वर्णों, बहु-वर्ण प्रतीकों और वर्णों का एक क्रम है
श्रेणियाँ, उदाहरण के लिए az \। .

प्रतीक सीमा

एक प्रतीक श्रेणी या तो है

-एकल प्रतीक

- [ए-ज़ा-जेड] या जैसे वर्गाकार कोष्ठकों में संलग्न एक प्रतीक अनुक्रम

- ^ से शुरू होने वाला और [^A-Za-z] जैसे वर्गाकार कोष्ठकों में संलग्न एक प्रतीक अनुक्रम
([a-zA-Z] का पूरक निर्दिष्ट करते हुए) या

- अवधि (जो वर्णमाला के किसी भी प्रतीक का प्रतिनिधित्व करती है)

ट्रांसड्यूसर अभिव्यक्तियाँ

एक ट्रांसड्यूसर एक्सप्रेशन (TE) को पुनरावर्ती रूप से निम्नानुसार परिभाषित किया गया है:

- एक कोलन द्वारा अलग की गई दो प्रतीक श्रेणियों की एक जोड़ी एक TE है।

[एजेड]:[एजेड]

- [एज़] जैसी एकल प्रतीक श्रेणी एक टीई है।
यह [az]:[az] का संक्षिप्त रूप है।

- ब्रेसिज़ में संलग्न और एक कोलन द्वारा अलग किए गए दो प्रतीक अनुक्रम हैं
खाया। {a[bc]}:{def} a:db:e <>:f | के बराबर है a:dc:e <>:f.

- यदि X और Y TE हैं तो XY एक TE है।
(रिक्त स्थानों को तब तक नजरअंदाज कर दिया जाता है जब तक कि उन्हें उद्धृत न किया गया हो।)

- (X) एक TE है यदि X एक TE है।

- एक्स ऑप एक टीई है, एक्स एक टीई है और ऑप या तो * (क्लीन का स्टार ऑपरेटर) है, +
(क्लीन का प्लस ऑपरेटर), या? (वैकल्पिकता ऑपरेटर)

- ऑप एक्स एक टीई है, एक्स एक टीई है और ऑप या तो है! (नकार संचालिका), ^
(लक्ष्य भाषा निष्कर्षण ऑपरेटर), _ (स्रोत भाषा निष्कर्षण ऑपरेटर), या ^_
(स्रोत और लक्ष्य स्विच ऑपरेटर)।

- एक्स ऑप वाई एक टीई है एक्स है और वाई टीई है और ऑप या तो & (संयोजन) है
ऑपरेटर), | (डिसजंक्शन ऑपरेटर), || (रचना संचालिका), या - (घटाव
ऑपरेटर)

- L x op y R एक TE है यदि L और R TE हैं, x और y प्रतीक श्रेणियाँ हैं और
ऑप या तो => (दो-स्तरीय प्रतिबंध), <= (दो-स्तरीय जबरदस्ती), या <=> (दो-स्तरीय प्रतिबंध) है
प्रतिबंध और जबरदस्ती)।

- एक्स ऑप एल__आर एक टीई है यदि एक्स, एल और आर टीई हैं और ऑप या तो ^-> (ऊपर की ओर) है
प्रतिस्थापन), _-> (नीचे की ओर प्रतिस्थापन), /-> (बायीं ओर प्रतिस्थापन) या \-> (दाहिनी ओर
प्रतिस्थापन)। इसके अलावा, एल और आर को ऑटोमेटा को परिभाषित करना होगा (यानी जो उनके तारों को मैप करता है
खुद पर)। ये ऑपरेटर कार्टटुनेन के प्रतिस्थापन ऑपरेटरों के अनुरूप हैं। यदि
तीर के बाद प्रश्न चिह्न (?) आता है, तो प्रतिस्थापन वैकल्पिक हो जाता है।

- यदि X एक TE है, तो X << l एक TE है, और l इनमें से कोई एक रूप है
ए या फॉर्म ए:बी जहां ए और बी एकल अक्षर या प्रतीक हैं। परिणाम एक है
ट्रांसड्यूसर जहां एल को एक्स में स्वतंत्र रूप से डाला गया था। उदाहरण के लिए ट्रांसड्यूसर एबी << सी है
सी*एसी*बीसी* के बराबर।

- X op Y L1__R2, ..., LN__RN एक TE है यदि X,Y, L1 से LN और R1
आरएन के माध्यम से टीई हैं, और ऑप या तो => (सामान्य प्रतिबंध), <= (सामान्य जबरदस्ती), ^=> है
(सामान्य सतह प्रतिबंध), ^<= (सामान्य सतह जबरदस्ती), ^<=> (सामान्य सतह
प्रतिबंध और जबरदस्ती), _=> (सामान्य गहरा प्रतिबंध), _<= (सामान्य गहरा जबरदस्ती),
_<=> (सामान्य गहरा प्रतिबंध और जबरदस्ती)। (इन ऑपरेटरों को निम्नलिखित लागू किया गया था
Anssi Yli-Jyra द्वारा एक सुझाव।)

- "fname" एक TE है। कंपाइलर fname नाम की फ़ाइल को पढ़ता है और बदल देता है
इसे लाइन1|लाइन2|लाइन3|... रूप के ट्रांसड्यूसर में बदलें, जहां लाइनएक्स एक्स-वीं लाइन है
फ़ाइल। : और \ के अलावा अन्य सभी वर्णों की शाब्दिक व्याख्या की जाती है (अर्थात् इस प्रकार नहीं)।
ऑपरेटर्स)। इस TE का उपयोग आमतौर पर किसी फ़ाइल से मॉर्फेम सूची को पढ़ने के लिए किया जाता है।

- " " एक टीई है। कंपाइलर एक पूर्व-संकलित ट्रांसड्यूसर को पढ़ता है
फ़ाइल का नाम fname. यह

आगे की विशेषताएं

टिप्पणियाँ % प्रतीक से शुरू होती हैं और पंक्ति के अंत तक विस्तारित होती हैं। रिक्त स्थानों को नजरअंदाज कर दिया जाता है
जब तक कि उन्हें उद्धृत न किया जाए। भाव किसी पंक्ति के अंत में समाप्त होते हैं जब तक कि पंक्ति का अंत न हो
बैकस्लैश से पहले होता है. आदेश

#"fname" शामिल करें

fname नामक फ़ाइल से स्रोत कोड डालने के लिए उपयोग किया जा सकता है। आदेश

आरई >> "fname"

फ़ाइल fname में रेगुलर एक्सप्रेशन RE को संग्रहीत करता है। आदेश

#हॉपक्रॉफ्ट का उपयोग करें

कंपाइलर को अब से हॉपक्रॉफ्ट मिनिमाइज़ेशन एल्गोरिदम का उपयोग करने के लिए कहता है, और

#डिफ़ॉल्ट उपयोग करें

डिफ़ॉल्ट न्यूनतमकरण एल्गोरिथ्म (ब्रज़ोज़ोस्की) पर वापस स्विच करता है। आदेश

उदाहरण


यहां एक सरल ट्रांसड्यूसर प्रोग्राम का उदाहरण दिया गया है। यह मानते हुए कि फ़ाइल "adj-stems"
इसमें दो पंक्तियाँ शामिल हैं

आसान
देर से
बड़ा

यह ट्रांसड्यूसर आसान, आसान, आसान और देर से आने वाले विशेषण रूपों का सही विश्लेषण करेगा।
बाद में, और नवीनतम।

वर्णमाला = [a-zA-Z] y:ie:<> :<>

$R$ = y<=>i ( :<> ई)

$R2$ = e<=><> ( :<> ई)

$R$ = $R$ और $R2$

$Stems$ = "adj-stems"

$S$ = $स्टेम्स$ ( :<>| :{er}| :{EST})

$S$ || $आर$

बाहर निकलें स्थिति


fst-संकलक जब तक कोई त्रुटि न हो, 0 लौटाता है।

onworks.net सेवाओं का उपयोग करके ऑनलाइन fst-कंपाइलर का उपयोग करें


फ्री सर्वर और वर्कस्टेशन

विंडोज और लाइनेक्स एप डाउनलोड करें

लिनक्स कमांड

Ad