यह कमांड लैंगिडेंटप है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।
कार्यक्रम:
नाम
लैंगिडेंट - यह पहचानता है कि फ़ाइलें किस भाषा में लिखी गई हैं
SYNOPSIS
लैंगिडेंट [विकल्प] फ़ाइल1 [फ़ाइल2 ...]
वर्णन
पर्ल मॉड्यूल Lingua::Identify का उपयोग करके लिखी गई भाषा फ़ाइलों की पहचान करता है।
विकल्प
-a
सभी परिणाम दिखाएँ (सिर्फ सबसे संभावित भाषा नहीं)।
-c
सबसे संभावित भाषा के लिए आत्मविश्वास का स्तर दिखाएं (यह ठीक इसके बाद पहला मान होगा
सबसे संभावित भाषा)।
-d
डिबग (केवल विकास)।
-E एन्कोडिंग
एक इनपुट एन्कोडिंग चुनें. यूटीएफ-8 पर डिफ़ॉल्ट।
# आईएसओ-8859-1 (लैटिन1) का उपयोग करें
लैंगिडेंट -ई आईएसओ-8859-1 फ़ाइल
-e विधि
उपयोग करने के लिए विधि(विधियों) का चयन करें। ऐसा करने के तीन तरीके हैं:
# बस एक विधि का उपयोग करना
langident -e ngrams3 फ़ाइल
# कई विधियों का उपयोग करना (उन्हें अल्पविराम से अलग करना)
लैंगिडेंट -ई उपसर्ग3, प्रत्यय3
# कई तरीकों का उपयोग करें और उनमें से प्रत्येक को अलग-अलग वजन दें
langident -e छोटेशब्द=2,उपसर्ग=1,ngrams3=1.3
उपलब्ध विधियाँ निम्नलिखित हैं: छोटे शब्द, उपसर्ग1, उपसर्ग2, उपसर्ग3,
उपसर्ग4, प्रत्यय1, प्रत्यय2, प्रत्यय3, प्रत्यय4, ngrams1, ngrams2, ngrams3 और
ngrams4.
-h
सहायता संदेश प्रदर्शित करें और बाहर निकलें।
-l
सभी उपलब्ध भाषाओं की सूची बनाएं और बाहर निकलें।
-m नंबर
प्रदर्शित करने के लिए परिणामों (भाषाओं) की अधिकतम संख्या निर्धारित करें (एन सबसे संभावित भाषाओं को दिखाता है,
संभाव्यता के अवरोही क्रम से)।
-ए स्विच को ओवरराइड करता है।
-o भाषाओं
केवल निर्दिष्ट भाषाओं के साथ काम करें।
# केवल पुर्तगाली और अंग्रेजी के बीच पहचान करें
लैंगिडेंट -ओ पीटी,एन *
-p
प्रतिशत भी दिखायें।
-s SIZE
जांच करने के लिए अधिकतम आकार.
-v
संस्करण दिखाएं और बाहर निकलें।
उदाहरण
ngrams2 और ngrams1 विधियों का उपयोग करें, ngrams2 को दोगुना महत्व देते हुए (-e
बदलना); आउटपुट में इसके साथ तीन सबसे संभावित भाषाएं (-एम स्विच) शामिल होंगी
प्रतिशत (-पी स्विच) और पहले परिणाम का आत्मविश्वास स्तर (-सी स्विच)।
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
सेवा मेरे DO
· HTML टैग्स (और शायद अन्य प्रारूपों को भी) को अनदेखा करने के लिए एक स्विच जोड़ें
onworks.net सेवाओं का उपयोग करके langidentp का ऑनलाइन उपयोग करें