این دستور langidentp است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
langident - فایل های زبانی را که در آن نوشته شده اند را شناسایی می کند
خلاصه
langident [OPTIONS] file1 [file2 ...]
شرح
شناسایی فایل های زبانی که با استفاده از ماژول Perl Lingua::Identify در آن نوشته شده اند.
OPTIONS
-a
نمایش همه نتایج (نه فقط محتمل ترین زبان).
-c
سطح اطمینان را برای زبان محتمل نشان دهید (اولین مقدار بلافاصله پس از آن خواهد بود
محتمل ترین زبان).
-d
اشکال زدایی (فقط توسعه).
-E رمزگذاری
رمزگذاری ورودی را انتخاب کنید. پیشفرض UTF-8 است.
# استفاده از ISO-8859-1 (لاتین1)
فایل langident -E ISO-8859-1
-e مواد و روش ها
روش(های) مورد استفاده را انتخاب کنید. سه راه برای انجام این کار وجود دارد:
# به سادگی با استفاده از یک روش
فایل langident -e ngrams3
# با استفاده از چندین روش (آنها را با کاما از هم جدا کنید)
langident -e prefixes3, suffixes3
# از چندین روش استفاده کنید و به هر یک از آنها وزن های مختلف اختصاص دهید
langident -e smallwords=2،پیوندها=1،ngrams3=1.3
روش های موجود به شرح زیر است: کلمات کوچک, پیشوند 1, پیشوند 2, پیشوند 3,
پیشوند 4, پسوندها 1, پسوندها 2, پسوندها 3, پسوندها 4, ngrams1, ngrams2, ngrams3 و
ngrams4.
-h
نمایش پیام راهنما و خروج.
-l
لیست همه زبان های موجود و خروج.
-m عدد
حداکثر تعداد نتایج (زبان) را برای نمایش تنظیم کنید (N زبان محتمل را نشان می دهد،
به ترتیب احتمال نزولی).
سوئیچ -a را لغو می کند.
-o زبان ها
فقط با زبان های مشخص کار کنید.
# فقط بین پرتغالی و انگلیسی شناسایی کنید
langident -o pt,en *
-p
درصدها را نیز نشان دهید.
-s اندازه
حداکثر اندازه برای بررسی
-v
نمایش نسخه و خروج
مثال ها
از روش های ngrams2 و ngrams1 استفاده کنید و اهمیت دو برابر را به ngrams2 اختصاص دهید (-e
تعویض)؛ خروجی شامل سه زبان محتمل (-m سوئیچ) با آن خواهد بود
درصدها (سوئیچ -p) و همچنین سطح اطمینان (سوئیچ -c) نتیجه اول.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:en 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
به DO
یک سوئیچ برای نادیده گرفتن برچسب های HTML (و شاید فرمت های دیگر) اضافه کنید.
با استفاده از خدمات onworks.net از langidentp به صورت آنلاین استفاده کنید