Ini adalah perintah langidentp yang dapat dijalankan di penyedia hosting gratis OnWorks menggunakan salah satu dari beberapa workstation online gratis kami seperti Ubuntu Online, Fedora Online, emulator online Windows atau emulator online MAC OS
PROGRAM:
NAMA
langident - mengidentifikasi file bahasa yang ditulis
RINGKASAN
langident [OPSI] file1 [file2 ...]
DESKRIPSI
Mengidentifikasi file bahasa yang ditulis menggunakan modul Perl Lingua::Identify.
PILIHAN
-a
Tampilkan semua hasil (bukan hanya bahasa yang paling mungkin).
-c
Tunjukkan tingkat kepercayaan untuk bahasa yang paling mungkin (itu akan menjadi nilai pertama tepat setelah
bahasa yang paling mungkin).
-d
Debug (khusus pengembangan).
-E pengkodean
Pilih pengkodean masukan. Default ke UTF-8.
# gunakan ISO-8859-1 (latin1)
file langident -E ISO-8859-1
-e METODE
Pilih metode yang akan digunakan. Ada tiga cara untuk melakukan ini:
# cukup menggunakan metode
file langident -e ngrams3
# menggunakan beberapa metode (pisahkan dengan koma)
langident -e awalan3, akhiran3
# menggunakan beberapa metode dan menetapkan bobot yang berbeda untuk masing-masing metode
langident -e kata kecil=2,prefiks=1,ngram3=1.3
Metode yang tersedia adalah sebagai berikut: kata-kata kecil, awalan1, awalan2, awalan3,
awalan4, akhiran1, akhiran2, akhiran3, akhiran4, ngram1, ngram2, ngram3 dan
ngram4.
-h
Tampilkan pesan bantuan dan keluar.
-l
Daftar semua bahasa yang tersedia dan keluar.
-m NOMOR
Setel jumlah maksimum hasil (bahasa) untuk ditampilkan (menunjukkan N bahasa yang paling mungkin,
dengan urutan probabilitas yang menurun).
Mengganti -a switch.
-o BAHASA
Hanya bekerja dengan bahasa tertentu.
# mengidentifikasi antara bahasa Portugis dan Inggris saja
langident -o pt,en *
-p
Juga menunjukkan persentase.
-s UKURAN
Ukuran maksimum untuk diperiksa.
-v
Tampilkan versi dan keluar.
CONTOH
Gunakan metode ngrams2 dan ngrams1, menetapkan kepentingan ganda untuk ngrams2 (-e
mengalihkan); output akan menyertakan tiga bahasa yang paling mungkin (-m switch) dengan
persentase (-p switch) dan juga tingkat kepercayaan (-c switch) dari hasil pertama.
$ langident -e ngrams2=2,ngrams1 -c -p -m 3 README
README:id 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
UNTUK DO
· Tambahkan sakelar untuk mengabaikan tag HTML (dan mungkin juga format lain)
Gunakan langidentp online menggunakan layanan onworks.net