Đây là lệnh langidentp có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
langident - xác định các tệp ngôn ngữ được viết bằng
SYNOPSIS
langident [TÙY CHỌN] file1 [file2 ...]
MÔ TẢ
Xác định các tệp ngôn ngữ được viết bằng mô-đun Perl Lingua :: Nhận dạng.
LỰA CHỌN
-a
Hiển thị tất cả các kết quả (không chỉ ngôn ngữ có thể xảy ra nhất).
-c
Hiển thị mức độ tin cậy cho hầu hết các ngôn ngữ có thể xảy ra (nó sẽ là giá trị đầu tiên ngay sau
ngôn ngữ có thể xảy ra nhất).
-d
Gỡ lỗi (chỉ dành cho phần phát triển).
-E THƯỞNG THỨC
Chọn một mã hóa đầu vào. Mặc định là UTF-8.
# sử dụng ISO-8859-1 (latin1)
tệp langident -E ISO-8859-1
-e PHƯƠNG PHÁP
Chọn (các) phương pháp để sử dụng. Có ba cách để làm điều này:
# chỉ cần sử dụng một phương pháp
tệp langident -e ngrams3
# sử dụng một số phương thức (phân tách chúng bằng dấu phẩy)
tiền tố langident -e3, hậu tố3
# sử dụng một số phương pháp và gán các trọng số khác nhau cho mỗi phương pháp
langident -e smallwords = 2, prefixes = 1, ngrams3 = 1.3
Các phương pháp khả dụng như sau: những từ nhỏ, tiền tố1, tiền tố2, tiền tố3,
tiền tố4, hậu tố1, hậu tố2, hậu tố3, hậu tố4, ngram1, ngram2, ngram3 và
ngram4.
-h
Hiển thị thông báo trợ giúp và thoát.
-l
Liệt kê tất cả các ngôn ngữ có sẵn và thoát.
-m CON SỐ
Đặt số lượng kết quả (ngôn ngữ) tối đa để hiển thị (hiển thị N ngôn ngữ có thể xảy ra nhất,
theo thứ tự xác suất giảm dần).
Ghi đè công tắc -a.
-o NGÔN NGỮ
Chỉ hoạt động với các ngôn ngữ được chỉ định.
# chỉ xác định giữa tiếng Bồ Đào Nha và tiếng Anh
langident -o pt, en *
-p
Đồng thời hiển thị tỷ lệ phần trăm.
-s KÍCH THƯỚC
Kích thước tối đa để kiểm tra.
-v
Hiển thị phiên bản và thoát.
VÍ DỤ
Sử dụng các phương pháp ngrams2 và ngrams1, gán gấp đôi mức độ quan trọng cho ngrams2 (-e
chuyển); đầu ra sẽ bao gồm ba ngôn ngữ có thể xảy ra nhất (-m chuyển đổi) với
tỷ lệ phần trăm (-p chuyển đổi) và cả mức độ tin cậy (-c chuyển đổi) của kết quả đầu tiên.
$ langident -e ngrams2 = 2, ngrams1 -c -p -m 3 ĐỌC TIẾP
README: vi 65.7209505939491 7.8971987481393 ga 4.11905889385895 tr 4.08487011400505
$
ĐẾN DO
· Thêm một công tắc để bỏ qua các thẻ HTML (và có thể cả các định dạng khác)
Sử dụng langidentp trực tuyến bằng các dịch vụ onworks.net