GoGPT Best VPN GoSearch

Biểu tượng yêu thích OnWorks

yaz-icu - Trực tuyến trên đám mây

Chạy yaz-icu trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh yaz-icu có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


yaz-icu - tiện ích YAZ ICU

SYNOPSIS


yaz-icu [-NS cấu hình] [-P opt] [-s] [-x] [trong tệp tin]

MÔ TẢ


yaz-icu là tiện ích thể hiện mô-đun chuỗi ICU của yaz. (yaz / icu.h).

Tiện ích có thể được sử dụng theo hai cách. Nó có thể đọc một số văn bản bằng cách sử dụng cấu hình XML cho
cấu hình ICU và hiển thị phân tích văn bản. Chế độ này được kích hoạt bởi tùy chọn -c mà
xác định cấu hình sẽ được sử dụng. Tệp đầu vào được đọc từ đầu vào chuẩn hoặc
từ một tệp nếu infile được chỉ định.

Tiện ích cũng có thể hiển thị thông tin ICU. Điều này được kích hoạt bởi tùy chọn -p.

LỰA CHỌN


-c cấu hình
Chỉ định tệp chứa cấu hình chuỗi ICU dựa trên XML.

-p kiểu
Chỉ định thông tin bổ sung sẽ được in về hệ thống ICU. Nếu như kiểu c là ICU
bộ chuyển đổi được in. Nếu như kiểu Tôi có sẵn các ngôn ngữ được in không. Nếu như kiểu là t
các trình chuyển ngữ có sẵn được in ra.

-s
Chỉ định rằng đầu ra cũng phải bao gồm khóa sắp xếp. Lưu ý rằng khóa sắp xếp khác nhau
giữa các phiên bản ICU.

-x
Chỉ định rằng đầu ra phải dựa trên XML chứ không phải dựa trên "văn bản".

ICU CHUỖI CẤU HÌNH


Cấu hình chuỗi ICU trình bày một hoặc nhiều quy tắc để chuyển đổi dữ liệu văn bản thành mã thông báo.
Định dạng cấu hình dựa trên XML.

Phần tử cấp cao nhất phải được đặt tên là icu_chain. Phần tử icu_chain có một phần tử bắt buộc
ngôn ngữ thuộc tính chỉ định ngôn ngữ ICU sẽ được sử dụng trong các bước chuyển đổi.

Phần tử icu_chain phải bao gồm các phần tử trong đó mỗi phần tử chỉ định một chuyển đổi
bươc chân. Việc chuyển đổi được thực hiện theo thứ tự các bước chuyển đổi
được chỉ định. Mỗi phần tử chuyển đổi nhận một thuộc tính: quy tắc đóng vai trò là đối số cho
bước chuyển đổi.

Các yếu tố chuyển đổi sau có sẵn:

sơ đồ trường hợp
Chuyển đổi trường hợp và quy tắc chỉ định cách:

l
Viết thường bằng cách sử dụng hàm ICU u_strToLower.

u
Chữ hoa sử dụng hàm u_strToUpper của ICU.

t
Để đặt tiêu đề bằng cách sử dụng chức năng UCU u_strToTitle.

f
Trường hợp gấp sử dụng chức năng ICU u_strFoldCase.

trưng bày
Đây là một bước meta chỉ định rằng một thuật ngữ / mã thông báo sẽ được hiển thị. Thuật ngữ này là
được truy xuất trong một ứng dụng bằng hàm icu_chain_token_display (yaz / icu.h).

biến đổi
Chỉ định quy tắc chuyển đổi ICU bằng cách sử dụng Mã định danh bộ chuyển ngữ. Thuộc tính quy tắc
là Định danh trình chuyển ngữ. Nhìn thấy ICU Biến đổi[1] để biết thêm thông tin.

chuyển ngữ
Chỉ định một trình chuyển ngữ dựa trên quy tắc. Thuộc tính quy tắc là chuyển đổi tùy chỉnh
quy tắc được sử dụng. Nhìn thấy ICU Biến đổi[1] để biết thêm thông tin.

token hóa
Ngắt / mã hóa một chuỗi thành các thành phần bằng cách sử dụng các hàm ICU ubrk_open,
ubrk_setText, ... Quy tắc là một trong số:

l
Hàng. ICU: UBRK_LINE.

s
Câu. ICU: UBRK_SENTENCE.

w
Từ. ICU: UBRK_WORD.

c
Tính cách. ICU: UBRK_CHARACTER.

t
Tiêu đề. ICU: UBRK_TITLE.

VÍ DỤ


Lệnh sau phân tích văn bản trong văn bản tệp bằng cách sử dụng chuỗi cấu hình chuỗi ICU chain.xml:

văn bản mèo | yaz-icu -c chain.xml

Chain.xml có thể trông như sau:





z"/>




Sử dụng yaz-icu trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad




×
quảng cáo
❤️Mua sắm, đặt phòng hoặc mua tại đây — không mất phí, giúp duy trì các dịch vụ miễn phí.