Ini ialah arahan ucto yang boleh dijalankan dalam penyedia pengehosan percuma OnWorks menggunakan salah satu daripada berbilang stesen kerja dalam talian percuma kami seperti Ubuntu Online, Fedora Online, emulator dalam talian Windows atau emulator dalam talian MAC OS.
JADUAL:
NAMA
ucto - Unicode Tokenizer
SINOPSIS
ucto [[pilihan]] [input-fail] [[output-fail]]
DESCRIPTION
ucto ucto tokenizes fail teks: ia memisahkan perkataan daripada tanda baca, memisahkan ayat (dan
secara pilihan perenggan), dan mencari petikan berpasangan. Ucto diprakonfigurasikan dengan tokenisasi
peraturan untuk beberapa bahasa.
PILIHAN
-c fail konfigurasi
membaca tetapan daripada fail
-d nilai
tetapkan mod nyahpepijat kepada 'nilai'
-e nilai
tetapkan pengekodan input. (UTF8 lalai)
-f
lumpuhkan penapisan aksara khas
-L bahasa
Secara automatik memilih fail konfigurasi mengikut kod bahasa. cth 'fr' akan
pilih fail tokconfig-fr dari direktori pemasangan
-l
Tukar kepada semua huruf kecil
-u
Tukar kepada semua huruf besar
-n
Keluarkan satu ayat setiap baris pada output
-m
Andaikan satu ayat setiap baris pada input
--laluan
Jangan tokenize, tetapi lakukan penyahkodan input dan pengesanan peranan token mudah
-P
Lumpuhkan Pengesanan Perenggan
-Q
Dayakan Pengesanan Sebut Harga. (ini adalah percubaan dan mungkin membawa kepada keputusan yang tidak dijangka)
-S
Lumpuhkan Pengesanan Ayat
-s
Tetapkan penanda Akhir ayat. (Lalai )
-V
Tunjukkan maklumat versi
-v
tetapkan mod Verbose
-F
Baca dokumen XML FoLiA, tokenize dan keluarkan dokumen yang diubah suai. (ini melumpuhkan
penggunaan kebanyakan pilihan lain: -nulPQvsS)
--kelas teks CLS
Apabila menandakan dokumen XML FoLiA, cari nod teks kelas 'cls'
-X
Output FoLiA XML. (ini melumpuhkan penggunaan kebanyakan pilihan lain: -nulPQvsS)
--ID
Gunakan ID Dokumen yang ditentukan untuk XML FoLiA
-x (usang)
Output FoLiA XML, gunakan ID Dokumen yang ditentukan. (ini melumpuhkan penggunaan kebanyakan yang lain
pilihan: -nulPQvsS)
usang Penggunaan -X and --ID sebaliknya
Gunakan ucto dalam talian menggunakan perkhidmatan onworks.net