Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

mmorph - Trực tuyến trên đám mây

Chạy mmorph trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh mmorph có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


mmorph - Công cụ hình thái MULTEXT

SYNOPSIS


thông tin:
biến thái [ -vh ]

chỉ phân tích cú pháp:
biến thái -y | -z [ -a thêm tập tin ]
-m tập tin hình thái [ -d debug_map ] [ -l tệp nhật ký ] [ trong tập tin [ ô uế ]]

phát ra:
biến thái -c | -n [ -t Mức độ vết ] [ -s Mức độ vết ] [ -a thêm tập tin ]
-m tập tin hình thái [ -d debug_map ] [ -l tệp nhật ký ] [ trong tập tin [ ô uế ]]

tra cứu đơn giản:
biến thái [ -fi ] [ -b | -k ] [ -r từ chối hồ sơ ]
-m tập tin hình thái [ -d debug_map ] [ -l tệp nhật ký ] [ trong tập tin [ ô uế ]]

bản ghi / tra cứu trường:
biến thái -C các lớp học [ -fU ] [ -E | -O ] [ -b | [ -k ] [ -B tốt nghiệp lớp XNUMX ]]
-m tập tin hình thái [ -d debug_map ] [ -l tệp nhật ký ] [ trong tập tin [ ô uế ]]

kết xuất cơ sở dữ liệu:
biến thái -p | -NS
-m tập tin hình thái [ -d debug_map ] [ -l tệp nhật ký ] [ trong tập tin [ ô uế ]]

MÔ TẢ


Trong chế độ hoạt động đơn giản nhất, chỉ với -m tập tin hình thái Tùy chọn, biến thái hoạt động trong
chế độ tra cứu: nó sẽ mở một cơ sở dữ liệu hiện có được gọi là morphfile.db và tra cứu tất cả
đoạn chuỗi (thường tương ứng với các từ) trong đầu vào.

Để tạo cơ sở dữ liệu từ các mục từ vựng được chỉ định trong "morphfile", hãy sử dụng -c -m
tập tin hình thái. Tập tin tập tin hình thái.db không nên tồn tại. Khi cơ sở dữ liệu hoàn tất, nó sẽ
tra cứu các phân đoạn trong đầu vào. Nếu được sử dụng không hiệu quả (đầu vào và đầu ra là một thiết bị đầu cuối),
dấu nhắc được in khi chương trình mong đợi người dùng nhập một chuỗi phân đoạn. Không
nhắc nhở xảy ra trong chế độ ghi / trường.

Để kiểm tra các ứng dụng quy tắc trên các mục từ vựng được chỉ định trong tập tin hình thái, không có
tạo cơ sở dữ liệu và không cần tìm kiếm các phân đoạn, hãy sử dụng -n -m tập tin hình thái. Điều này
tự động đặt mức theo dõi thành 1 nếu nó không được chỉ định.

Để thực hiện các thao tác tương tự như trên, nhưng trên tập hợp các mục từ vựng thay thế
in thêm tập tin, sử dụng tùy chọn bổ sung -a thêm tập tin. Các mục từ vựng trong morphfile sẽ là
mặc kệ. Điều này rất hữu ích khi bổ sung vào mô tả hình thái chuẩn.
Lưu ý rằng các mục nhập đã được thêm vào cơ sở dữ liệu morphfile.db không thay thế những cái hiện có.

Độ đáng tin của đến thử nghiệm a hình thái Mô tả
Sử dụng -n Lựa chọn. Trong phần Ngữ pháp, hãy chỉ định các quy tắc mục tiêu sẽ phù hợp với
kết quả. Trong phần Từ vựng chỉ định các mục từ vựng bạn muốn kiểm tra. Khi chạy
tất cả các quy tắc sẽ được áp dụng (đệ quy) cho các mục từ vựng, nếu quy tắc là một mục tiêu, thì
kết quả của ứng dụng được in trên đầu ra.

Gợi ý: Đặt hai phần được đề cập ở trên (quy tắc mục tiêu và phần Lexicon) riêng biệt
các tệp và tham chiếu các tệp này với một #include chỉ thị nơi chúng sẽ xảy ra trong
tệp đầu vào chính.

Nếu bạn đang sử dụng mô tả hiện có và chỉ muốn kiểm tra các mục từ vựng mới, hãy sử dụng
các tùy chọn -n -a thêm tập tin, và đặt các mục từ vựng vào thêm tập tin.

LỰA CHỌN


-a thêm tập tin
Bỏ qua các mục từ vựng trong morphfile, lấy chúng từ thêm tập tin thay thế.

-B tốt nghiệp lớp XNUMX
Chỉ định lớp bản ghi xuất hiện trước đầu câu.
Các từ viết hoa xuất hiện ngay sau các bản ghi như vậy cũng sẽ được tra cứu với tất cả
các chữ cái của chúng được chuyển đổi thành chữ thường (theo LC_CTYPE, xem bên dưới).

-b trường hợp gấp trước khi tra cứu. Chữ hoa được chuyển thành chữ thường
(theo LC_CTYPE, xem bên dưới) trước khi một từ được tra cứu.

-C các lớp học
Xác định chế độ ghi / trường. Chỉ định các lớp bản ghi sẽ được xem xét
hướng lên. Tên lớp phải được phân tách bằng dấu phẩy ",", TAB, dấu cách, thanh "|" hoặc dấu gạch chéo ngược
"\".

-c Tạo một cơ sở dữ liệu mới để tra cứu. Tên của tệp đã tạo là tên của
tập tin hình thái (-m tùy chọn) với hậu tố .db. Nó không nên tồn tại; nếu nó tồn tại thì người dùng
nên xóa nó theo cách thủ công trước khi chạy biến thái -c (đây là một biện pháp bảo vệ tối thiểu
chống lại việc vô tình ghi đè cơ sở dữ liệu mà có thể đã mất nhiều thời gian để
tạo ra).

-d debug_map
Chỉ định tùy chọn gỡ lỗi nào được muốn. Mỗi bit trong debug_map tương ứng với một
tùy chọn.
mục đích thập lục phân bit thập phân
không có bit 0 0x0 không có tùy chọn gỡ lỗi (mặc định)
Khởi tạo gỡ lỗi 1 1 0x1
2 2 0x2 gỡ lỗi phân tích cú pháp yacc
3 4 tổ hợp quy tắc gỡ lỗi 0x4
Ứng dụng chính tả gỡ lỗi 4 8 ​​0x8
5 thống kê in 16 0x10 với các tùy chọn -p hoặc -q
tất cả các bit -1 0xffff tất cả các tùy chọn gỡ lỗi cho dù chúng là gì
Để kết hợp các tùy chọn, hãy thêm các giá trị thập phân hoặc thập lục phân với nhau. Ví dụ: -t 0x5
chỉ định các bit (tùy chọn) 1 và 4.

-E Trong chế độ bản ghi / trường, mở rộng các chú thích hình thái học nếu chúng đã tồn tại (
mặc định là để nguyên các chú thích hiện có).

-O Ở chế độ ghi / trường, hãy ghi đè các chú thích về hình thái học nếu chúng đã tồn tại
(mặc định là giữ nguyên các chú thích hiện có).

-f Xả đầu ra sau mỗi lần tra cứu phân đoạn. Điều này chỉ hữu ích nếu đầu vào và đầu ra
được chuyển từ và đến một chương trình cần đồng bộ hóa chúng.

-h In trợ giúp và thoát.

-i Thêm trước kết quả của mỗi lần tra cứu với số nhận dạng của phân đoạn đầu vào nó
tương ứng với. Hiện tại các phân đoạn đầu vào được xác định bằng số thứ tự của chúng,
bắt đầu từ 0. Với chỉ báo này, vạch mới phân tách các dung dịch
đối với các phân đoạn đầu vào khác nhau không được in vì nó không cần thiết. Nếu tra cứu
không có giải pháp nào, chỉ có mã định danh phân đoạn được in trên đầu ra. Phân khúc
số nhận dạng cũng được thêm vào trước các phân đoạn bị từ chối. Một tab luôn theo sau
định danh phân đoạn.

-k trường hợp gấp dự phòng. Nếu tra cứu từ không thành công, thì hãy chuyển đổi tất cả các chữ hoa thành
viết thường và thử tra cứu lại. (chuyển đổi được thực hiện theo LC_CTYPE, xem
dưới đây).

-l tệp nhật ký
Chỉ định tệp để ghi dấu vết và thông báo lỗi. Mặc định là lỗi tiêu chuẩn.

-m tập tin hình thái
Chỉ định tệp chứa mô tả hình thái học. Nhìn thấy biến thái (5) cho một
mô tả về cú pháp của chủ nghĩa hình thức.

-n Không cần tạo hoặc tra cứu cơ sở dữ liệu (chế độ kiểm tra).

-p Kết xuất cơ sở dữ liệu cấu trúc tính năng đã nhập vào outfile (hoặc đầu ra tiêu chuẩn). Các
số lượng tfs riêng biệt được đưa ra trong logfile (hoặc lỗi tiêu chuẩn) nếu bit 5 của gỡ lỗi
tùy chọn được thiết lập.

-q Kết xuất các biểu mẫu trong cơ sở dữ liệu ra tệp tin (hoặc đầu ra tiêu chuẩn). Một số thống kê
được đưa ra trong tệp nhật ký (hoặc lỗi chuẩn) nếu bit 5 của tùy chọn gỡ lỗi được đặt.

-r từ chối hồ sơ
Ở chế độ không ghi / trường, chỉ định tệp nơi ghi các phân đoạn đầu vào
không thể được tra cứu. Mặc định là lỗi tiêu chuẩn.

-s Mức độ vết
Ứng dụng quy tắc chính tả theo dõi:
0 không có dấu vết (mặc định).
1 dấu vết hình thức bề mặt hợp lệ.
2 quy tắc theo dõi có phần từ vựng khớp với nhau.
3 dấu vết bề mặt trái khớp ngữ cảnh (cấu trúc từ bề mặt).
4 dấu vết bề mặt bên phải không phù hợp ngữ cảnh và quy tắc chặn.
5 quy tắc theo dõi không chặn.
Một trace_level ngụ ý tất cả các cấp trước đó.

-t Mức độ vết
Chỉ định mức độ theo dõi cho ứng dụng quy tắc:
0 không có dấu vết (mặc định).
1 quy tắc mục tiêu theo dõi được áp dụng.
2 theo dõi tất cả các quy tắc áp dụng, thụt lề cho biết độ sâu đệ quy.
10 quy tắc theo dõi cũng đã được thử nhưng không được áp dụng
Một trace_level ngụ ý tất cả các cấp trước đó.

-U Trong chế độ ghi / trường, các từ không xác định (tức là đã được tra cứu không thành công) là
được chú thích bằng ?? \ ??.

-v Phiên bản in và thoát.

-y Chỉ phân tích cú pháp: không xử lý mô tả ngoài việc kiểm tra cú pháp. Trong khi
phát triển một mô tả hình thái học, bạn có thể sử dụng tùy chọn này để bắt lỗi cú pháp
nhanh chóng sau mỗi lần sửa đổi trước khi chạy nó "cho thực tế".

-z ngụ ý -y. Phân tích cú pháp và xuất các mô tả từ vựng ở dạng chuẩn hóa.

trong tập tin tệp chứa các phân đoạn cần tra cứu, một phân đoạn trên mỗi dòng. Mặc định là tiêu chuẩn
đầu vào.

ô uế
tệp trong đó đầu ra của chương trình được viết. Một dòng cho mỗi giải pháp.
Các giải pháp của các phân đoạn đầu vào khác nhau được phân tách bằng một dòng trống. Mặc định là
đầu ra tiêu chuẩn.

WORD NGỮ PHÁP CHÍNH TẢ QUY TẮC


Để biết chi tiết về các nguyên tắc và cơ chế được sử dụng trong biến hình, vui lòng tham khảo trước
các tài liệu được trích dẫn trong phần XEM CŨNG CÓ bên dưới.

Các mô tả hình thái tổng hợp được phác thảo ngắn gọn được viết cho mmorph mô tả các từ như thế nào
được xây dựng bằng cách ghép các morpheme và quá trình ghép nối này thay đổi như thế nào
cách viết của những morphemes này. Phần đầu tiên, ngữ pháp cấu trúc từ, được chỉ định
bởi các quy tắc viết lại tự do ngữ cảnh hạn chế có chủ nghĩa hình thức được lấy cảm hứng từ sự thống nhất dựa trên
hệ thống (xem Shieber 1986). Phần thứ hai, thay đổi chính tả, được chỉ định bởi
các quy tắc chính tả trong một chủ nghĩa hình thức dựa trên mô hình hình thái hai cấp độ. Cách tiếp cận này
đến hình thái học được mô tả trong Ritchie, Russell et. al, 1992 và ngắn gọn hơn ở Pulman
và Hepple 1993.

MÔI TRƯỜNG BIẾN


Để quyết định những ký tự nào có thể hiển thị trên đầu ra, biến thái sử dụng ngôn ngữ
mô tả cụ thể rằng định vị(3) đặt theo biến môi trường
LC_CTYPE. Đối với các ngôn ngữ được xử lý trong MULTEXT, bạn nên có
biến được đặt thành iso_8859_1.

VÍ DỤ


Dưới đây là tóm tắt về cách sử dụng phổ biến của các tùy chọn mmorph:

biến thái -n -m tập tin hình thái
Chế độ kiểm tra: đọc toàn bộ morphfile và in kết quả về lỗi tiêu chuẩn. Không có cơ sở dữ liệu
được tạo, không có từ nào được tra cứu.

biến thái -c -m tập tin hình thái
Tạo cơ sở dữ liệu: đọc toàn bộ morphfile và lưu trữ kết quả trong cơ sở dữ liệu
(morphfile.db). Các cấu trúc tính năng đã nhập được thu thập trong một tệp riêng biệt
(morphfile.tfs). Đầu vào chuẩn được đọc cho các từ cần tra cứu trong cơ sở dữ liệu mới.

biến thái -m tập tin hình thái
Chế độ tra cứu: chỉ đọc các phần Bảng chữ cái, Thuộc tính và Loại của morphfile.
Đầu vào chuẩn được đọc cho các từ cần tra cứu theo cơ sở dữ liệu hiện có
(mmorphfile.db và morphfile.tfs).

biến thái -m tập tin hình thái -a thêm tập tin
Chế độ bổ sung: bỏ qua phần Lexicon của morphfile, nhưng addfile được tham khảo, và
kết quả được thêm vào cơ sở dữ liệu. Đầu vào chuẩn được đọc cho các từ cần tra cứu
theo cơ sở dữ liệu tăng cường (mmorphfile.db và morphfile.tfs).

CHẨN ĐOÁN


Các thông báo lỗi phải được tự giải thích. Vui lòng tham khảo trước biến thái(5) cho một chính thức
mô tả về cú pháp.

Sử dụng mmorph trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

  • 1
    VÒI
    VÒI
    SWIG là một công cụ phát triển phần mềm
    kết nối các chương trình được viết bằng C và
    C ++ với nhiều cấp độ cao
    ngôn ngữ lập trình. SWIG được sử dụng với
    khác nhau...
    Tải xuống SWIG
  • 2
    Chủ đề WooCommerce Nextjs React
    Chủ đề WooCommerce Nextjs React
    Chủ đề React WooCommerce, được xây dựng với
    JS tiếp theo, Webpack, Babel, Node và
    Express, sử dụng GraphQL và Apollo
    Khách hàng. Cửa hàng WooCommerce trong React (
    chứa: Sản phẩm ...
    Tải xuống Chủ đề phản ứng WooC Commerce Nextjs
  • 3
    Archlabs_repo
    Archlabs_repo
    Gói repo cho ArchLabs Đây là một
    ứng dụng cũng có thể được tìm nạp
    từ
    https://sourceforge.net/projects/archlabs-repo/.
    Nó đã được lưu trữ trong OnWorks ở...
    Tải xuống archlabs_repo
  • 4
    Dự án Zephyr
    Dự án Zephyr
    Dự án Zephyr là một thế hệ mới
    hệ điều hành thời gian thực (RTOS)
    hỗ trợ nhiều phần cứng
    kiến trúc. Nó dựa trên một
    hạt nhân có dấu chân nhỏ ...
    Tải xuống dự án Zephyr
  • 5
    SCons
    SCons
    SCons là một công cụ xây dựng phần mềm
    đó là một sự thay thế vượt trội so với
    công cụ xây dựng "Make" cổ điển
    tất cả chúng ta đều biết và yêu thích. SCons là
    thực hiện một ...
    Tải xuống SCons
  • 6
    PSeInt
    PSeInt
    PSeInt là trình thông dịch mã giả cho
    sinh viên lập trình nói tiếng Tây Ban Nha.
    Mục đích chính của nó là trở thành một công cụ để
    học và hiểu cơ bản
    quan niệm ...
    Tải xuống PSeInt
  • Khác »

Lệnh Linux

Ad