Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

SWISH-RUN - Online in the Cloud

Chạy SWISH-RUN trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks trên Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

Đây là lệnh SWISH-RUN có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


SWISH-RUN - Chạy Swish-e và chuyển đổi dòng lệnh

TỔNG QUAN


Chương trình Swish-e được điều khiển bởi các đối số dòng lệnh (được gọi là các thiết bị chuyển mạch). Thông thường, nó
được chạy thủ công từ shell (dấu nhắc lệnh) hoặc từ một chương trình như tập lệnh CGI
chuyển các đối số dòng lệnh sang swish.

Lưu ý: Một số công tắc dòng lệnh có thể được chỉ định trong cấu hình Swish-e
tệp được chỉ định bằng đối số dòng lệnh "-c". Vui lòng xem SWISH-CONFIG để biết
mô tả đầy đủ các chỉ thị tập tin cấu hình có sẵn.

Có hai chế độ hoạt động cơ bản của Swish-e: lập chỉ mục và tìm kiếm. Có lệnh
đối số dòng duy nhất cho từng chế độ và các đối số khác áp dụng cho cả hai (nhưng có thể có
nghĩa khác nhau tùy thuộc vào chế độ hoạt động). Các đối số dòng lệnh này là
liệt kê dưới đây, được nhóm theo:

INDEXING -- mô tả các đối số dòng lệnh được sử dụng trong khi lập chỉ mục.

TÌM KIẾM - liệt kê các đối số dòng lệnh được sử dụng trong khi tìm kiếm.

CÔNG CỤ KHÁC - liệt kê các công tắc không áp dụng cho tìm kiếm hoặc lập chỉ mục.

Bắt đầu với Swish-e phiên bản 2.1, bạn có thể nhúng công cụ tìm kiếm của nó vào
các ứng dụng. Vui lòng xem THƯ VIỆN SWISH.

CHỈ SỐ


Lập chỉ mục Swish-e được bắt đầu bằng cách chuyển lệnh hàng đối số để vung vẩy. Lệnh
đối số dòng được sử dụng cho tìm kiếm được mô tả trong TÌM KIẾM. Ngoài ra, hãy xem SWISH-SEARCH để biết
ví dụ về tìm kiếm với Swish-e.

Cách sử dụng Swish-e:

swish-e [-i tập tin thư mục ...] [-c tập tin] [-f tập tin] [-l] \
[-v (num)] [-S phương thức(fs⎪http⎪prog)] [-N path]

Công tắc "-h" (trợ giúp) sẽ liệt kê các đối số dòng lệnh Swish-e có sẵn:

swish-e -h

Thông thường, hầu hết nếu không phải tất cả các cài đặt lập chỉ mục đều được đặt trong tệp cấu hình (được chỉ định
bằng công tắc "-c"). Khi tệp cấu hình được thiết lập, việc lập chỉ mục sẽ được bắt đầu dưới dạng:

swish-e -c /path/to/config/file

Xem SWISH-CONFIG để biết thông tin về tệp cấu hình.

Lưu ý Bảo mật: Nếu tệp nhị phân swish được đặt tên tìm kiếm nhanh sau đó swish sẽ không cho phép bất kỳ
thao tác có thể khiến swish ghi vào tệp chỉ mục.

Khi lập chỉ mục, có thể nên lập chỉ mục vào một tệp tạm thời, sau đó lập chỉ mục
đã hoàn thành thành công việc đổi tên tệp đến vị trí cuối cùng. Điều này đặc biệt
quan trọng khi thay thế một chỉ mục hiện đang được sử dụng.

swish-e -c swish.config -f index.tmp
[kiểm tra mã trả về từ swish hoặc tìm kiếm lỗi: đầu ra]
mv index.tmp index.swish-e

Lập chỉ mục Lệnh Dòng Lập luận

-i *thư mục và/hoặc tệp* (tệp đầu vào)
Điều này chỉ định các thư mục và/hoặc tập tin cần lập chỉ mục. Các thư mục sẽ được lập chỉ mục
đệ quy. Điều này thường được chỉ định trong tệp cấu hình với Chỉ mụcDir
chỉ thị thay vì trên dòng lệnh. Việc sử dụng công tắc này sẽ ghi đè
cài đặt tệp cấu hình.

-S [fs⎪http⎪prog] (nguồn tài liệu/chế độ truy cập)
Điều này chỉ định phương pháp sử dụng để truy cập tài liệu vào chỉ mục. Có thể là "fs"
để lập chỉ mục cục bộ thông qua hệ thống tệp (mặc định), "http" để tìm kiếm hoặc "prog"
để đọc tài liệu từ một chương trình bên ngoài.

Nằm trong thư mục "conf" là các tệp cấu hình ví dụ minh họa
lập chỉ mục bằng các phương pháp nguồn tài liệu khác nhau.

Xem SWISH-FAQ để biết thảo luận về các phương pháp lập chỉ mục khác nhau và
sự khác biệt giữa việc tìm kiếm bằng phương pháp http so với sử dụng phương pháp hệ thống tệp.

fs - hệ thống tập tin
Phương thức "fs" chỉ đọc các tệp từ ổ đĩa cục bộ (hoặc được nối mạng). Đây là
phương thức mặc định nếu khóa chuyển "-S" không được chỉ định. Xem SWISH-CONFIG để biết
chỉ thị cấu hình dành riêng cho phương thức "fs".

http - nhện máy chủ web
Phương thức "http" được sử dụng cho các máy chủ web nhện. Nó sử dụng một trợ giúp đi kèm
chương trình được gọi là nhện vung. Xem SWISH-CONFIG để biết chỉ thị cấu hình
dành riêng cho phương pháp "http".

Lưu ý Bảo mật: Trong Windows, swish chuyển các URL được tìm nạp từ các tài liệu từ xa
thông qua shell (swish sử dụng hệ thống () lệnh chạy nhện vung Dưới
Windows) và điều này có thể được coi là một rủi ro bảo mật bổ sung.

Phương thức "http" không được dùng nữa (hoặc ít nhất là không được đánh giá cao). Coi như
sử dụng phương pháp "prog" được mô tả bên dưới để thu thập dữ liệu. Có một chương trình nhện
có sẵn trong prog-bin thư mục để sử dụng với phương pháp "prog". Đây là một
số hạn chế với phương pháp này được giải quyết bằng phương pháp "prog":

* swishspider chỉ có các liên kết chuẩn của nhện. Khung và khác
liên kết không được theo sau.

* Theo mặc định, phương pháp tìm kiếm này chỉ lập chỉ mục các tệp có nội dung
loại "text/*" (ví dụ: text/plain, text/html, text/xml). Bạn nên sử dụng
"DefaultContents" và "IndexContents" để ánh xạ phần mở rộng tệp tới các trình phân tích cú pháp được sử dụng
bằng swish (ví dụ: "IndexContents HTML* .html .htm"), nhưng điều này sẽ thất bại khi
tài liệu không có phần mở rộng tập tin.

* Chỉ thị "FileFilter" của Swish-e có thể được sử dụng với phương thức truy cập "http",
mặc dù nó yêu cầu một quy trình riêng biệt (ngoài swsihspider
Process) cho mỗi tài liệu được lọc.

* Các mô-đun SWISH::Filter có thể được sử dụng với chương trình swishspider.
SWISH::Filter cung cấp hệ thống lọc cho mục đích chung (xem SWISH::Filter
tài liệu). Để sử dụng SWISH::Filter, hãy đặt Perl5LIB để trỏ đến vị trí của
không gian tên mô-đun SWISH (thường là /usr/local/lib/swish-e trong Unix).
Ví dụ:

xuất PERL5LIB=/usr/local/lib/swish-e # bash, shell bourne
setenv PERL5LIB /usr/local/lib/swish-e # csh, tcsh

hoặc trong Windows

đặt PERL5LIB=c:\tệp chương trình\swish-e2.4\lib\swish-e

SWISH::Filter không được bật theo mặc định do chi phí tải
mô-đun cho mọi tài liệu được tìm nạp.

Bản phân phối Swish-e bao gồm các mô-đun Perl trong SWISH::Filters::*
không gian tên để chuyển đổi các tài liệu phi văn bản sang định dạng mà Swish-e có thể
phân tích dễ dàng. Như đã đề cập ở trên, tập lệnh trợ giúp nhện vung sẽ sử dụng những thứ này
các mô-đun nếu có thể được tìm thấy thông qua PERL5LIB. Các mô-đun này chỉ cung cấp một giao diện
tới các chương trình thực hiện chuyển đổi. Ví dụ: bạn sẽ cần tải xuống
và cài đặt chương trình "catdoc" để chuyển đổi tài liệu MSWord thành văn bản cho
lập chỉ mục. Xin vui lòng xem bộ lọc/README để xem cách sử dụng hệ thống lọc này.

prog - phương pháp truy cập mục đích chung
Phương pháp "prog" là phương pháp mới đối với Swish-e phiên bản 2.2. Nó được thiết kế như một tổng thể
phương pháp mục đích để nạp tài liệu sang swish từ một chương trình bên ngoài.

Ví dụ: chương trình bên ngoài có thể đọc cơ sở dữ liệu (ví dụ MySQL), duyệt web
máy chủ hoặc chuyển đổi tài liệu từ định dạng này sang định dạng khác (ví dụ: pdf sang html). Hoặc,
bạn có thể chỉ cần sử dụng nó để đọc các tập tin của hệ thống tập tin (như "-S fs"), tuy nhiên
cung cấp cho bạn toàn quyền kiểm soát những tập tin được lập chỉ mục.

Tên chương trình bên ngoài để chạy được chuyển tới swish bởi IndexDir
chỉ thị hoặc thông qua tùy chọn "-i".

Chương trình được chỉ định phải là đường dẫn tuyệt đối vì swish-e sẽ cố gắng stat ()
chương trình để đảm bảo nó tồn tại. Swish thực hiện điều này để giúp báo cáo lỗi.

Nếu chương trình được chỉ định bằng -i hoặc IndexDir không phải là đường dẫn tuyệt đối (tức là
không bao gồm "/" ) thì swish-e sẽ nối thêm thư mục "libexecdir" được xác định
trong quá trình cấu hình. Thông thường, libexecdir được đặt thành "$prefix/lib/swish-e"
(/usr/local/lib/swish-e), nhưng phụ thuộc vào nền tảng và cài đặt. Đang chạy
swish-e -h sẽ báo cáo thư mục.

Ví dụ: chương trình -S prog "spider.pl" là chương trình trợ giúp Perl để sử dụng với
-S prog và được cài đặt trong libexecdir.

IndexDir nhện.pl
SwishProgParameter mặc định http://localhost/index.html

và swish-e sẽ tìm thấy Spider.pl trong libexecdir.

Các tham số bổ sung có thể được chuyển tới chương trình bên ngoài thông qua
Chỉ thị SwishProgParameter. Trong ví dụ trên, swish-e sẽ chuyển hai
tham số cho Spider.pl, "mặc định" và "http://localhost/index.html".

Một tên đặc biệt "stdin" có thể được sử dụng với "-i" hoặc IndexDir để yêu cầu swish đọc
từ đầu vào tiêu chuẩn thay vì từ một chương trình bên ngoài. Xem ví dụ dưới đây.

Chương trình bên ngoài in ra đầu ra tiêu chuẩn (chụp nhanh) một bộ
các tiêu đề theo sau là nội dung của tệp cần lập chỉ mục. Đầu ra trông tương tự như
một thông báo email hoặc một tài liệu HTTP được máy chủ web trả về trong đó nó bao gồm
cặp tên/giá trị của tiêu đề, một dòng trống và nội dung.

Độ dài nội dung được xác định bởi tiêu đề có độ dài nội dung được cung cấp cho swish bởi
chương trình; không có ký tự hoặc cờ "kết thúc bản ghi" nào được gửi giữa các tài liệu.
Do đó, điều quan trọng là tiêu đề có độ dài nội dung phải chính xác. Đây là một
nguồn sai sót phổ biến.

Một ưu điểm của phương pháp này (ví dụ như sử dụng các bộ lọc) là
chương trình bên ngoài chỉ được chạy một lần cho toàn bộ công việc lập chỉ mục, thay vì một lần cho
mọi tài liệu. Điều này tránh việc phân nhánh và tạo ra một quy trình mới cho mỗi
tài liệu và tạo ra sự khác biệt lớn khi chương trình bên ngoài của bạn giống như
perl có chi phí khởi động lớn.

Đây là một ví dụ đơn giản được viết bằng Perl:

#!/usr/local/bin/Perl -w
Sử dụng nghiêm ngặt;

#Xây dựng tài liệu
tài liệu $ của tôi = <


Tiêu đề tài liệu


Đây là văn bản.


EOF

# Chuẩn bị tiêu đề cho swish
$path = 'Example.file' của tôi;
kích thước $ của tôi = chiều dài $doc;
$mtime của tôi = thời gian;

# Xuất tài liệu (sang swish)
in <
Tên đường dẫn: $path
Độ dài nội dung: $size
Lần cuối cùng: $mtime
Loại tài liệu: HTML*

EOF

in $doc;

Chương trình bên ngoài chuyển sang chuyển đổi tiêu đề. Tiêu đề được tách ra khỏi
nội dung của tài liệu có một dòng trống. Các tiêu đề có sẵn là:

Tên đường dẫn:
Đây là tên của tập tin bạn đang lập chỉ mục. Đây có thể là bất kỳ chuỗi nào, vì vậy đối với
ví dụ: nó có thể là ID của bản ghi trong cơ sở dữ liệu, URL hoặc một tệp đơn giản
tên.

Tiêu đề này là bắt buộc.

Thời lượng nội dung:
Tiêu đề này chỉ định độ dài tính bằng byte của tài liệu theo sau
tiêu đề. Độ dài này phải chính xác bằng độ dài của tài liệu -- không tạo
sai lầm khi thêm dòng bổ sung vào cuối tài liệu.

Tiêu đề này là bắt buộc.

Lần trước:
Tham số Thi là thời gian sửa đổi cuối cùng của tệp và phải là thời gian
tem (giây kể từ Kỷ nguyên trên nền tảng của bạn).

Tiêu đề này không bắt buộc.

Loại tài liệu:
Bạn có thể ghi đè quyết định loại tài liệu của swish ("Nội dung chỉ mục") bằng cách
bằng cách sử dụng tiêu đề "Loại tài liệu:". Loại tài liệu được sử dụng để chọn
trình phân tích cú pháp Swish-e sử dụng để phân tích nội dung của tài liệu.

Ví dụ: một chương trình nhện có thể ánh xạ kiểu nội dung được trả về từ một trang web
máy chủ thành một trong những loại mà Swish-e hiểu. Ví dụ,

$doc_type = 'HTML*' if $response->content_type =~ m!text/html!' của tôi

Tiêu đề này không bắt buộc.

Chế độ cập nhật:
Khi cập nhật chỉ mục gia tăng, tiêu đề này có thể được sử dụng để chọn chế độ
để cập nhật chỉ mục. Có ba giá trị có thể:

Cập nhật
Hủy bỏ
Chỉ số

"Cập nhật" sẽ cập nhật chỉ mục với tệp đã cho nếu ngày của tệp đã cho
tệp mới hơn ngày của tệp đã có trong chỉ mục. Cài đặt thành
"Cập nhật" cũng giống như sử dụng -u trên dòng lệnh.

Chế độ "Xóa" sẽ xóa tệp được chỉ định bởi tiêu đề Tên đường dẫn. Cài đặt
"Xóa" cũng giống như sử dụng -r trên dòng lệnh.

"Index" sẽ thêm tệp vào chỉ mục. LƯU Ý: swish-e sẽ không kiểm tra xem liệu
tập tin đã tồn tại.

Nếu tiêu đề này không được chỉ định thì mặc định là chế độ được chỉ định trên
dòng lệnh (-u, -r hoặc không).

Tùy chọn này vẫn đang thử nghiệm và có thể thay đổi trong tương lai. Hỏi
trong danh sách Swish-e trước khi sử dụng.

Chương trình ví dụ trên chỉ trả về một tài liệu và thoát ra, điều này không thực sự hiệu quả.
hữu ích. Thông thường, chương trình của bạn sẽ đọc dữ liệu từ một số nguồn, chẳng hạn như tệp hoặc
cơ sở dữ liệu, định dạng dưới dạng XML, HTML hoặc văn bản và chuyển chúng sang swish, lần lượt
khác. Tiêu đề "Độ dài nội dung:" cho biết vị trí kết thúc của mỗi tài liệu --
không có bất kỳ ký tự hoặc điểm đánh dấu "kết thúc bản ghi" đặc biệt nào.

Để lập chỉ mục với ví dụ trên, bạn cần đảm bảo rằng chương trình được
có thể thực thi được (và đường dẫn đến Perl là chính xác), sau đó gọi lệnh swish tới
chạy ở chế độ "prog" và tên chương trình được sử dụng làm đầu vào.

% chmod 755 ví dụ.pl
% ./swish-e -S prog -i ./example.pl

Các chương trình có thể và nên được kiểm tra trước khi chạy swish. Ví dụ:

% ./example.pl > test.out

Một vài chương trình ví dụ hữu ích hơn được cung cấp trong bản phân phối swish-e
nằm trong prog-bin danh mục. Một số bao gồm tài liệu:

% cd chương trình bin
% perldoc nhện.pl

Những ví dụ khác là những ví dụ nhỏ bao gồm các nhận xét:

% cd chương trình bin
% ít hơn DirTree.pl

Sản phẩm nhện.pl chương trình có thể được sử dụng để thay thế cho -S http phương pháp. Nó là
giàu tính năng hơn nhiều và cung cấp nhiều quyền kiểm soát hơn đối với việc lập chỉ mục.

Nếu bạn sử dụng tên chương trình đặc biệt "stdin" với "-i" hoặc IndexDir thì swish-e
sẽ đọc từ đầu vào tiêu chuẩn thay vì từ một chương trình. Ví dụ:

% ./example.pl --count=1000 /path/to/data ⎪ ./swish-e -S prog -i stdin

Về cơ bản, điều này giống như sử dụng tệp cấu hình swish-e của:

SwishProgParameter --count=1000/path/to/data
IndexDir ./example.pl

trong một tập tin cấu hình và đang chạy

% ./swish-e -S prog -c swish.conf

Điều này mang lại một cách dễ dàng để chạy swish mà không cần tệp cấu hình có "-S prog"
chương trình yêu cầu tham số. Điều đó cũng có nghĩa là bạn có thể thu thập dữ liệu vào một tệp
và sau đó lập chỉ mục thêm một lần nữa với cùng một dữ liệu:

% ./example.pl /path/to/data --count=1000 > docs.txt
% cat docs.txt ⎪ ./swish-e -S prog -i stdin -c normal_index
% cat docs.txt ⎪ ./swish-e -S prog -i stdin -cuzzy_index

Sử dụng "stdin" cũng có thể hữu ích cho các chương trình gọi swish (thay vì swish
gọi chương trình).

(Lý do "stdin" được sử dụng thay cho dấu gạch ngang "-" phổ biến hơn là do
cách thối nát phân tích dòng lệnh. Điều này sẽ được khắc phục trong tương lai.)

Phương thức "prog" bỏ qua một số tham số cấu hình có sẵn cho
phương pháp hệ thống tệp -- các cài đặt như "IndexOnly", "FileRules", "FileMatch" và
"FollowSymLinks" bị bỏ qua khi sử dụng phương pháp "prog". Người ta mong đợi rằng
các thao tác này được thực hiện tốt hơn trong chương trình bên ngoài trước khi chuyển qua
tài liệu vào swish. Nói cách khác, khi sử dụng phương thức "prog", chỉ gửi
các tài liệu cần chuyển đổi mà bạn muốn lập chỉ mục.

Bạn có thể sử dụng tính năng lọc của swish với phương pháp "prog", nhưng hiệu suất sẽ bị ảnh hưởng.
tốt hơn nếu bạn chạy các chương trình lọc từ bên trong chương trình bên ngoài của mình. Xem thêm
bộ lọc/README để biết ví dụ về cách dễ dàng thêm chuyển đổi và lọc tài liệu
vào các chương trình dựa trên Perl của bạn.

Chú ý khi nào sử dụng -S ăn xin on MS Windows

Windows không sử dụng dòng shebang (#!) của chương trình để xác định chương trình
chạy. Vì vậy, khi chạy một chương trình Perl chẳng hạn, bạn có thể cần chỉ định
nhị phân perl.exe làm chương trình và sử dụng "SwishProgParameters" để đặt tên cho
tập tin.

IndexDir e:/perl/bin/perl.exe
SwishProgParameter read_database.pl

Swish sẽ thay thế dấu gạch chéo tiến bằng dấu gạch chéo ngược trước khi chạy lệnh
được chỉ định bằng "IndexDir". Swish sử dụng bật ra(3) lệnh vượt qua
lệnh thông qua shell.

-f *indexfile* (tệp chỉ mục)
Nếu bạn đang lập chỉ mục, phần này chỉ định tệp để lưu chỉ mục được tạo vào và bạn
chỉ có thể chỉ định một tập tin. Xem thêm Tệp chỉ mục trong tệp cấu hình.

Nếu bạn đang tìm kiếm, phần này chỉ định các tệp chỉ mục (một hoặc nhiều) để tìm kiếm. Các
tệp chỉ mục mặc định là index.swish-e trong thư mục hiện tại.

-c *file ...* (tệp cấu hình)
Chỉ định (các) tệp cấu hình sẽ sử dụng để lập chỉ mục. Tập tin này chứa nhiều
các chỉ thị kiểm soát cách Swish-e tiến hành. Xem SWISH-CONFIG để biết danh sách đầy đủ
của các chỉ thị tập tin cấu hình.

Ví dụ:

swish-e -c docs.conf

Nếu bạn chỉ định một thư mục để lập chỉ mục, một tệp chỉ mục hoặc tùy chọn dài dòng trên
dòng lệnh, những giá trị này sẽ ghi đè bất kỳ giá trị nào được chỉ định trong tệp cấu hình.

Bạn có thể chỉ định nhiều tập tin cấu hình. Ví dụ, bạn có thể có một
tệp cấu hình có các cài đặt chung trên toàn trang và một tệp khác dành cho một cài đặt cụ thể
mục lục.

Ví dụ:

1) swish-e -c swish-e.conf
2) swish-e -i /usr/local/www -f index.swish-e -v -c swish-e.conf
3) swish-e -c swish-e.conf stopwords.conf

1 Các cài đặt trong tệp cấu hình sẽ được sử dụng để lập chỉ mục một trang web.

2 Các tùy chọn dòng lệnh này sẽ ghi đè mọi thứ trong tệp cấu hình.

3 Các biến trong swish-e.conf sẽ được đọc, sau đó là biến trong stopwords.conf
sẽ đọc. Lưu ý rằng nếu các biến giống nhau xuất hiện trong cả hai tệp, các giá trị cũ hơn
có thể được viết đè lên.

-e (chế độ tiết kiệm)
Đối với các trang web lớn, việc lập chỉ mục có thể yêu cầu nhiều RAM hơn mức có sẵn. Công tắc "-e"
yêu cầu swish sử dụng dung lượng ổ đĩa để lưu trữ cấu trúc dữ liệu trong khi lập chỉ mục, tiết kiệm bộ nhớ.
Tùy chọn này được khuyến nghị nếu swish sử dụng quá nhiều RAM khiến máy tính bắt đầu trao đổi
quá mức và bạn không thể tăng bộ nhớ khả dụng. Sự đánh đổi là hơi
thời gian lập chỉ mục lâu hơn và ổ đĩa bận.

-l (liên kết tượng trưng)
Việc chỉ định tùy chọn này sẽ yêu cầu swish đi theo các liên kết tượng trưng khi lập chỉ mục. Các
giá trị tập tin cấu hình TheoSymLinks sẽ ghi đè giá trị dòng lệnh.

Mặc định là không theo liên kết tượng trưng. Một cải tiến nhỏ về thời gian lập chỉ mục kết quả của tôi
khỏi việc kích hoạt FollowSymLinks vì swish không cần thống kê mọi thư mục và
tập tin được xử lý để xác định xem đó có phải là liên kết tượng trưng hay không.

-N đường dẫn (chỉ lập chỉ mục các tệp mới hơn)
Tùy chọn "-N" nhận đường dẫn đến một tệp và chỉ các tệp mới hơn hơn tập tin được chỉ định
sẽ được lập chỉ mục. Điều này hữu ích cho việc tạo các chỉ mục gia tăng -- nghĩa là các chỉ mục
chỉ chứa các tệp được thêm vào kể từ khi chỉ mục đầy đủ cuối cùng được tạo cho tất cả các tệp.

Ví dụ (ví dụ xấu)

swish-e -c config.file -N index.swish-e -f index.new

Điều này sẽ lập chỉ mục như bình thường, nhưng chỉ các tệp có ngày sửa đổi mới hơn
index.swish-e sẽ được lập chỉ mục.

Đây là một ví dụ tồi vì nó sử dụng index.swish-e mà người ta có thể cho là
ngày lập chỉ mục cuối cùng. Vấn đề là các tập tin có thể đã được thêm vào giữa
lập chỉ mục thời gian đọc thư mục và khi index.swish-e tập tin đã được tạo -- mà
có thể mất khá nhiều thời gian cho các công việc lập chỉ mục rất lớn.

Giải pháp duy nhất là ngăn chặn mọi bổ sung tệp mới trong khi quá trình lập chỉ mục đầy đủ đang chạy.
Nếu điều này là không thể thì sẽ tốt hơn một chút nếu làm điều này:

Lập chỉ mục đầy đủ:

chạm vào chỉ mục_time.file
swish-e -c config.file -f index.tmp
mv index.tmp index.full

Lập chỉ mục gia tăng:

swish-e -c config.file -N indexing_time.file -f index.tmp
mv index.tmp index.incremental

Sau đó tìm kiếm với

swish-e -w foo -f index.full index.incremental

hoặc hợp nhất các chỉ mục

swish-e -M index.full index.incremental index.tmp
mv index.tmp index.swish-e
swish-e -w foo

-r ** tăng dần chỉ số định dạng chỉ một** Tùy chọn "-r" đặt swish-e vào chế độ "xóa".
Bất kỳ tệp đầu vào nào (được cung cấp với tham số "-i" hoặc "IndexDir") đều bị xóa khỏi
chỉ mục hiện có.

Ví dụ:

swish-e -r -i file.html

sẽ loại bỏ tệp.html từ chỉ mục hiện có.

-u ** tăng dần chỉ số định dạng chỉ một** Tùy chọn "-u" đặt swish-e vào chế độ "cập nhật". Các
dấu thời gian của mỗi tệp đầu vào được so sánh với tệp tương ứng trong
chỉ số hiện có. Nếu swish-e gặp một tệp đầu vào chưa tồn tại trong
chỉ mục hoặc tồn tại với dấu thời gian cũ hơn tệp đầu vào, tệp đầu vào là
được cập nhật trong chỉ mục. Bất kỳ từ nào trong tệp đầu vào đã được thêm hoặc xóa đều được
được phản ánh như vậy trong chỉ mục.

Ví dụ:

swish-e -i file.html -u

sẽ cập nhật chỉ mục index.swish-e với nội dung của file.html. Nếu file.html là
mới, nó sẽ được thêm vào. Nếu file.html đã tồn tại trong chỉ mục, nội dung của nó sẽ
được cập nhật trong chỉ mục.

-v [0⎪1⎪2⎪3] (mức độ chi tiết)
Tùy chọn "-v" có thể nhận giá trị số từ 0 đến 3. Chỉ định 0 cho hoàn toàn
hoạt động im lặng và 3 cho các báo cáo chi tiết.

Nếu không có giá trị nào được đưa ra thì giả sử là 1. Xem thêm Báo cáo chỉ mục trong cấu hình
tập tin.

Cảnh báo và lỗi được báo cáo bất kể mức độ dài dòng. Ngoài ra, tất cả
lỗi và cảnh báo được viết theo tiêu chuẩn. Điều này là do lý do lịch sử (nhiều
các tập lệnh tồn tại để phân tích tiêu chuẩn cho các thông báo lỗi).

-W (0⎪1⎪2⎪3) (mức cảnh báo của trình phân tích cú pháp)
Nếu sử dụng trình phân tích cú pháp libxml2, mức cảnh báo trình phân tích cú pháp mặc định được đặt ở mức 2. Sử dụng
Tùy chọn "-W" để ghi đè mặc định đó. Thông thường, bạn có thể muốn tắt nó đi
toàn bộ:

swish-e -W0 -i đường dẫn/đến/tệp

sẽ âm thầm thất bại nếu trình phân tích cú pháp gặp bất kỳ lỗi nào.

ĐANG TÌM KIẾM


Các đối số dòng lệnh sau đây có sẵn khi tìm kiếm bằng Swish-e. Những cái này
các công tắc được sử dụng để chọn chỉ mục cần tìm kiếm, trường nào cần tìm kiếm, cách thức và nội dung
để in dưới dạng kết quả.

Phần này chỉ liệt kê các đối số dòng lệnh có sẵn và cách sử dụng chúng. Xin vui lòng xem
SWISH-SEARCH để biết hướng dẫn tìm kiếm chi tiết.

Cảnh báo: Nếu sử dụng Swish-e qua giao diện CGI, vui lòng xem CGI Danger!

Lưu ý Bảo mật: Nếu tệp nhị phân swish được đặt tên tìm kiếm nhanh sau đó swish sẽ không cho phép bất kỳ
thao tác có thể khiến swish ghi vào tệp chỉ mục.

Tìm kiếm Lệnh Dòng Lập luận

-w *word1 word2 ...* (từ truy vấn)
Điều này thực hiện tìm kiếm không phân biệt chữ hoa chữ thường bằng cách sử dụng một số từ khóa. Nếu không có tập tin chỉ mục
để tìm kiếm được chỉ định (thông qua khóa chuyển "-f"), swish-e sẽ cố gắng tìm kiếm một tệp có tên
index.swish-e trong thư mục hiện tại.

swish-e -w từ

Tìm kiếm cụm từ được thực hiện bằng cách đặt dấu phân cách trích dẫn (dấu ngoặc kép của
mặc định) xung quanh cụm từ tìm kiếm.

swish-e -w 'từ hoặc "cụm từ này"'

Tìm kiếm sẽ được bảo vệ khỏi shell bằng dấu ngoặc kép. Thông thường, đây là đơn
dấu ngoặc kép khi chạy trên Unix.

Trong Windows lệnh.com bạn có thể không cần sử dụng dấu ngoặc kép, nhưng bạn sẽ cần phải
dấu gạch chéo ngược các dấu ngoặc kép được sử dụng để phân cách các cụm từ:

swish-e -w \"một cụm từ\"

Dấu phân cách cụm từ có thể được đặt bằng công tắc "-P".

Việc tìm kiếm có thể bị giới hạn trong một Tên Meta. Ví dụ:

swish-e -w meta1=(foo hoặc baz)

sẽ chỉ tìm kiếm trong meta1 tag.

Vui lòng xem SWISH-SEARCH để biết mô tả về MetaNames

-f *file1 file2 ...* (tệp chỉ mục)
Chỉ định (các) tệp chỉ mục được sử dụng trong khi tìm kiếm. Nhiều tập tin có thể được liệt kê,
và mỗi tập tin sẽ được tìm kiếm. Nếu không có khóa chuyển "-f" nào được chỉ định thì tệp
index.swish-e trong thư mục hiện tại sẽ được sử dụng làm tệp chỉ mục.

-m *số* (kết quả tối đa)
Trong khi tìm kiếm, điều này chỉ định số lượng kết quả tối đa cần trả về. Mặc định
là trả về tất cả kết quả.

Công tắc này thường được sử dụng kết hợp với công tắc "-b" để trả về kết quả một
trang tại một thời điểm (được khuyến nghị đặc biệt cho các chỉ mục lớn).

-b *số* (kết quả bắt đầu)
Đặt bắt đầu kết quả tìm kiếm trả về (các bản ghi được đánh số từ 1). Công tắc này
có thể được sử dụng với nút chuyển "-m" để trả về kết quả theo nhóm hoặc trang.

Ví dụ:

swish-e -w 'word' -b 1 -m 20 # 'trang' đầu tiên
swish-e -w 'word' -b 21 -m 20 # giây 'trang'

-t HBthec (tìm kiếm theo ngữ cảnh)
Tùy chọn "-t" cho phép bạn tìm kiếm các từ chỉ tồn tại trong các thẻ HTML cụ thể.
Mỗi ký tự trong chuỗi bạn chỉ định trong đối số cho tùy chọn này đại diện cho một
thẻ khác để tìm kiếm từ đó. H có nghĩa là tất cả các thẻ HEAD, B là viết tắt của
Thẻ BODY, t là tất cả các thẻ TITLE, h là thẻ H1 đến H6 (tiêu đề), e là thẻ được nhấn mạnh
(đây có thể là B, I, EM hoặc MẠNH) và c là thẻ nhận xét HTML

chỉ tìm kiếm trong tiêu đề ( ) thẻ

swish-e -w từ -th

-d *string* (dấu phân cách)
Đặt dấu phân cách được sử dụng khi in kết quả. Theo mặc định, Swish-e tách
các trường đầu ra bằng một khoảng trắng và đặt dấu ngoặc kép xung quanh tiêu đề tài liệu. Cái này
đầu ra có thể khó phân tích, vì vậy nên sử dụng "-d" để chỉ định một ký tự
hoặc chuỗi được sử dụng làm dấu phân cách giữa các trường.

Chuỗi "dq" có nghĩa là "dấu ngoặc kép".

swish-e -w word -d , # char đơn
swish-e -w word -d :: # string
swish-e -w word -d '"' # dấu ngoặc kép trong Unix
swish-e -w word -d \" # dấu ngoặc kép trong Windows
swish-e -w word -d dq # dấu ngoặc kép

Các ký tự điều khiển sau đây cũng có thể được chỉ định: "\t \r \n \f".

Cảnh báo: Chuỗi này được truyền trực tiếp tới sprintf () và do đó làm lộ ra một sự an toàn
hố. Không cho phép dữ liệu người dùng đặt trực tiếp chuỗi định dạng -d.

-P *nhân vật*
Đặt dấu phân cách được sử dụng cho tìm kiếm cụm từ. Mặc định là dấu ngoặc kép """.

Một số ví dụ trong bash: (hãy cẩn thận với các siêu ký tự shell của bạn)

swish-e -P ^ -w 'title=^các từ trong một cụm từ^'
swish-e -P \' -w "title='các từ trong một cụm từ"'

-p *property1 property2 ...* (thuộc tính hiển thị)
Điều này khiến swish in thuộc tính được liệt kê trong kết quả tìm kiếm. Các thuộc tính
được trả về theo thứ tự chúng được liệt kê trong đối số "-p".

Các thuộc tính được xác định bởi Tên riêng chỉ thị trong tập tin cấu hình (xem
SWISH-CONFIG) và các thuộc tính cũng phải được xác định trong MetaNames. Swish lưu trữ văn bản
của tên meta như một tài sản, và sau đó sẽ trả về văn bản này trong khi tìm kiếm nếu điều này
tùy chọn được sử dụng.

Các thuộc tính rất hữu ích để trả về dữ liệu có trong tài liệu nguồn mà không cần
phải đọc lại tài liệu nguồn trong khi tìm kiếm. Ví dụ, đây có thể là
được sử dụng để trả về một mô tả tài liệu ngắn. Xem cũng xem Tài liệu mùa hè
Tên thuộc tính trong SWISH-CONFIG.

Để trả về thuộc tính chủ đề và danh mục trong khi lập chỉ mục.

swish-e -w word -p danh mục chủ đề

Thuộc tính được trả về trong dấu ngoặc kép. Nếu một thuộc tính chứa dấu ngoặc kép thì nó
HTML đã thoát chưa ("). Xem công tắc "-x" để biết phương pháp trả về nâng cao hơn
một danh sách các tài sản.

LƯU Ý: cần phải lập chỉ mục bằng chỉ thị PropertyNames thích hợp trong
tập tin cấu hình người dùng để sử dụng tùy chọn này.

-s *property [asc⎪desc] ...* (sắp xếp)
Thông thường, kết quả tìm kiếm được in ra theo thứ tự liên quan, với nội dung phù hợp nhất
được liệt kê đầu tiên. Công tắc sắp xếp "-s" cho phép bạn sắp xếp kết quả theo thứ tự được chỉ định
tài sản, nơi một tài sản được xác định bằng cách sử dụng MetaNamesTên thuộc tính
chỉ thị trong quá trình lập chỉ mục (xem SWISH-CONFIG).

Chuỗi được truyền có thể bao gồm các chuỗi "asc" và "desc" để chỉ định thứ tự sắp xếp,
và nhiều thuộc tính có thể được chỉ định để sắp xếp trên nhiều khóa.

Ví dụ:

sắp xếp theo thứ tự tăng dần thuộc tính tiêu đề

-s tiêu đề

sắp xếp giảm dần theo tiêu đề, tăng dần theo tên

-s tiêu đề mô tả tên asc

Lưu ý: Swish giới hạn các phím sắp xếp ở 100 ký tự. Giới hạn này có thể được thay đổi bằng cách thay đổi
MAX_SORT_STRING_LEN trong src/config.h và xây dựng lại swish-e.

-L giới hạn ở một phạm vi giá trị thuộc tính (Giới hạn)
T is an thử nghiệm đặc tính!

Công tắc "-L" có thể được sử dụng để giới hạn kết quả tìm kiếm trong một phạm vi giá trị thuộc tính

Ví dụ:

swish-e -w foo -L swishtitle sáng

tìm tất cả tài liệu có chứa từ "foo" và vị trí của tiêu đề tài liệu
phạm vi từ "a" đến "m", bao gồm. Theo mặc định, trường hợp thuộc tính bị bỏ qua,
nhưng điều này có thể được thay đổi bằng cách sử dụng chỉ thị cấu hình PropertyNamesCompareCase.

Việc giới hạn cũng có thể được thực hiện với các thuộc tính do người dùng xác định.

Ví dụ: nếu bạn lập chỉ mục các tài liệu chứa dấu thời gian đã tạo trong thẻ meta:



Sau đó, bạn nói với Swish rằng bạn có một thuộc tính tên là "created_on" và đó là một
dấu thời gian.

Tên thuộc tínhNgày tạo_on

Sau khi lập chỉ mục, bạn sẽ có thể giới hạn tài liệu trong một phạm vi dấu thời gian:

-w foo -L đã tạo_on 946684800 949363199

sẽ tìm thấy các tài liệu có chứa từ foo và có ngày được tạo từ
bắt đầu từ ngày 1/2000/31 đến hết ngày 2000/XNUMX/XNUMX.

Lưu ý: swish hiện không phân tích ngày tháng; Dấu thời gian Unix phải được sử dụng.

Hai định dạng đặc biệt có thể được sử dụng:

-L swishtitle <= m
-L swishtitle >= m

Tìm tiêu đề nhỏ hơn hoặc bằng hoặc lớn hơn hoặc bằng chữ cái "m".

Tính năng này sẽ không hoạt động với thuộc tính "swishrank" hoặc "swishdbfile".

Tính năng này tận dụng lợi thế của các bảng được sắp xếp trước được tạo bởi swish trong quá trình lập chỉ mục
để làm cho tính năng này nhanh chóng trong khi tìm kiếm. Bạn sẽ thấy trong kết quả lập chỉ mục một
dòng như:

6 thuộc tính được sắp xếp.

Điều đó chỉ ra rằng sáu bảng được sắp xếp trước đã được tạo trong quá trình lập chỉ mục. Theo mặc định, tất cả
các thuộc tính được sắp xếp trước trong khi lập chỉ mục. Những thuộc tính nào được sắp xếp trước có thể
được điều khiển bởi tham số cấu hình "PreSortedIndex".

Việc sử dụng khóa chuyển "-L" trên thuộc tính chưa được sắp xếp trước sẽ vẫn hoạt động, nhưng có thể
be nhiều chậm hơn trong quá trình tìm kiếm.

Lưu ý rằng cài đặt PropertyNamesSortKeyLength được sử dụng để sắp xếp các thuộc tính.
Việc sử dụng PropertyNamesSortKeyLength quá nhỏ có thể dẫn đến việc -L chọn sai
thuộc tính do sắp xếp không đầy đủ.

Đây là một tính năng thử nghiệm và việc sử dụng cũng như giao diện của nó có thể thay đổi.

-x chuỗi định dạng (định dạng đầu ra mở rộng)
Công tắc "-x" xác định chuỗi định dạng đầu ra. Chuỗi định dạng có thể chứa đơn giản
tên văn bản và thuộc tính (bao gồm tên thuộc tính nội bộ được xác định bằng swish) và được sử dụng
để tạo đầu ra cho mọi kết quả. Ngoài ra, định dạng đầu ra của
tên thuộc tính có thể được kiểm soát bằng chuỗi định dạng printf giống như C. Tính năng này
ghi đè các công tắc cmdline "-d" và "-p" và cảnh báo sẽ được tạo nếu "-d"
hoặc "-p" được sử dụng với "-x".

Cảnh báo: Chuỗi định dạng (fmt) được truyền trực tiếp tới sprintf () và do đó phơi bày
một lỗ hổng bảo mật. Không cho phép dữ liệu người dùng đặt trực tiếp chuỗi định dạng -x.

Ví dụ: để chỉ trả về tiêu đề, mỗi tiêu đề trên một dòng, trong kết quả tìm kiếm:

swish-e -w ... -x ' \N' ...

Lưu ý: "\n" có thể cần được bảo vệ khỏi shell của bạn.

Xem thêm ResultExtFormatName để biết cách xác định tên chuỗi định dạng trong swish
tập tin cấu hình.

Định dạng of "chuỗi định dạng":

"chữ chữ chữ..."

Ở đâu tên tài sản là:

* tên của thuộc tính người dùng như được chỉ định trong chỉ thị tệp cấu hình
"Tên tài sản"

* tên của thuộc tính Auto swish (xem bên dưới). Các thuộc tính này được xác định
tự động bằng swish -- bạn không cần chỉ định chúng bằng PropertyNames
chỉ thị. (Nó có thể thay đổi tương lai.)

tên thuộc tính phải được đặt trong "<" và ">".

người sử dang tính chất:

Swish-e cho phép bạn chỉ định một số thẻ META nhất định trong tài liệu của mình có thể được sử dụng
as tài liệu tài sản. Nội dung của bất kỳ thẻ META nào đã được xác định là
thuộc tính tài liệu có thể được trả về như một phần của kết quả tìm kiếm. Thuộc tính tài liệu
phải được xác định trong khi lập chỉ mục bằng cách sử dụng Tên thuộc tính chỉ thị cấu hình (xem
SWISH-CẤU HÌNH).

Ví dụ về Tên thuộc tính do người dùng xác định:







Tự động tính chất:

Swish xác định một số thuộc tính "Tự động" cho mỗi tài liệu được lập chỉ mục. đó là
có sẵn cho đầu ra khi sử dụng định dạng "-x".

Tên Loại Nội dung
-------------- ------- -------------------- ------------------
swishreccount Bộ đếm bản ghi kết quả số nguyên
swishtitle Chuỗi Tiêu đề tài liệu
swishrank Xếp hạng kết quả số nguyên cho lần truy cập này
swishdocpath Chuỗi URL hoặc đường dẫn tệp tới tài liệu
swishdocize Kích thước tài liệu nguyên theo byte
swishlastmodified Ngày Ngày sửa đổi cuối cùng của tài liệu
swishdescription Chuỗi mô tả tài liệu (xem: StoreDescription)
swishdbfile Đường dẫn chuỗi của tệp chỉ mục cơ sở dữ liệu swish

Các thuộc tính Tự động cũng có thể được chỉ định bằng phím tắt:

Tên thuộc tính lối tắt
-------- --------------
%c tài khoản swishreccount
%d mô tả lung tung
%D swishlast đã sửa đổi
%Tôi swishdbfile
%p swishdocpath
%r swishrank
%l swishdocize
%t swishtitle

Ví dụ: đây là tương đương:

-x ' : : \N'
-x '%r:%p:%t\n'

Sử dụng ký hiệu phần trăm kép "%%" để nhập ký hiệu phần trăm theo nghĩa đen ở đầu ra.

Chuỗi định dạng of tính chất:

Các thuộc tính được liệt kê trong chuỗi định dạng "-x" có thể bao gồm các chuỗi điều khiển định dạng. Những cái này
"propertyformats" được sử dụng để kiểm soát nội dung của thuộc tính liên quan như thế nào
được in. Các định dạng thuộc tính được sử dụng giống như các định dạng printf của ngôn ngữ C. Bất động sản
định dạng được chỉ định bằng cách bao gồm thuộc tính "fmt" trong thẻ thuộc tính.

Không thể sử dụng chuỗi định dạng bằng phím tắt "%" được mô tả ở trên.

Cú pháp chung:

-x ' '

trong đó "subfmt" kiểm soát định dạng đầu ra của "propertyname".

Ví dụ về chuỗi định dạng thuộc tính:

loại ngày:
kiểu chuỗi:
kiểu số nguyên:

Vui lòng xem các trang hướng dẫn để biết thời gian căng thẳng(3) chạy nước rút(3) để giải thích về
chuỗi định dạng. Lưu ý: một số phiên bản strftime không cung cấp chuỗi định dạng %s
(số giây kể từ Kỷ nguyên), do đó swish cung cấp chuỗi định dạng đặc biệt "%ld"
để hiển thị số giây kể từ Kỷ nguyên.

Ký tự đầu tiên của chuỗi định dạng thuộc tính xác định dấu phân cách cho định dạng
sợi dây. Ví dụ,

-x" ...\N"
-x" ...\N"
-x" ...\N"

Tiêu chuẩn xác định trước định dạng:

Nếu bạn bỏ qua định dạng phụ, các định dạng sau sẽ được sử dụng:

Kiểu chuỗi: "%s" (như printf char *)
Kiểu số nguyên: "%d" (như printf int)
Kiểu float: "%f" (như printf double)
Loại ngày: "%Y-%m-%d %H:%M:%S" (như strftime)

bản văn in "chuỗi định dạng" or "propfmtstr":

Văn bản sẽ được xuất ra dưới dạng chuỗi định dạng (và chuỗi định dạng thuộc tính). Đặc biệt
các ký tự có thể được thoát bằng dấu gạch chéo ngược. Để có một dòng mới cho mỗi lần truy cập kết quả,
bạn phải bao gồm Ký tự dòng mới "\n" ở cuối "fmtstr".

-x" ⎪ ⎪ \N"
-x "Đếm= , Xếp hạng= \N"
-x "Tiêu đề=\ \ "
-x 'Ngày: \N'
-x 'Ngày tính bằng giây: \N'

Kiểm soát/Thoát ký tự:

bạn có thể sử dụng các lối thoát điều khiển giống C trong chuỗi định dạng:

các điều khiển đã biết: \a, \b, \f, \n, \r, \t, \v,
chữ số thoát: \xhexdigits \0octaldigits
ký tự thoát: \anychar

Thí dụ,

swish -x "%c\t%r\t%p\t\" \"\N"

Các ví dụ of -x định dạng dây:

-x "%c⎪%r⎪%p⎪%t⎪%D⎪%d\n"
-x "%c⎪%r⎪%p⎪%t⎪ ⎪%d\n"
-x" \t \t \t \N
-x "xml_out: \ \>\ \N"
-x "xml_out: %s'> \N"

-H [0⎪1⎪2⎪3⎪ ] (mức độ chi tiết đầu ra của tiêu đề)
Công tắc "-H n" tạo ra phần mở rộng cú đội đầu đầu ra. Điều này hữu ích nhất khi tìm kiếm
nhiều tệp chỉ mục cùng một lúc bằng cách chỉ định nhiều tệp chỉ mục với
Công tắc "-f". "-H 2" sẽ tạo một tập hợp các tiêu đề cụ thể cho từng tệp chỉ mục. Cái này
cấp quyền truy cập vào các cài đặt được sử dụng để tạo từng tệp chỉ mục.

Ngay cả khi tìm kiếm một tệp chỉ mục, "-H n" sẽ cung cấp thêm thông tin
về tệp chỉ mục, cách nó được lập chỉ mục và cách thực hiện truy vấn.

-H 0 : không in thông tin tiêu đề, chỉ xuất ra các mục kết quả tìm kiếm.
-H 1 : in tiêu đề kết quả tiêu chuẩn (mặc định).
-H 2 : in thông tin tiêu đề bổ sung cho mỗi tệp chỉ mục được tìm kiếm.
-H 3 : đầu ra tiêu đề nâng cao (ví dụ: in mật khẩu).
-H 9 : in thông tin chẩn đoán ở header kết quả (được thay đổi từ: C<-v 4>)

-R [0⎪1] (Sơ đồ xếp hạng)
T is an thử nghiệm đặc tính!

Sơ đồ xếp hạng mặc định trong SWISH-E đánh giá từng từ trong truy vấn theo
tần suất và vị trí trong mỗi tài liệu. Lược đồ mặc định là 0.

Tính năng mới trong phiên bản 2.4.3, bạn có thể tùy ý chọn sơ đồ xếp hạng thử nghiệm, trong
ngoài tần suất và vị trí tài liệu, sử dụng Tần số tài liệu nghịch đảo (IDF) hoặc
tần số tương đối của mỗi từ trên tất cả các chỉ mục đang được tìm kiếm và
Mật độ tương đối hoặc sự chuẩn hóa tần số của một từ trong mối quan hệ với
số từ trong tài liệu.

LƯU Ý: IgnoreTotalWordCountWhenRanking phải được đặt thành Không or 0 trong (các) chỉ mục của bạn cho -R
1 để làm việc.

Chỉ định -R 1 để bật xếp hạng IDF. Xem tài liệu API để biết cách thiết lập
sơ đồ xếp hạng trong chương trình Perl hoặc C của bạn.

KHÁC Thiết bị chuyển mạch


-V (phiên bản)
In phiên bản hiện tại.

-k *letter* (in ra từ khóa)
Công tắc "-k" được sử dụng để thử nghiệm và sẽ khiến swish in ra tất cả các từ khóa trong
chỉ số bắt đầu bằng chữ cái đó. Bạn có thể nhập "-k '*'" để tạo danh sách
tất cả các từ được lập chỉ mục bởi swish.

-D *tệp chỉ mục* (chỉ mục gỡ lỗi)
Tùy chọn -D không còn được hỗ trợ trong phiên bản 2.2.

-T *options* (theo dõi/gỡ lỗi)
Tùy chọn -T được sử dụng để in ra thông tin có thể hữu ích khi gỡ lỗi
hoạt động của swish-e. Tùy chọn này thay thế tùy chọn "-D" của các phiên bản trước.

Chạy "-T help" sẽ in ra danh sách *tùy chọn* có sẵn

Sáp nhập Chỉ số Các tập tin


Trong các phiên bản trước của việc lập chỉ mục Swish-e sẽ yêu cầu một lượng bộ nhớ rất lớn và
quá trình lập chỉ mục có thể rất chậm. Việc hợp nhất cung cấp một cách để lập chỉ mục theo khối và
sau đó kết hợp các chỉ mục lại với nhau thành một chỉ mục duy nhất.

Việc lập chỉ mục hiện nhanh hơn nhiều và sử dụng ít bộ nhớ hơn và với chuyển đổi "-e" rất dễ dàng.
cần ít bộ nhớ để lập chỉ mục một trang web lớn.

Tuy nhiên, đôi khi việc hợp nhất các tệp chỉ mục khác nhau thành một tệp có thể hữu ích cho
đang tìm kiếm. Điều này có thể là do bạn muốn giữ các chỉ mục trang web riêng biệt và một chỉ mục chung
để tìm kiếm toàn cầu hoặc bạn có các bộ sưu tập tài liệu riêng biệt mà bạn muốn tìm kiếm
tất cả cùng một lúc, nhưng quản lý riêng biệt.

-M *index1 chỉ mục2 ... chỉ mụcN out_index
Hợp nhất các chỉ mục được chỉ định trên dòng lệnh -- tên tệp cuối cùng được nhập là
tập tin đầu ra. Chỉ mục đầu ra không được tồn tại (nếu không việc hợp nhất sẽ không được tiến hành).

Chỉ những chỉ mục được lập chỉ mục với cài đặt chung mới có thể được hợp nhất. (ví dụ không trộn
các chỉ mục có gốc và không có gốc hoặc các chỉ mục có cài đặt Ký tự Từ khác nhau,
vv).

Sử dụng khóa chuyển "-e" trong khi hợp nhất để giảm mức sử dụng bộ nhớ.

Hợp nhất tạo thông báo tiến trình bất kể cài đặt "-v".

-c *tập tin cấu hình*
Chỉ định tệp cấu hình trong khi lập chỉ mục để thêm thông tin quản trị vào
tập tin chỉ mục đầu ra.

Tài liệu Thông tin


$Id: SWISH-RUN.pod 1741 2005-05-17 02:22:40Z karman $

.

Sử dụng SWISH-RUN trực tuyến bằng dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

  • 1
    Bộ nạp khởi động Clover EFI
    Bộ nạp khởi động Clover EFI
    Dự án đã chuyển sang
    https://github.com/CloverHackyColor/CloverBootloader..
    Các tính năng: Khởi động macOS, Windows và Linux
    ở chế độ UEFI hoặc kế thừa trên Mac hoặc PC với
    UE...
    Tải xuống bộ tải khởi động Clover EFI
  • 2
    đoàn kết
    đoàn kết
    Tham gia cùng chúng tôi trong Gitter!
    https://gitter.im/unitedrpms-people/Lobby
    Bật kho lưu trữ URPMS trong
    hệ thống -
    https://github.com/UnitedRPMs/unitedrpms.github.io/bl...
    Tải về unitedrpms
  • 3
    Tăng cường thư viện C ++
    Tăng cường thư viện C ++
    Boost cung cấp di động miễn phí
    các thư viện C++ được đánh giá ngang hàng. Các
    nhấn mạnh vào các thư viện di động mà
    hoạt động tốt với Thư viện chuẩn C++.
    Xem http://www.bo...
    Tải xuống thư viện Boost C ++
  • 4
    VirtualGL
    VirtualGL
    VirtualGL chuyển hướng các lệnh 3D từ một
    Ứng dụng Unix / Linux OpenGL trên một
    GPU phía máy chủ và chuyển đổi
    kết xuất hình ảnh 3D thành một luồng video
    với cái gì ...
    Tải xuống VirtualGL
  • 5
    libusb
    libusb
    Thư viện để kích hoạt không gian người dùng
    các chương trình ứng dụng để giao tiếp với
    Thiết bị USB. Đối tượng: Nhà phát triển, Kết thúc
    Người dùng / Máy tính để bàn. Ngôn ngữ lập trình: C.
    Thể loại...
    Tải xuống libusb
  • 6
    VÒI
    VÒI
    SWIG là một công cụ phát triển phần mềm
    kết nối các chương trình được viết bằng C và
    C ++ với nhiều cấp độ cao
    ngôn ngữ lập trình. SWIG được sử dụng với
    khác nhau...
    Tải xuống SWIG
  • Khác »

Lệnh Linux

  • 1
    axetoniso
    axetoniso
    axetoniso - đồ họa giàu tính năng
    ứng dụng gắn và quản lý CD/DVD
    hình ảnh ...
    Chạy axetoniso
  • 2
    ace_gperf
    ace_gperf
    ace_gperf - tạo ra một hàm băm hoàn hảo
    chức năng từ một bộ khóa ...
    Chạy ace_gperf
  • 3
    coresendmsg
    coresendmsg
    coresendmsg - gửi tin nhắn API CORE
    đến daemon lõi-daemon ...
    Chạy coresendmsg
  • 4
    core_server
    core_server
    core_server - Máy chủ chính cho
    Thư rácBayes. MÔ TẢ: Hiện đang phục vụ
    chỉ giao diện web. Cắm vào
    người nghe cho các giao thức khác nhau là TBD.
    Điều này ...
    Chạy core_server
  • 5
    g.gui.gcpgrass
    g.gui.gcpgrass
    g.gui.gcp - Điều chỉnh địa lý bản đồ và
    cho phép quản lý các Điểm kiểm soát mặt đất.
    TỪ KHÓA: chung, GUI,
    định vị địa lý, GCP...
    Chạy g.gui.gcpgrass
  • 6
    g.gui.gmodelergrass
    g.gui.gmodelergrass
    g.gui.gmodeler - Người lập mô hình đồ họa.
    Cho phép tạo, chỉnh sửa tương tác
    và quản lý các mô hình. TỪ KHÓA: tổng quát,
    GUI, trình tạo mô hình đồ họa, quy trình làm việc ...
    Chạy g.gui.gmodelergrass
  • Khác »

Ad