Đây là lệnh htload có thể chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình mô phỏng trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
htload - đọc trong phiên bản văn bản ASCII của cơ sở dữ liệu tài liệu
SYNOPSIS
htload [tùy chọn]
MÔ TẢ
Htload đọc phiên bản văn bản ASCII của cơ sở dữ liệu tài liệu ở dạng tương tự như
-t tùy chọn của htdig và htdump. Lưu ý rằng điều này sẽ ghi đè lên dữ liệu trong cơ sở dữ liệu của bạn,
vì vậy điều này nên được sử dụng hết sức cẩn thận.
LỰA CHỌN
-a Sử dụng các tập tin công việc thay thế. Yêu cầu htload nối thêm .công việc đến các tệp cơ sở dữ liệu, cho phép
nó hoạt động trên tập cơ sở dữ liệu thứ hai.
-c tập tin cấu hình
Sử dụng các tập tin cấu hình thay vì mặc định.
-i Ban đầu. Không sử dụng bất kỳ cơ sở dữ liệu cũ nào. Điều này được thực hiện bằng cách đầu tiên xóa
cơ sở dữ liệu.
-v Chế độ chi tiết. Điều này không có nhiều tác dụng.
Tập tin Định dạng
Tài liệu Cơ sở dữ liệu
Mỗi dòng trong tệp bắt đầu bằng id tài liệu theo sau là danh sách tên trường :
giá trị được phân tách bằng các tab. Các trường luôn xuất hiện theo thứ tự được liệt kê bên dưới:
u URL
t Yêu sách
a Trạng thái (0 = bình thường, 1 = không tìm thấy, 2 = không được lập chỉ mục, 3 = lỗi thời)
m Thời gian sửa đổi lần cuối theo báo cáo của máy chủ
s Kích thước tính bằng byte
H Trích
h Mô tả Meta
l Thời gian truy xuất lần cuối
L Đếm số liên kết trong tài liệu (liên kết đi)
b Đếm số liên kết đến tài liệu (liên kết đến hoặc liên kết ngược)
c HopCount của tài liệu này
g Chữ ký của tài liệu được sử dụng để phát hiện trùng lặp
e Địa chỉ e-mail để sử dụng cho một tin nhắn thông báo từ htnotify
n Ngày gửi tin nhắn e-mail thông báo
S Chủ đề cho một tin nhắn e-mail thông báo
d Văn bản của các liên kết trỏ đến tài liệu này. (ví dụ: <a
href = "/ docURL"> mô tả)
A Neo trong tài liệu (tức là
Từ Cơ sở dữ liệu
Mặc dù htdump và htload không xử lý trực tiếp cơ sở dữ liệu từ nhưng nó có giá trị
đề cập đến nó ở đây vì bạn cần phải xử lý nó khi sao chép ASCII
cơ sở dữ liệu từ hệ thống này sang hệ thống khác. Cơ sở dữ liệu từ ban đầu do htdig sản xuất
đã ở định dạng ASCII và phiên bản nhị phân của nó được tạo ra bởi htmerge, cho
sử dụng bởi htsearch. Vì vậy, khi bạn sao chép qua phiên bản ASCII của cơ sở dữ liệu tài liệu
do htdump sản xuất, bạn cũng cần sao chép qua danh sách từ, sau đó chạy htload để
tạo cơ sở dữ liệu tài liệu nhị phân trên hệ thống đích, tiếp theo là chạy htmerge
để tạo chỉ mục từ.
Mỗi dòng trong tệp danh sách từ bắt đầu bằng từ
theo sau là danh sách tên trường : giá trị được phân tách bằng các tab. Các trường luôn xuất hiện
theo thứ tự được liệt kê bên dưới, với hai tùy chọn cuối cùng là tùy chọn:
i ID tài liệu
l Vị trí của từ trong tài liệu (1 đến 1000)
w Trọng lượng của từ dựa trên các yếu tố cho điểm
c Số lần xuất hiện của từ trong tài liệu, nếu nhiều hơn 1
a Số neo nếu từ xuất hiện sau một liên kết được đặt tên
Sử dụng htload trực tuyến bằng dịch vụ onworks.net