Đây là lệnh htdump có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MAC OS
CHƯƠNG TRÌNH:
TÊN
htdump - viết phiên bản văn bản ASCII của cơ sở dữ liệu tài liệu
SYNOPSIS
htdump [tùy chọn]
MÔ TẢ
Htdump viết ra phiên bản văn bản ASCII của cơ sở dữ liệu tài liệu ở dạng tương tự như
-t tùy chọn của htdig.
LỰA CHỌN
-a Sử dụng các tệp công việc thay thế. Nói với htdump để nối thêm .công việc đến các tệp cơ sở dữ liệu, cho phép
nó hoạt động trên tập cơ sở dữ liệu thứ hai.
-c tập tin cấu hình
Sử dụng các tập tin cấu hình thay vì mặc định.
-v Chế độ chi tiết. Điều này không có nhiều tác dụng.
Tập tin Định dạng
Tài liệu Cơ sở dữ liệu
Mỗi dòng trong tệp bắt đầu bằng id tài liệu theo sau là danh sách tên trường :
giá trị được phân tách bằng các tab. Các trường luôn xuất hiện theo thứ tự được liệt kê bên dưới:
u URL
t Yêu sách
a Trạng thái (0 = bình thường, 1 = không tìm thấy, 2 = không được lập chỉ mục, 3 = lỗi thời)
m Thời gian sửa đổi lần cuối theo báo cáo của máy chủ
s Kích thước tính bằng byte
H Trích
h Mô tả Meta
l Thời gian truy xuất lần cuối
L Đếm số liên kết trong tài liệu (liên kết đi)
b Đếm số liên kết đến tài liệu (liên kết đến hoặc liên kết ngược)
c HopCount của tài liệu này
g Chữ ký của tài liệu được sử dụng để phát hiện trùng lặp
e Địa chỉ e-mail để sử dụng cho một tin nhắn thông báo từ htnotify
n Ngày gửi tin nhắn e-mail thông báo
S Chủ đề cho một tin nhắn e-mail thông báo
d Văn bản của các liên kết trỏ đến tài liệu này. (ví dụ: <a
href = "/ docURL"> mô tả)
A Neo trong tài liệu (tức là
Từ Cơ sở dữ liệu
Mặc dù htdump và htload không xử lý trực tiếp cơ sở dữ liệu từ nhưng nó có giá trị
đề cập đến nó ở đây vì bạn cần phải xử lý nó khi sao chép ASCII
cơ sở dữ liệu từ hệ thống này sang hệ thống khác. Cơ sở dữ liệu từ ban đầu do htdig sản xuất
đã ở định dạng ASCII và phiên bản nhị phân của nó được tạo ra bởi htmerge, cho
sử dụng bởi htsearch. Vì vậy, khi bạn sao chép qua phiên bản ASCII của cơ sở dữ liệu tài liệu
do htdump sản xuất, bạn cũng cần sao chép qua danh sách từ, sau đó chạy htload để
tạo cơ sở dữ liệu tài liệu nhị phân trên hệ thống đích, tiếp theo là chạy htmerge
để tạo chỉ mục từ.
Mỗi dòng trong tệp danh sách từ bắt đầu bằng từ
theo sau là danh sách tên trường : giá trị được phân tách bằng các tab. Các trường luôn xuất hiện
theo thứ tự được liệt kê bên dưới, với hai tùy chọn cuối cùng là tùy chọn:
i ID tài liệu
l Vị trí của từ trong tài liệu (1 đến 1000)
w Trọng lượng của từ dựa trên các yếu tố cho điểm
c Số lần xuất hiện của từ trong tài liệu, nếu nhiều hơn 1
a Số neo nếu từ xuất hiện sau một liên kết được đặt tên
Sử dụng htdump trực tuyến bằng các dịch vụ onworks.net