Đây là ứng dụng Windows có tên Heritrix: Internet Archive Web Crawler có bản phát hành mới nhất có thể được tải xuống dưới tên heritrix-1.8.0.jar. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng có tên Heritrix: Internet Archive Web Crawler với OnWorks này miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động bất kỳ trình giả lập trực tuyến OS OnWorks nào từ trang web này, nhưng trình giả lập trực tuyến Windows tốt hơn.
- 5. Từ Hệ điều hành Windows OnWorks bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng và cài đặt nó.
- 7. Tải xuống Wine từ kho phần mềm phân phối Linux của bạn. Sau khi cài đặt, bạn có thể nhấp đúp vào ứng dụng để chạy chúng với Wine. Bạn cũng có thể thử PlayOnLinux, một giao diện đẹp mắt trên Wine sẽ giúp bạn cài đặt các chương trình và trò chơi phổ biến của Windows.
Wine là một cách để chạy phần mềm Windows trên Linux, nhưng không cần Windows. Wine là một lớp tương thích Windows mã nguồn mở có thể chạy các chương trình Windows trực tiếp trên bất kỳ máy tính để bàn Linux nào. Về cơ bản, Wine đang cố gắng triển khai lại đủ Windows từ đầu để nó có thể chạy tất cả các ứng dụng Windows đó mà không thực sự cần đến Windows.
Heritrix: Trình thu thập thông tin lưu trữ trên Internet
Ad
MÔ TẢ
Dự án trình thu thập thông tin lưu trữ đang xây dựng Heritrix: một trình thu thập thông tin web linh hoạt, có thể mở rộng, mạnh mẽ và có thể mở rộng có khả năng tìm nạp, lưu trữ và phân tích toàn bộ sự đa dạng và rộng rãi của nội dung có thể truy cập internet.Tính năng
- khai thác sâu sắc và kỹ lưỡng nội dung trang web
- hoạt động trên bất kỳ nền tảng Java nào (khuyến nghị Linux)
- lưu trữ nội dung sang định dạng tổng hợp / bản ghi ISO WARC hoặc ISO WARC
- giao diện web để kiểm soát người vận hành và giám sát thu thập thông tin
Khán giả
Người dùng cuối nâng cao, Nhà phát triển, Giáo dục, Chính phủ, Công nghệ thông tin, Tổ chức phi lợi nhuận
Giao diện người dùng
Dựa trên web
Ngôn ngữ lập trình
Java
Môi trường cơ sở dữ liệu
Berkeley / Sleepycat / Gdbm (DBM)
Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/archive-crawler/. Nó đã được lưu trữ trên OnWorks để có thể chạy trực tuyến một cách dễ dàng nhất từ một trong những Hệ thống hoạt động miễn phí của chúng tôi.
