GoGPT Best VPN GoSearch

Biểu tượng yêu thích OnWorks

Heritrix: Internet Archive Web Crawler tải xuống cho Windows

Tải xuống miễn phí ứng dụng Windows Heritrix: Internet Archive Web Crawler để chạy trực tuyến Wine trong Ubuntu trực tuyến, Fedora trực tuyến hoặc Debian trực tuyến

Đây là ứng dụng Windows có tên Heritrix: Internet Archive Web Crawler có bản phát hành mới nhất có thể được tải xuống dưới tên heritrix-1.8.0.jar. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks cho máy trạm.

Tải xuống và chạy trực tuyến ứng dụng có tên Heritrix: Internet Archive Web Crawler với OnWorks này miễn phí.

Làm theo các hướng dẫn sau để chạy ứng dụng này:

- 1. Đã tải ứng dụng này xuống PC của bạn.

- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.

- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.

- 4. Khởi động bất kỳ trình giả lập trực tuyến OS OnWorks nào từ trang web này, nhưng trình giả lập trực tuyến Windows tốt hơn.

- 5. Từ Hệ điều hành Windows OnWorks bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.

- 6. Tải xuống ứng dụng và cài đặt nó.

- 7. Tải xuống Wine từ kho phần mềm phân phối Linux của bạn. Sau khi cài đặt, bạn có thể nhấp đúp vào ứng dụng để chạy chúng với Wine. Bạn cũng có thể thử PlayOnLinux, một giao diện đẹp mắt trên Wine sẽ giúp bạn cài đặt các chương trình và trò chơi phổ biến của Windows.

Wine là một cách để chạy phần mềm Windows trên Linux, nhưng không cần Windows. Wine là một lớp tương thích Windows mã nguồn mở có thể chạy các chương trình Windows trực tiếp trên bất kỳ máy tính để bàn Linux nào. Về cơ bản, Wine đang cố gắng triển khai lại đủ Windows từ đầu để nó có thể chạy tất cả các ứng dụng Windows đó mà không thực sự cần đến Windows.

Heritrix: Trình thu thập thông tin lưu trữ trên Internet


Ad


MÔ TẢ

Dự án trình thu thập thông tin lưu trữ đang xây dựng Heritrix: một trình thu thập thông tin web linh hoạt, có thể mở rộng, mạnh mẽ và có thể mở rộng có khả năng tìm nạp, lưu trữ và phân tích toàn bộ sự đa dạng và rộng rãi của nội dung có thể truy cập internet.

Tính năng

  • khai thác sâu sắc và kỹ lưỡng nội dung trang web
  • hoạt động trên bất kỳ nền tảng Java nào (khuyến nghị Linux)
  • lưu trữ nội dung sang định dạng tổng hợp / bản ghi ISO WARC hoặc ISO WARC
  • giao diện web để kiểm soát người vận hành và giám sát thu thập thông tin


Khán giả

Người dùng cuối nâng cao, Nhà phát triển, Giáo dục, Chính phủ, Công nghệ thông tin, Tổ chức phi lợi nhuận


Giao diện người dùng

Dựa trên web


Ngôn ngữ lập trình

Java


Môi trường cơ sở dữ liệu

Berkeley / Sleepycat / Gdbm (DBM)


Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/archive-crawler/. Nó đã được lưu trữ trên OnWorks để có thể chạy trực tuyến một cách dễ dàng nhất từ ​​một trong những Hệ thống hoạt động miễn phí của chúng tôi.


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad




×
quảng cáo
❤️Mua sắm, đặt phòng hoặc mua tại đây — không mất phí, giúp duy trì các dịch vụ miễn phí.