Tiếng AnhTiếng PhápTiếng Tây Ban Nha

Ad


Biểu tượng yêu thích OnWorks

wget - Trực tuyến trên đám mây

Chạy wget trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks qua Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

Đây là lệnh wget có thể được chạy trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks bằng cách sử dụng một trong nhiều máy trạm trực tuyến miễn phí của chúng tôi như Ubuntu Online, Fedora Online, trình giả lập trực tuyến Windows hoặc trình giả lập trực tuyến MAC OS

CHƯƠNG TRÌNH:

TÊN


Wget - Trình tải xuống mạng không tương tác.

SYNOPSIS


quên [tùy chọn] ... [URL] ...

MÔ TẢ


GNU Wget là một tiện ích miễn phí để tải xuống không tương tác các tệp từ Web. Nó
hỗ trợ các giao thức HTTP, HTTPS và FTP, cũng như truy xuất thông qua proxy HTTP.

Wget không tương tác, nghĩa là nó có thể hoạt động ở chế độ nền, trong khi người dùng thì không
đã đăng nhập. Điều này cho phép bạn bắt đầu truy xuất và ngắt kết nối khỏi hệ thống, cho phép
Quên hoàn thành công việc. Ngược lại, hầu hết các trình duyệt Web yêu cầu người dùng liên tục
hiện diện, có thể là một trở ngại lớn khi chuyển nhiều dữ liệu.

Wget có thể theo các liên kết trong các trang HTML, XHTML và CSS, để tạo các phiên bản cục bộ của điều khiển từ xa
các trang web, tái tạo đầy đủ cấu trúc thư mục của trang gốc. Đây là
đôi khi được gọi là "tải xuống đệ quy". Trong khi làm điều đó, Wget tôn trọng
Tiêu chuẩn loại trừ rô bốt (/robots.txt). Wget có thể được hướng dẫn để chuyển đổi các liên kết trong
các tệp đã tải xuống để trỏ vào các tệp cục bộ, để xem ngoại tuyến.

Wget đã được thiết kế để đảm bảo tính mạnh mẽ đối với các kết nối mạng chậm hoặc không ổn định; nếu một
tải xuống không thành công do sự cố mạng, nó sẽ tiếp tục thử lại cho đến khi toàn bộ tệp có
đã được truy xuất. Nếu máy chủ hỗ trợ lấy lại, nó sẽ hướng dẫn máy chủ tiếp tục
tải xuống từ nơi nó đã dừng lại.

Wget không hỗ trợ Danh sách Thu hồi Máy khách (CRL) nên chứng chỉ HTTPS bạn đang có
kết nối với có thể bị chủ sở hữu thu hồi.

LỰA CHỌN


Tùy chọn cú pháp
Vì Wget sử dụng GNU getopt để xử lý các đối số dòng lệnh, nên mọi tùy chọn đều có dạng dài
cùng với cái ngắn. Các tùy chọn dài sẽ thuận tiện hơn để ghi nhớ, nhưng mất thời gian để
loại. Bạn có thể tự do kết hợp các kiểu tùy chọn khác nhau hoặc chỉ định các tùy chọn sau lệnh-
đối số dòng. Vì vậy, bạn có thể viết:

wget -r --tries = 10 http://fly.srk.fer.hr/ -o nhật ký

Khoảng trống giữa tùy chọn chấp nhận một đối số và đối số có thể bị bỏ qua.
Thay vì -o đăng nhập bạn có thể viết -olog.

Bạn có thể đặt một số tùy chọn không yêu cầu đối số cùng nhau, chẳng hạn như:

wget -drc

Điều này hoàn toàn tương đương với:

wget -d -r -c

Vì các tùy chọn có thể được chỉ định sau các đối số, bạn có thể kết thúc chúng bằng --.
Vì vậy, sau đây sẽ cố gắng tải xuống URL -x, báo cáo không thành công đăng nhập:

wget -o log - -x

Các tùy chọn chấp nhận danh sách được phân tách bằng dấu phẩy đều tuân theo quy ước chỉ định
một danh sách trống sẽ xóa giá trị của nó. Điều này có thể hữu ích để xóa .wgetrc cài đặt. Vì
ví dụ, nếu của bạn .wgetrc đặt "lude_directories "thành / cgi-bin, ví dụ sau
trước tiên sẽ đặt lại nó, sau đó đặt nó để loại trừ / ~ không ai cả/ ~ ai đó. Bạn cũng có thể
xóa danh sách trong .wgetrc.

wget -X "-X / ~ không ai cả, / ~ ai đó

Hầu hết các tùy chọn không chấp nhận đối số là boolean các tùy chọn, được đặt tên như vậy vì
trạng thái có thể được ghi lại bằng một biến yes-or-no ("boolean"). Ví dụ, --theo dõi-ftp
yêu cầu Wget theo dõi các liên kết FTP từ các tệp HTML và mặt khác, - không cầu nói với nó
không thực hiện việc nhấp nháy tệp trên các URL FTP. Một tùy chọn boolean là khẳng định or
tiêu cực (bắt đầu bằng --không). Tất cả các tùy chọn như vậy chia sẻ một số thuộc tính.

Trừ khi được tuyên bố khác, người ta giả định rằng hành vi mặc định là ngược lại với những gì
tùy chọn hoàn thành. Ví dụ: sự tồn tại được ghi nhận của --theo dõi-ftp giả định
rằng mặc định là không theo các liên kết FTP từ các trang HTML.

Các tùy chọn khẳng định có thể bị phủ nhận bằng cách viết trước --không- đến tên tùy chọn; phủ định
các tùy chọn có thể bị phủ định bằng cách bỏ qua --không- tiếp đầu ngữ. Điều này có vẻ thừa --- nếu
mặc định cho một tùy chọn khẳng định là không làm điều gì đó, vậy tại sao lại cung cấp một cách để
rõ ràng tắt nó đi? Nhưng trên thực tế, tệp khởi động có thể thay đổi mặc định. Vì
ví dụ, sử dụng "follow_ftp = on" trong .wgetrc làm cho Wget theo Các liên kết FTP theo mặc định, và
sử dụng --no-theo-ftp là cách duy nhất để khôi phục cài đặt gốc từ lệnh
hàng.

Cơ bản Khởi động Các lựa chọn
-V
--phiên bản
Hiển thị phiên bản của Wget.

-h
--Cứu giúp
In thông báo trợ giúp mô tả tất cả các tùy chọn dòng lệnh của Wget.

-b
--lai lịch
Chuyển đến nền ngay lập tức sau khi khởi động. Nếu không có tệp đầu ra nào được chỉ định thông qua
-o, đầu ra được chuyển hướng đến nhật ký wget.

-e lệnh
--hành hình lệnh
Thực hiện lệnh như thể nó là một phần của .wgetrc. Một lệnh được gọi như vậy sẽ là
Thực thi sau khi các lệnh trong .wgetrc, do đó được ưu tiên hơn chúng. Nếu bạn cần
để chỉ định nhiều hơn một lệnh wgetrc, hãy sử dụng nhiều phiên bản của -e.

Logging Đầu vào Tập tin Các lựa chọn
-o tệp nhật ký
--output-file =tệp nhật ký
Ghi tất cả các tin nhắn vào tệp nhật ký. Các thông báo thường được báo cáo là lỗi tiêu chuẩn.

-a tệp nhật ký
--append-output =tệp nhật ký
Thêm vào tệp nhật ký. Điều này cũng giống như -o, chỉ nó gắn với tệp nhật ký thay vì
ghi đè lên tệp nhật ký cũ. Nếu như tệp nhật ký không tồn tại, một tệp mới được tạo.

-d
--gỡ lỗi
Bật đầu ra gỡ lỗi, có nghĩa là nhiều thông tin quan trọng đối với các nhà phát triển của Wget
nếu nó không hoạt động bình thường. Quản trị viên hệ thống của bạn có thể đã chọn biên dịch
Quên mà không có hỗ trợ gỡ lỗi, trong trường hợp đó -d sẽ không làm việc. Xin lưu ý rằng
biên dịch với hỗ trợ gỡ lỗi luôn an toàn --- Wget được biên dịch với hỗ trợ gỡ lỗi
sẽ không in bất kỳ thông tin gỡ lỗi nào trừ khi được yêu cầu với -d.

-q
--Yên lặng
Tắt đầu ra của Wget.

-v
--dài dòng
Bật đầu ra dài dòng, với tất cả dữ liệu có sẵn. Đầu ra mặc định là dài dòng.

-nv
- không dài dòng
Tắt tiết mà không hoàn toàn yên tĩnh (sử dụng -q cho điều đó), có nghĩa là
thông báo lỗi và thông tin cơ bản vẫn được in.

--report-speed =kiểu
Băng thông đầu ra dưới dạng kiểu. Giá trị được chấp nhận duy nhất là bit.

-i hồ sơ
--input-file =hồ sơ
Đọc URL từ cục bộ hoặc bên ngoài hồ sơ. Nếu - được chỉ định là hồ sơ, URL được đọc
từ đầu vào tiêu chuẩn. (Sử dụng ./- để đọc từ một tệp được đặt tên theo nghĩa đen -.)

Nếu chức năng này được sử dụng, không cần có URL nào trên dòng lệnh. Nếu có
Cả URL trên dòng lệnh và trong tệp đầu vào, những URL trên dòng lệnh sẽ
những người đầu tiên được truy xuất. Nếu như --force-html không được chỉ định, sau đó hồ sơ nên
bao gồm một loạt các URL, một URL trên mỗi dòng.

Tuy nhiên, nếu bạn chỉ định --force-html, tài liệu sẽ được coi là html. Trong đó
trong trường hợp bạn có thể gặp sự cố với các liên kết tương đối, bạn có thể giải quyết vấn đề này bằng cách thêm
"url ">" vào các tài liệu hoặc bằng cách chỉ định --base =url trên dòng lệnh.

Nếu hồ sơ là tài liệu bên ngoài, tài liệu sẽ tự động được coi là html if
các đối sánh Loại-Nội dung văn bản / html. Hơn nữa, hồ sơvị trí của sẽ là
được sử dụng ngầm định làm cơ sở href nếu không có mã nào được chỉ định.

--input-metalink =hồ sơ
Tải xuống các tệp được bao phủ trong Metalink cục bộ hồ sơ. Metalink phiên bản 3 và 4 là
được hỗ trợ.

--metallink-over-http
Đưa ra yêu cầu HTTP HEAD thay vì GET và trích xuất siêu dữ liệu Metalink từ phản hồi
tiêu đề. Sau đó, nó chuyển sang tải xuống Metalink. Nếu không có siêu dữ liệu Metalink hợp lệ
được tìm thấy, nó rơi trở lại tải xuống HTTP thông thường.

- vị trí ưu tiên
Đặt vị trí ưu tiên cho tài nguyên Metalink. Điều này có hiệu lực nếu nhiều tài nguyên
với cùng một mức độ ưu tiên có sẵn.

-F
--force-html
Khi đầu vào được đọc từ một tệp, buộc nó phải được coi như một tệp HTML. Điều này cho phép
bạn để truy xuất các liên kết tương đối từ các tệp HTML hiện có trên đĩa cục bộ của mình, bằng cách thêm
"url ">" sang HTML hoặc sử dụng --cơ sở tùy chọn dòng lệnh.

-B URL
--base =URL
Giải quyết các liên kết tương đối bằng cách sử dụng URL như điểm tham chiếu, khi đọc các liên kết từ
một tệp HTML được chỉ định thông qua -i/--tập tin đầu vào tùy chọn (cùng với --force-html, hoặc là
khi tệp đầu vào được tìm nạp từ xa từ máy chủ mô tả nó là HTML). Đây là
tương đương với sự hiện diện của thẻ "BASE" trong tệp đầu vào HTML, với URL như
giá trị cho thuộc tính "href".

Ví dụ: nếu bạn chỉ định http://foo/bar/a.html cho URLvà Wget đọc
../baz/b.html từ tệp đầu vào, nó sẽ được giải quyết thành http://foo/baz/b.html.

--config =FILE
Chỉ định vị trí của tệp khởi động mà bạn muốn sử dụng.

--rejected-log =tệp nhật ký
Ghi lại tất cả các từ chối URL vào tệp nhật ký dưới dạng các giá trị được phân tách bằng dấu phẩy. Các giá trị bao gồm
lý do từ chối, URL và URL chính mà nó được tìm thấy.

Tải về Các lựa chọn
--bind-address =ĐỊA CHỈ NHÀ
Khi tạo kết nối TCP / IP cho ứng dụng khách, hãy liên kết với ĐỊA CHỈ NHÀ trên máy cục bộ. ĐỊA CHỈ NHÀ
có thể được chỉ định làm tên máy chủ hoặc địa chỉ IP. Tùy chọn này có thể hữu ích nếu
máy liên kết với nhiều IP.

-t con số
--tries =con số
Đặt số lần thử để con số. Chỉ định 0 hoặc inf để thử lại vô hạn. Mặc định là
để thử lại 20 lần, ngoại trừ các lỗi nghiêm trọng như "kết nối bị từ chối" hoặc
"không tìm thấy" (404), không được thử lại.

-O hồ sơ
--output-document =hồ sơ
Các tài liệu sẽ không được ghi vào các tệp thích hợp, nhưng tất cả sẽ
được nối với nhau và viết vào hồ sơ. Nếu - Được sử dụng như hồ sơ, tài liệu sẽ được
được in ra đầu ra tiêu chuẩn, vô hiệu hóa chuyển đổi liên kết. (Sử dụng ./- để in ra một tập tin
được đặt tên theo nghĩa đen -.)

sử dụng -O is không có ý nghĩa đơn giản là "sử dụng tên hồ sơ thay vì cái trong
URL; "đúng hơn, nó tương tự như chuyển hướng shell: wget -O hồ sơ http://foo is
dự định làm việc như thế nào wget -O - http://foo > hồ sơ; hồ sơ sẽ được cắt ngắn ngay lập tức,
tất cả các nội dung tải xuống sẽ được viết ở đó.

Vì lý do này, -N (để kiểm tra dấu thời gian) không được hỗ trợ kết hợp với -O:
kể từ khi hồ sơ luôn được tạo mới, nó sẽ luôn có một dấu thời gian rất mới. MỘT
cảnh báo sẽ được đưa ra nếu sự kết hợp này được sử dụng.

Tương tự, sử dụng -r or -p với -O có thể không hoạt động như bạn mong đợi: Wget sẽ không chỉ tải xuống
tập tin đầu tiên hồ sơ và sau đó tải phần còn lại về tên bình thường của chúng: tất cả các
nội dung đã tải xuống sẽ được đưa vào hồ sơ. Điều này đã bị vô hiệu hóa trong phiên bản 1.11, nhưng có
đã được khôi phục (có cảnh báo) trong 1.11.2, vì có một số trường hợp điều này
hành vi thực sự có thể có một số công dụng.

Một sự kết hợp với -nc chỉ được chấp nhận nếu tệp đầu ra đã cho không tồn tại.

Lưu ý rằng sự kết hợp với -k chỉ được phép khi tải xuống một tài liệu,
như trong trường hợp đó, nó sẽ chỉ chuyển đổi tất cả các URI tương đối sang các URI bên ngoài; -k làm cho không
có ý nghĩa đối với nhiều URI khi tất cả chúng đều được tải xuống một tệp duy nhất; -k có thể
chỉ được sử dụng khi đầu ra là một tệp thông thường.

-nc
--no-clobber
Nếu một tệp được tải xuống nhiều lần trong cùng một thư mục, hành vi của Wget phụ thuộc
trên một số tùy chọn, bao gồm -nc. Trong một số trường hợp nhất định, tệp cục bộ sẽ bị đóng băng,
hoặc bị ghi đè, khi tải xuống nhiều lần. Trong các trường hợp khác, nó sẽ được giữ nguyên.

Khi chạy Wget mà không có -N, -nc, -r, hoặc là -p, tải xuống cùng một tệp trong cùng một
thư mục sẽ dẫn đến bản sao gốc của hồ sơ đang được bảo quản và bản sao thứ hai
được đặt tên hồ sơ.1. Nếu tệp đó được tải xuống một lần nữa, bản sao thứ ba sẽ là
tên hồ sơ.2, và như thế. (Đây cũng là hành vi với -NS, thậm chí nếu -r or -p đang ở trong
hiệu lực.) Khi -nc được chỉ định, hành vi này bị chặn và Wget sẽ từ chối
tải xuống các bản sao mới hơn của hồ sơ. Do đó, "" no-clobber "" thực sự là một từ viết sai trong
chế độ này --- nó không bị ngăn cản (vì các hậu tố số đã
ngăn chặn sự tắc nghẽn), nhưng đúng hơn là việc lưu nhiều phiên bản đã bị ngăn chặn.

Khi chạy Wget với -r or -p, Nhưng không có -N, -NS, hoặc là -nc, tải xuống lại một tệp
sẽ dẫn đến việc bản sao mới chỉ cần ghi đè lên bản cũ. Thêm -nc sẽ ngăn chặn điều này
hành vi, thay vào đó khiến phiên bản gốc được giữ nguyên và mọi bản sao mới hơn trên
máy chủ bị bỏ qua.

Khi chạy Wget với -N, có hay không -r or -p, quyết định có hay không
để tải xuống bản sao mới hơn của tệp phụ thuộc vào kích thước và dấu thời gian cục bộ và từ xa
của tệp. -nc có thể không được chỉ định cùng lúc với -N.

Một sự kết hợp với -O/--output-tài liệu chỉ được chấp nhận nếu tệp đầu ra nhất định không
không tồn tại.

Lưu ý rằng khi -nc được chỉ định, các tệp có các hậu tố . Html or . Htm sẽ được tải
từ đĩa cục bộ và được phân tích cú pháp như thể chúng đã được truy xuất từ ​​Web.

- sao lưu =sao lưu
Trước khi ghi một tệp, hãy sao lưu tệp hiện có bằng cách thêm .1 hậu tố (_1 on
VMS) vào tên tệp. Các tệp sao lưu như vậy được xoay vòng sang .2, .3, v.v., lên đến
sao lưu (và mất xa hơn thế).

-c
--tiếp tục
Tiếp tục tải xuống một phần tệp. Điều này rất hữu ích khi bạn muốn hoàn thành
tải xuống bắt đầu bởi phiên bản trước của Wget hoặc bởi một chương trình khác. Vì
ví dụ:

quên -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z

Nếu có một tập tin có tên ls-lR.Z trong thư mục hiện tại, Wget sẽ cho rằng nó là
phần đầu tiên của tệp từ xa và sẽ yêu cầu máy chủ tiếp tục
truy xuất từ ​​một khoảng chênh lệch bằng độ dài của tệp cục bộ.

Lưu ý rằng bạn không cần chỉ định tùy chọn này nếu bạn chỉ muốn hiện tại
kêu gọi Wget để thử tải lại tệp xuống nếu kết nối bị mất giữa chừng
bởi vì. Đây là hành vi mặc định. -c chỉ ảnh hưởng đến việc tiếp tục tải xuống
bắt đầu trước khi đối với lời gọi này của Wget và các tệp cục bộ của chúng vẫn đang hoạt động
xung quanh.

Nếu không có -c, ví dụ trước sẽ chỉ tải xuống tệp từ xa để ls-lR.Z.1,
để lại phần bị cắt ngắn ls-lR.Z hồ sơ một mình.

Bắt đầu với Wget 1.7, nếu bạn sử dụng -c trên một tệp không trống, và hóa ra là
máy chủ không hỗ trợ tải xuống tiếp tục, Wget sẽ từ chối bắt đầu tải xuống
từ đầu, điều này sẽ làm hỏng nội dung hiện có một cách hiệu quả. Nếu bạn thực sự muốn
tải xuống để bắt đầu lại từ đầu, xóa tệp.

Cũng bắt đầu với Wget 1.7, nếu bạn sử dụng -c trên một tệp có kích thước bằng
một trên máy chủ, Wget sẽ từ chối tải xuống tệp và in giải thích
nhắn. Điều tương tự cũng xảy ra khi tệp trên máy chủ nhỏ hơn cục bộ
(có lẽ vì nó đã được thay đổi trên máy chủ kể từ lần tải xuống cuối cùng của bạn
cố gắng) --- bởi vì "tiếp tục" không có nghĩa, không có tải xuống xảy ra.

Ở mặt khác của đồng xu, trong khi sử dụng -c, bất kỳ tệp nào lớn hơn trên máy chủ
hơn cục bộ sẽ được coi là bản tải xuống không hoàn chỉnh và chỉ "(chiều dài (từ xa) -
length (local)) "byte sẽ được tải xuống và gắn vào cuối tệp cục bộ.
Hành vi này có thể được mong muốn trong một số trường hợp nhất định --- ví dụ: bạn có thể sử dụng wget -c đến
chỉ tải xuống phần mới đã được nối vào tệp nhật ký hoặc thu thập dữ liệu.

Tuy nhiên, nếu tệp lớn hơn trên máy chủ vì nó đã thay đổi, như trái ngược với
chỉ thêm vào đến, bạn sẽ kết thúc với một tệp bị cắt xén. Wget không có cách nào xác minh
rằng tệp cục bộ thực sự là một tiền tố hợp lệ của tệp từ xa. Bạn cần phải
đặc biệt cẩn thận về điều này khi sử dụng -c kết hợp với -r, vì mọi tệp sẽ
được coi là một ứng cử viên "tải xuống không đầy đủ".

Một trường hợp khác mà bạn sẽ nhận được một tệp bị cắt xén nếu bạn cố gắng sử dụng -c là nếu bạn có một
proxy HTTP khập khiễng chèn chuỗi "truyền bị gián đoạn" vào tệp cục bộ. Trong
trong tương lai, một tùy chọn "khôi phục" có thể được thêm vào để giải quyết trường hợp này.

Lưu ý rằng -c chỉ hoạt động với máy chủ FTP và với máy chủ HTTP hỗ trợ
Tiêu đề "phạm vi".

--start-pos =OFFSET
Bắt đầu tải xuống ở vị trí dựa trên XNUMX OFFSET. Chênh lệch có thể được biểu thị bằng byte,
kilobyte với hậu tố `k 'hoặc megabyte với hậu tố` m', v.v.

--bắt đầu-vị trí có quyền ưu tiên cao hơn --tiếp tục. Khi nào --bắt đầu-vị trí--tiếp tục
đều được chỉ định, wget sẽ phát ra cảnh báo sau đó tiếp tục như thể --tiếp tục đã vắng mặt.

Hỗ trợ máy chủ để tiếp tục tải xuống là bắt buộc, nếu không --bắt đầu-vị trí không thể giúp đỡ.
Xem -c để biết thêm chi tiết.

--progress =kiểu
Chọn loại chỉ báo tiến trình bạn muốn sử dụng. Các chỉ số pháp lý là "chấm"
và "bar".

Chỉ báo "thanh" được sử dụng theo mặc định. Nó vẽ một đồ họa thanh tiến trình ASCII
(hay còn gọi là màn hình hiển thị "nhiệt kế") cho biết trạng thái thu hồi. Nếu đầu ra là
không phải là TTY, thanh "chấm" sẽ được sử dụng theo mặc định.

Sử dụng --progress = dấu chấm để chuyển sang màn hình "chấm". Nó theo dõi việc truy xuất bằng cách
in các chấm trên màn hình, mỗi chấm đại diện cho một lượng dữ liệu tải xuống cố định.

Tiến trình kiểu cũng có thể nhận một hoặc nhiều tham số. Các thông số khác nhau dựa trên
các kiểu đã chọn. Tham số cho kiểu được chuyển bằng cách nối chúng vào loại
nói bằng dấu hai chấm (:) như thế này: --progress =kiểu:tham số1:tham số2.

Khi sử dụng truy xuất dạng chấm, bạn có thể đặt phong cách bằng cách chỉ định loại là
dấu chấm:phong cách. Các kiểu khác nhau gán ý nghĩa khác nhau cho một dấu chấm. Với "mặc định"
phong cách mỗi chấm đại diện cho 1K, có mười chấm trong một cụm và 50 chấm trên một dòng.
Kiểu "nhị phân" có hướng giống "máy tính" hơn --- 8K chấm, cụm 16 chấm
và 48 điểm trên mỗi dòng (tạo ra 384K dòng). Phong cách "mega" phù hợp với
tải xuống các tệp lớn --- mỗi dấu chấm đại diện cho 64K được truy xuất, có tám dấu chấm trong
cụm, và 48 chấm trên mỗi dòng (vì vậy mỗi dòng chứa 3M). Nếu "mega" là không đủ
thì bạn có thể sử dụng kiểu "giga" --- mỗi dấu chấm đại diện cho 1M được truy xuất, có tám
chấm trong một cụm và 32 chấm trên mỗi dòng (vì vậy mỗi dòng chứa 32M).

Với --progress = thanh, hiện có hai tham số khả thi, lực lượngkhông có cuộn giấy.

Khi đầu ra không phải là TTY, thanh tiến trình luôn quay trở lại "dấu chấm", ngay cả khi
--progress = thanh đã được chuyển cho Wget trong quá trình xâm chiếm. Hành vi này có thể bị ghi đè
và đầu ra "thanh" buộc bằng cách sử dụng tham số "lực lượng" là --progress = bar: lực lượng.

Theo mặc định, thanh thanh tiến trình kiểu cuộn tên tệp từ trái sang phải
cho tệp đang được tải xuống nếu tên tệp vượt quá độ dài tối đa được phân bổ cho
màn hình của nó. Trong một số trường hợp nhất định, chẳng hạn như với --progress = bar: lực lượng, một người có thể không muốn
tên tệp cuộn trong thanh tiến trình. Bằng cách chuyển tham số "noscroll", Wget
có thể buộc phải hiển thị càng nhiều tên tệp càng tốt mà không cần cuộn qua
nó.

Lưu ý rằng bạn có thể đặt kiểu mặc định bằng lệnh "tiến trình" trong .wgetrc. Cái đó
cài đặt có thể bị ghi đè khỏi dòng lệnh. Ví dụ: để buộc đầu ra thanh
mà không cần cuộn, sử dụng --progress = bar: force: noscroll.

--show-tiến trình
Buộc wget hiển thị thanh tiến trình ở bất kỳ độ dài nào.

Theo mặc định, wget chỉ hiển thị thanh tiến trình ở chế độ tiết. Tuy nhiên, một người có thể,
muốn wget hiển thị thanh tiến trình trên màn hình cùng với bất kỳ thứ gì khác
chế độ tiết như - không dài dòng or --Yên lặng. Đây thường là một tài sản mong muốn khi
gọi wget để tải xuống một số tệp nhỏ / lớn. Trong trường hợp như vậy, wget có thể
chỉ cần được gọi với tham số này để có được kết quả đầu ra rõ ràng hơn nhiều trên màn hình.

Tùy chọn này cũng sẽ buộc in thanh tiến trình để tiêu chuẩn khi sử dụng
cùng với --logfile tùy chọn.

-N
- lấy dấu tối ưu
Bật tính năng đóng dấu thời gian.

--không-nếu-sửa đổi-kể từ
Không gửi tiêu đề If-Modified-Since trong -N chế độ. Gửi yêu cầu HEAD sơ bộ
thay thế. Điều này chỉ có tác dụng trong -N chế độ.

- không sử dụng-máy chủ-dấu thời gian
Không đặt dấu thời gian của tệp cục bộ bằng dấu thời gian trên máy chủ.

Theo mặc định, khi một tệp được tải xuống, các dấu thời gian của nó được đặt để khớp với các dấu thời gian từ
tệp từ xa. Điều này cho phép sử dụng - lấy dấu tối ưu trên các lệnh gọi tiếp theo của wget.
Tuy nhiên, đôi khi sẽ hữu ích nếu dựa vào dấu thời gian của tệp cục bộ khi nó
thực sự đã tải xuống; cho mục đích đó, - không sử dụng-máy chủ-dấu thời gian tùy chọn đã được
được cung cấp.

-S
- máy chủ-phản hồi
In tiêu đề do máy chủ HTTP gửi và phản hồi do máy chủ FTP gửi.

--nhện
Khi được gọi với tùy chọn này, Wget sẽ hoạt động như một trang Web nhện, có nghĩa là nó
sẽ không tải xuống các trang, chỉ cần kiểm tra xem chúng có ở đó không. Ví dụ, bạn có thể sử dụng
Cố gắng kiểm tra dấu trang của bạn:

wget --spider --force-html -i bookmarks.html

Tính năng này cần nhiều công việc hơn nữa để Wget tiến gần đến chức năng của
mạng nhện.

-T giây
--timeout =giây
Đặt thời gian chờ của mạng thành giây giây. Điều này tương đương với việc chỉ định
--dns-thời gian chờ, - hết thời gian kết nối--giờ đọc đã kết thúc, Tất cả cùng một lúc.

Khi tương tác với mạng, Wget có thể kiểm tra thời gian chờ và hủy hoạt động
nếu nó mất quá nhiều thời gian. Điều này ngăn chặn các hiện tượng bất thường như treo lần đọc và vô hạn
kết nối. Thời gian chờ duy nhất được bật theo mặc định là thời gian chờ đọc 900 giây. Thiết lập
thời gian chờ về 0 sẽ vô hiệu hóa hoàn toàn. Trừ khi bạn biết mình đang làm gì, còn không thì tốt nhất là
không thay đổi cài đặt thời gian chờ mặc định.

Tất cả các tùy chọn liên quan đến thời gian chờ đều chấp nhận giá trị thập phân, cũng như giá trị giây con. Vì
thí dụ, 0.1 giây là một lựa chọn thời gian chờ hợp pháp (mặc dù không khôn ngoan). Thời gian chờ sau thứ hai
rất hữu ích để kiểm tra thời gian phản hồi của máy chủ hoặc để kiểm tra độ trễ của mạng.

--dns-timeout =giây
Đặt thời gian chờ tra cứu DNS thành giây giây. Tra cứu DNS không hoàn thành trong
thời gian quy định sẽ không thành công. Theo mặc định, không có thời gian chờ khi tra cứu DNS, khác
hơn được thực hiện bởi các thư viện hệ thống.

--connect-timeout =giây
Đặt thời gian chờ kết nối thành giây giây. Các kết nối TCP mất nhiều thời gian hơn để
thiết lập sẽ bị hủy bỏ. Theo mặc định, không có thời gian chờ kết nối, ngoài điều đó
được thực hiện bởi các thư viện hệ thống.

--read-timeout =giây
Đặt thời gian chờ đọc (và ghi) thành giây giây. "Thời gian" của thời gian chờ này
đề cập đến nhàn rỗi thời gian: nếu, tại bất kỳ thời điểm nào trong quá trình tải xuống, không có dữ liệu nào được nhận để biết thêm
quá số giây được chỉ định, đọc không thành công và quá trình tải xuống được khởi động lại.
Tùy chọn này không ảnh hưởng trực tiếp đến thời lượng của toàn bộ quá trình tải xuống.

Tất nhiên, máy chủ từ xa có thể chọn chấm dứt kết nối sớm hơn
tùy chọn yêu cầu. Thời gian chờ đọc mặc định là 900 giây.

--limit-rate =số lượng
Giới hạn tốc độ tải xuống số lượng byte trên giây. Số tiền có thể được thể hiện bằng
byte, kilobyte với k hậu tố hoặc megabyte với m hậu tố. Ví dụ,
--limit-rate = 20k sẽ giới hạn tốc độ truy xuất đến 20KB / s. Điều này hữu ích khi
bất cứ lý do gì, bạn không muốn Wget tiêu thụ toàn bộ băng thông hiện có.

Tùy chọn này cho phép sử dụng các số thập phân, thường kết hợp với
các hậu tố; Ví dụ, --limit-rate = 2.5k là một giá trị pháp lý.

Lưu ý rằng Wget thực hiện giới hạn bằng cách ngủ trong khoảng thời gian thích hợp
sau khi đọc mạng mất ít thời gian hơn tốc độ quy định. Cuối cùng cái này
chiến lược làm cho quá trình truyền TCP chậm lại đến mức xấp xỉ tốc độ được chỉ định.
Tuy nhiên, có thể mất một thời gian để đạt được sự cân bằng này, vì vậy đừng ngạc nhiên
nếu việc giới hạn tỷ lệ không hoạt động tốt với các tệp rất nhỏ.

-w giây
- chờ đợi =giây
Chờ số giây được chỉ định giữa các lần truy xuất. Sử dụng tùy chọn này là
được khuyến nghị, vì nó làm giảm tải máy chủ bằng cách làm cho các yêu cầu ít thường xuyên hơn.
Thay vì tính bằng giây, thời gian có thể được chỉ định bằng phút bằng cách sử dụng hậu tố "m", trong
giờ sử dụng hậu tố "h" hoặc trong ngày sử dụng hậu tố "d".

Việc chỉ định một giá trị lớn cho tùy chọn này rất hữu ích nếu mạng hoặc điểm đến
máy chủ lưu trữ không hoạt động, do đó, Wget có thể đợi đủ lâu để dự kiến ​​một cách hợp lý lỗi mạng
sẽ được sửa trước khi thử lại. Khoảng thời gian chờ được chỉ định bởi hàm này là
bị ảnh hưởng bởi "--random-wait", sẽ thấy.

--waitretry =giây
Nếu bạn không muốn Wget phải đợi giữa mỗi truy xuất, nhưng chỉ giữa các lần thử lại
tải xuống không thành công, bạn có thể sử dụng tùy chọn này. Wget sẽ sử dụng tuyến tính rút lui, đang đợi 1
thứ hai sau lỗi đầu tiên trên một tệp nhất định, sau đó đợi 2 giây sau
lỗi thứ hai trên tệp đó, lên đến số lượng tối đa giây bạn chỉ định.

Theo mặc định, Wget sẽ giả định giá trị là 10 giây.

--random-đợi
Một số trang web có thể thực hiện phân tích nhật ký để xác định các chương trình truy xuất, chẳng hạn như Wget by
tìm kiếm sự tương đồng có ý nghĩa thống kê về thời gian giữa các yêu cầu. Điều này
tùy chọn khiến thời gian giữa các yêu cầu thay đổi trong khoảng 0.5 đến 1.5 * chờ đợi giây
Ở đâu chờ đợi đã được chỉ định bằng cách sử dụng --đợi đã tùy chọn, để che giấu sự hiện diện của Wget
từ phân tích như vậy.

Một bài báo năm 2001 trong một ấn phẩm dành cho sự phát triển trên nền tảng người tiêu dùng phổ biến
đã cung cấp mã để thực hiện phân tích này một cách nhanh chóng. Tác giả của nó đã đề xuất chặn tại
cấp địa chỉ lớp C để đảm bảo các chương trình truy xuất tự động đã bị chặn mặc dù
thay đổi địa chỉ do DHCP cung cấp.

Sản phẩm --random-đợi tùy chọn này được lấy cảm hứng từ đề xuất không hợp lý này để chặn nhiều
người dùng không liên quan từ một trang web do hành động của một.

--không có proxy
Không sử dụng proxy, ngay cả khi biến môi trường * _proxy thích hợp được xác định.

-Q phần
--quota =phần
Chỉ định hạn ngạch tải xuống để truy xuất tự động. Giá trị có thể được chỉ định bằng byte
(mặc định), kilobyte (với k hậu tố), hoặc megabyte (với m hậu tố).

Lưu ý rằng hạn ngạch sẽ không bao giờ ảnh hưởng đến việc tải xuống một tệp. Vì vậy, nếu bạn chỉ định wget
-Q10k ftp://wuarchive.wustl.edu/ls-lR.gz, tất cả ls-lR.gz sẽ được tải xuống. Các
tương tự ngay cả khi một số URL được chỉ định trên dòng lệnh. Tuy nhiên, hạn ngạch là
được tôn trọng khi truy xuất đệ quy hoặc từ tệp đầu vào. Vì vậy, bạn có thể
gõ an toàn wget -Q2m -i các trang web--- tải xuống sẽ bị hủy bỏ khi vượt quá hạn ngạch.

Đặt hạn ngạch thành 0 hoặc thành inf bỏ giới hạn hạn ngạch tải xuống.

--no-dns-cache
Tắt bộ nhớ đệm của tra cứu DNS. Thông thường, Wget ghi nhớ các địa chỉ IP mà nó trông
nâng cấp từ DNS để nó không phải liên hệ nhiều lần với máy chủ DNS cho cùng một
(thường nhỏ) tập hợp các máy chủ mà nó truy xuất. Bộ nhớ đệm này chỉ tồn tại trong bộ nhớ; Một
Wget run mới sẽ liên hệ lại với DNS.

Tuy nhiên, nó đã được báo cáo rằng trong một số trường hợp không mong muốn bộ nhớ cache
tên máy chủ, ngay cả trong thời gian của một ứng dụng chạy ngắn như Wget. Với cái này
tùy chọn Wget đưa ra một tra cứu DNS mới (chính xác hơn là một lệnh gọi mới tới "gethostbyname" hoặc
"getaddrinfo") mỗi khi nó tạo một kết nối mới. Xin lưu ý rằng tùy chọn này sẽ
không ảnh hưởng đến bộ nhớ đệm có thể được thực hiện bởi thư viện phân giải hoặc bởi bên ngoài
lớp bộ nhớ đệm, chẳng hạn như NSCD.

Nếu bạn không hiểu chính xác tùy chọn này làm gì, có thể bạn sẽ không cần đến nó.

--restrict-file-names =chế độ
Thay đổi ký tự nào được tìm thấy trong URL từ xa phải được thoát trong quá trình tạo
tên tệp cục bộ. Các nhân vật hạn chế bởi tùy chọn này được thoát, tức là
thay thế bằng % HH, Nơi HH là số thập lục phân tương ứng với
nhân vật bị hạn chế. Tùy chọn này cũng có thể được sử dụng để buộc tất cả các trường hợp theo thứ tự bảng chữ cái phải
là chữ thường hoặc chữ hoa.

Theo mặc định, Wget thoát các ký tự không hợp lệ hoặc không an toàn như một phần của tệp
tên trên hệ điều hành của bạn, cũng như các ký tự điều khiển thường là
chưa in ra. Tùy chọn này hữu ích để thay đổi các giá trị mặc định này, có lẽ vì bạn
đang tải xuống một phân vùng không phải gốc hoặc vì bạn muốn tắt tính năng thoát khỏi
các ký tự điều khiển hoặc bạn muốn giới hạn thêm các ký tự chỉ những ký tự trong
phạm vi giá trị ASCII.

Sản phẩm chế độ là một tập hợp các giá trị văn bản được phân tách bằng dấu phẩy. Các giá trị chấp nhận được là unix,
cửa sổ, NoControl, ascii, chữ thườngchữ hoa. Giá trị unixcửa sổ đang
loại trừ lẫn nhau (cái này sẽ ghi đè cái kia), như vậy chữ thườngchữ hoa.
Những trường hợp cuối cùng là những trường hợp đặc biệt, vì chúng không thay đổi tập hợp các ký tự sẽ
được thoát, nhưng buộc phải chuyển đổi đường dẫn tệp cục bộ thành thấp hơn hoặc
chữ hoa.

Khi "unix" được chỉ định, Wget thoát khỏi ký tự / và các nhân vật điều khiển trong
phạm vi 0--31 và 128--159. Đây là mặc định trên các hệ điều hành giống Unix.

Khi "cửa sổ" được đưa ra, Wget thoát khỏi các ký tự \, |, /, :, ?, ", *, <, >
các ký tự điều khiển trong phạm vi 0--31 và 128--159. Thêm vào đó, Wget in
Chế độ Windows sử dụng + thay vì : để tách máy chủ và cổng trong tên tệp cục bộ, và
sử dụng @ thay vì ? để tách phần truy vấn của tên tệp khỏi phần còn lại.
Do đó, một URL sẽ được lưu dưới dạng www.xemacs.org:4300/search.pl?input=blah in
Chế độ Unix sẽ được lưu dưới dạng www.xemacs.org+4300/search.pl@input=blah ở chế độ Windows.
Chế độ này là mặc định trên Windows.

Nếu bạn chỉ định NoControl, sau đó thoát các ký tự điều khiển cũng được chuyển
tắt. Tùy chọn này có thể có ý nghĩa khi bạn tải xuống các URL có tên chứa
Ký tự UTF-8, trên một hệ thống có thể lưu và hiển thị tên tệp trong UTF-8 (một số
các giá trị byte có thể sử dụng trong chuỗi byte UTF-8 nằm trong phạm vi giá trị
được Wget chỉ định là "điều khiển").

Sản phẩm ascii chế độ được sử dụng để chỉ định rằng bất kỳ byte nào có giá trị nằm ngoài phạm vi
Các ký tự ASCII (nghĩa là lớn hơn 127) sẽ được thoát ra. Điều này có thể hữu ích khi
lưu tên tệp có mã hóa không khớp với tên được sử dụng cục bộ.

-4
- chỉ-nôi4
-6
- chỉ-nôi6
Buộc kết nối với địa chỉ IPv4 hoặc IPv6. Với - chỉ-nôi4 or -4, Wget sẽ chỉ
kết nối với máy chủ IPv4, bỏ qua các bản ghi AAAA trong DNS và từ chối kết nối với IPv6
địa chỉ được chỉ định trong URL. Ngược lại, với - chỉ-nôi6 or -6, Wget sẽ chỉ
kết nối với máy chủ IPv6 và bỏ qua bản ghi A và địa chỉ IPv4.

Không cần tùy chọn thông thường. Theo mặc định, một Tiện ích nhận biết IPv6 sẽ sử dụng
họ địa chỉ được chỉ định bởi bản ghi DNS của máy chủ. Nếu DNS phản hồi bằng cả hai
Địa chỉ IPv4 và IPv6, Wget sẽ thử chúng theo trình tự cho đến khi tìm thấy một địa chỉ mà nó có thể
kết nối với. (Cũng xem tùy chọn "--prefer-family" được mô tả bên dưới.)

Các tùy chọn này có thể được sử dụng để cố tình buộc sử dụng địa chỉ IPv4 hoặc IPv6
các gia đình trên hệ thống gia đình kép, thường để hỗ trợ gỡ lỗi hoặc để xử lý các
cấu hình mạng. Chỉ một trong số - chỉ-nôi6- chỉ-nôi4 có thể được chỉ định tại
cùng lúc. Không có tùy chọn nào khả dụng trong Wget được biên dịch mà không hỗ trợ IPv6.

--prefer-family = none / IPv4 / IPv6
Khi được chọn một số địa chỉ, hãy kết nối với các địa chỉ được chỉ định
xưng hô với gia đình trước. Thứ tự địa chỉ do DNS trả về được sử dụng mà không thay đổi bởi
mặc định.

Điều này tránh các lỗi giả mạo và cố gắng kết nối khi truy cập các máy chủ giải quyết đến
cả địa chỉ IPv6 và IPv4 từ mạng IPv4. Ví dụ, www.kame.net giải quyết
đến 2001:200:0:8002:203:47ff:fea5:3085203.178.141.194. Khi ưu tiên
họ là "IPv4", địa chỉ IPv4 được sử dụng đầu tiên; khi họ ưu tiên là "IPv6",
địa chỉ IPv6 được sử dụng đầu tiên; nếu giá trị được chỉ định là "không", thứ tự địa chỉ
được trả về bởi DNS được sử dụng mà không thay đổi.

Không giống như -4-6, tùy chọn này không ngăn cản quyền truy cập vào bất kỳ họ địa chỉ nào, nó chỉ
thay đổi gọi món trong đó các địa chỉ được truy cập. Cũng lưu ý rằng việc sắp xếp lại
được thực hiện bởi tùy chọn này là ổn định--- nó không ảnh hưởng đến thứ tự của các địa chỉ giống nhau
gia đình. Đó là thứ tự tương đối của tất cả các địa chỉ IPv4 và của tất cả các địa chỉ IPv6
vẫn còn nguyên vẹn trong mọi trường hợp.

--thử lại-conrefused
Hãy coi "kết nối bị từ chối" là một lỗi tạm thời và thử lại. Bình thường Wget bỏ cuộc
trên một URL khi nó không thể kết nối với trang web vì không kết nối được
như một dấu hiệu cho thấy máy chủ hoàn toàn không chạy và việc thử lại sẽ không hữu ích. Điều này
tùy chọn này là để sao chép các trang web không đáng tin cậy có máy chủ có xu hướng biến mất trong thời gian ngắn
khoảng thời gian.

- người dùng =người sử dụng
- mật mã =mật khẩu
Chỉ định tên người dùng người sử dụng và mật khẩu mật khẩu cho cả truy xuất tệp FTP và HTTP.
Các tham số này có thể được ghi đè bằng cách sử dụng --ftp-người dùng--ftp-mật khẩu tùy chọn cho
Kết nối FTP và --http-người dùng--http-mật khẩu tùy chọn cho các kết nối HTTP.

--ask-mật khẩu
Nhắc nhập mật khẩu cho mỗi kết nối được thiết lập. Không thể được chỉ định khi
--mật khẩu mở khóa đang được sử dụng, vì chúng loại trừ lẫn nhau.

--không-iri
Tắt hỗ trợ URI quốc tế hóa (IRI). Sử dụng --iri bật lên. Hỗ trợ IRI là
được kích hoạt theo mặc định.

Bạn có thể đặt trạng thái hỗ trợ IRI mặc định bằng lệnh "iri" trong .wgetrc. Cái đó
cài đặt có thể bị ghi đè khỏi dòng lệnh.

--local-encoding =mã hóa
Buộc Wget sử dụng mã hóa dưới dạng mã hóa hệ thống mặc định. Điều đó ảnh hưởng đến cách Wget
chuyển đổi các URL được chỉ định làm đối số từ ngôn ngữ sang UTF-8 để hỗ trợ IRI.

Hãy sử dụng hàm "nl_langinfo ()" và sau đó biến môi trường "CHARSET" để
lấy ngôn ngữ. Nếu nó không thành công, ASCII được sử dụng.

Bạn có thể đặt mã hóa cục bộ mặc định bằng lệnh "local_encoding" trong .wgetrc.
Cài đặt đó có thể bị ghi đè khỏi dòng lệnh.

--remote-encoding =mã hóa
Buộc Wget sử dụng mã hóa làm mã hóa máy chủ từ xa mặc định. Điều đó ảnh hưởng đến cách
Wget chuyển đổi các URI được tìm thấy trong các tệp từ mã hóa từ xa thành UTF-8 trong quá trình đệ quy
tìm về. Các tùy chọn này chỉ hữu ích cho việc hỗ trợ IRI, cho việc giải thích các
Ký tự ASCII.

Đối với HTTP, mã hóa từ xa có thể được tìm thấy trong tiêu đề "Loại nội dung" HTTP và trong HTML
Thẻ meta "Nội dung-Loại http-tương đương".

Bạn có thể đặt mã hóa mặc định bằng lệnh "mã hóa từ xa" trong .wgetrc. Cái đó
cài đặt có thể bị ghi đè khỏi dòng lệnh.

--hủy liên kết
Buộc Wget hủy liên kết tệp thay vì chặn tệp hiện có. Tùy chọn này hữu ích
để tải xuống thư mục có liên kết cứng.

thư mục Các lựa chọn
-NS
- không có thư mục
Không tạo một hệ thống phân cấp các thư mục khi truy xuất đệ quy. Với cái này
tùy chọn được bật, tất cả các tệp sẽ được lưu vào thư mục hiện tại mà không cần
làm tắc nghẽn (nếu một tên xuất hiện nhiều lần, tên tệp sẽ nhận được phần mở rộng .n).

-x
--force-thư mục
Sự đối lập của -NS--- tạo một hệ thống phân cấp các thư mục, ngay cả khi một thư mục không có
đã được tạo khác. Ví dụ wget -x http://fly.srk.fer.hr/robots.txt sẽ cứu
tệp đã tải xuống fly.srk.fer.hr/robots.txt.

-nH
--no-host-directory
Tắt tạo các thư mục có tiền tố máy chủ. Theo mặc định, gọi Wget với -r
http://fly.srk.fer.hr/ sẽ tạo cấu trúc các thư mục bắt đầu bằng
bay.srk.fer.hr/. Tùy chọn này vô hiệu hóa hành vi đó.

--protocol-directory
Sử dụng tên giao thức như một thành phần thư mục của tên tệp cục bộ. Ví dụ, với
tùy chọn này, wget -r http://chủ nhà sẽ lưu vào http /chủ nhà/ ... thay vì chỉ để
chủ nhà/ ....

--cut-dirs =con số
Bỏ qua con số các thành phần thư mục. Điều này rất hữu ích để có được một điều khiển chi tiết
qua thư mục nơi truy xuất đệ quy sẽ được lưu.

Lấy ví dụ, thư mục tại ftp://ftp.xemacs.org/pub/xemacs/. Nếu bạn lấy
nó với -r, nó sẽ được lưu cục bộ trong ftp.xemacs.org/pub/xemacs/. Trong khi -nH
tùy chọn có thể loại bỏ ftp.xemacs.org/ một phần, bạn vẫn còn bị mắc kẹt với pub / xemacs. Điều này
là ở đâu - người cắt tóc có ích; nó làm cho Wget không "nhìn thấy" con số thư mục từ xa
các thành phần. Dưới đây là một số ví dụ về cách - người cắt tóc tùy chọn hoạt động.

Không có tùy chọn -> ftp.xemacs.org/pub/xemacs/
-nH -> pub / xemacs /
-nH --cut-dirs = 1 -> xemacs /
-nH --cut-dirs = 2 ->.

--cut-dirs = 1 -> ftp.xemacs.org/xemacs/
hữu ích. Cảm ơn !

Nếu bạn chỉ muốn loại bỏ cấu trúc thư mục, tùy chọn này tương tự như một
sự kết hợp của -NS-P. Tuy nhiên, không giống như -NS, - người cắt tóc không thua với
thư mục con --- ví dụ, với -nH --cut-dirs = 1, Một beta / thư mục con sẽ là
đặt cho xemacs / beta, như người ta mong đợi.

-P tiếp đầu ngữ
--directory-prefix =tiếp đầu ngữ
Đặt tiền tố thư mục thành tiếp đầu ngữ. Các thư mục tiếp đầu ngữ là thư mục mà tất cả những thứ khác
các tệp và thư mục con sẽ được lưu vào, tức là phần trên cùng của cây truy xuất. Các
mặc định là . (thư mục hiện tại).

HTTP Các lựa chọn
--default-page =tên
Sử dụng tên làm tên tệp mặc định khi nó không được biết đến (nghĩa là đối với các URL kết thúc bằng
gạch chéo), thay vì index.html.

-E
--điều chỉnh-mở rộng
Nếu một tệp thuộc loại application / xhtml + xml or văn bản / html được tải xuống và URL không
không kết thúc bằng regexp \. [Hh] [Tt] [Mm] [Ll]?, tùy chọn này sẽ tạo ra hậu tố . Html
được nối vào tên tệp cục bộ. Điều này rất hữu ích, chẳng hạn như khi bạn
phản chiếu một trang web từ xa sử dụng . Asp trang, nhưng bạn muốn các trang được phản chiếu
có thể xem được trên máy chủ Apache cổ phiếu của bạn. Một cách sử dụng tốt khác cho việc này là khi bạn
tải xuống các tài liệu do CGI tạo. Một URL như http://site.com/article.cgi? 25 sẽ
được lưu dưới dạng article.cgi? 25.html.

Lưu ý rằng các tên tệp đã thay đổi theo cách này sẽ được tải xuống lại mỗi khi bạn nhân bản lại
một trang web, bởi vì Wget không thể nói rằng địa phương X.html tệp tương ứng với URL từ xa X
(vì nó vẫn chưa biết rằng URL tạo ra đầu ra loại văn bản / html or
application / xhtml + xml.

Kể từ phiên bản 1.12, Wget cũng sẽ đảm bảo rằng mọi tệp đã tải xuống thuộc loại text / css
kết thúc bằng hậu tố cssvà tùy chọn đã được đổi tên từ --html-tiện ích mở rộng, để tốt hơn
phản ánh hành vi mới của nó. Tên tùy chọn cũ vẫn được chấp nhận, nhưng bây giờ phải là
được coi là không dùng nữa.

Tại một số thời điểm trong tương lai, tùy chọn này cũng có thể được mở rộng để bao gồm các hậu tố cho
các loại nội dung khác, bao gồm cả các loại nội dung không được Wget phân tích cú pháp.

--http-user =người sử dụng
--http-password =mật khẩu
Chỉ định tên người dùng người sử dụng và mật khẩu mật khẩu trên máy chủ HTTP. Theo
loại thử thách, Wget sẽ mã hóa chúng bằng cách sử dụng "cơ bản" (không an toàn),
"thông báo" hoặc lược đồ xác thực "NTLM" của Windows.

Một cách khác để chỉ định tên người dùng và mật khẩu là trong chính URL. Một trong hai phương pháp
tiết lộ mật khẩu của bạn cho bất kỳ ai muốn chạy "ps". Để ngăn chặn mật khẩu
khỏi bị nhìn thấy, hãy lưu trữ chúng trong .wgetrc or .netrcvà đảm bảo bảo vệ các tệp đó
từ những người dùng khác có "chmod". Nếu mật khẩu thực sự quan trọng, đừng để lại
chúng nằm trong các tệp đó --- chỉnh sửa tệp và xóa chúng sau khi Wget có
đã bắt đầu tải xuống.

--no-http-keep-living
Tắt tính năng "duy trì hoạt động" đối với tải xuống HTTP. Thông thường, Wget hỏi máy chủ
để giữ cho kết nối luôn mở để khi bạn tải xuống nhiều tài liệu từ
cùng một máy chủ, chúng được chuyển qua cùng một kết nối TCP. Điều này giúp tiết kiệm thời gian và
đồng thời giảm tải cho máy chủ.

Tùy chọn này hữu ích khi, vì một số lý do, các kết nối liên tục (duy trì hoạt động) không
làm việc cho bạn, ví dụ như do lỗi máy chủ hoặc do không có khả năng của phía máy chủ
các tập lệnh để đối phó với các kết nối.

- không có bộ nhớ cache
Tắt bộ nhớ cache phía máy chủ. Trong trường hợp này, Wget sẽ gửi cho máy chủ từ xa một
chỉ thị thích hợp (Thực dụng: không có bộ nhớ cache) để lấy tệp từ dịch vụ từ xa,
thay vì trả lại phiên bản đã lưu trong bộ nhớ cache. Điều này đặc biệt hữu ích cho việc truy xuất
và xóa các tài liệu lỗi thời trên máy chủ proxy.

Bộ nhớ đệm được cho phép theo mặc định.

- không có cookie
Vô hiệu hóa việc sử dụng cookie. Cookie là một cơ chế để duy trì phía máy chủ
trạng thái. Máy chủ gửi cho khách hàng một cookie bằng cách sử dụng tiêu đề "Set-Cookie" và
khách hàng trả lời với cùng một cookie khi có yêu cầu khác. Vì cookie cho phép
chủ sở hữu máy chủ để theo dõi khách truy cập và các trang web trao đổi thông tin này,
một số coi chúng là sự vi phạm quyền riêng tư. Mặc định là sử dụng cookie; Tuy nhiên,
lưu trữ cookie không được bật theo mặc định.

--load-cookie hồ sơ
Tải cookie từ hồ sơ trước khi truy xuất HTTP đầu tiên. hồ sơ là một tệp văn bản trong
định dạng ban đầu được sử dụng bởi Netscape's cookie.txt tập tin.

Bạn thường sẽ sử dụng tùy chọn này khi phản chiếu các trang web yêu cầu bạn phải
đăng nhập để truy cập một số hoặc tất cả nội dung của họ. Quá trình đăng nhập thường hoạt động
bởi máy chủ web cấp một cookie HTTP khi nhận và xác minh
thông tin đăng nhập. Sau đó, trình duyệt sẽ gửi lại cookie khi truy cập vào phần đó của
trang web, và do đó chứng minh danh tính của bạn.

Việc sao chép một trang web như vậy yêu cầu Wget gửi cùng một cookie mà trình duyệt của bạn gửi khi
giao tiếp với trang web. Điều này đạt được bởi --load-cookie--- chỉ cần trỏ Wget
đến vị trí của cookie.txt và nó sẽ gửi cùng một cookie của bạn
trình duyệt sẽ gửi trong tình huống tương tự. Các trình duyệt khác nhau giữ cookie văn bản
các tệp ở các vị trí khác nhau:

"Netscape 4.x."
Các cookie ở trong ~ / .netscape / cookies.txt.

"Mozilla và Netscape 6.x."
Tệp cookie của Mozilla cũng được đặt tên là cookie.txt, nằm ở đâu đó dưới
~ / .mozilla, trong thư mục hồ sơ của bạn. Đường dẫn đầy đủ thường kết thúc
trông hơi giống ~ / .mozilla / default / some -otic-string / cookies.txt.

"Trình duyệt web IE."
Bạn có thể tạo tệp cookie mà Wget có thể sử dụng bằng cách sử dụng menu Tệp, Nhập và
Xuất, xuất Cookies. Điều này đã được thử nghiệm với Internet Explorer 5; không phải vậy
đảm bảo hoạt động với các phiên bản trước đó.

"Các trình duyệt khác."
Nếu bạn đang sử dụng một trình duyệt khác để tạo cookie của mình, --load-cookie sẽ
chỉ hoạt động nếu bạn có thể định vị hoặc tạo tệp cookie ở định dạng Netscape
Wget mong đợi.

Nếu bạn không thể sử dụng --load-cookie, vẫn có thể có một giải pháp thay thế. Nếu là của bạn
trình duyệt hỗ trợ "trình quản lý cookie", bạn có thể sử dụng nó để xem các cookie được sử dụng khi
truy cập trang web mà bạn đang phản chiếu. Viết ra tên và giá trị của cookie, và
hướng dẫn thủ công Wget gửi các cookie đó, bỏ qua hỗ trợ cookie "chính thức":

wget --no-cookies --header "Cookie: = "

--lưu-cookie hồ sơ
Lưu cookie vào hồ sơ trước khi xuất cảnh. Điều này sẽ không lưu các cookie đã hết hạn hoặc
không có thời gian hết hạn (cái gọi là "cookie phiên"), nhưng cũng có thể xem
--keep-session-cookie.

--keep-session-cookie
Khi được chỉ định, nguyên nhân --lưu-cookie để lưu cookie phiên. Cookie phiên
thường không được lưu vì chúng được lưu trong bộ nhớ và bị lãng quên khi
bạn thoát khỏi trình duyệt. Lưu chúng rất hữu ích trên các trang web yêu cầu bạn đăng nhập hoặc truy cập
truy cập trang chủ trước khi bạn có thể truy cập một số trang. Với tùy chọn này, nhiều tiện ích
các lần chạy được coi là một phiên trình duyệt duy nhất đối với trang web có liên quan.

Vì định dạng tệp cookie thường không chứa cookie phiên, Wget đánh dấu chúng
với dấu thời gian hết hạn là 0. Wget's --load-cookie công nhận những người đó là phiên
cookie, nhưng nó có thể gây nhầm lẫn cho các trình duyệt khác. Cũng lưu ý rằng cookie được tải như vậy sẽ
được coi như các cookie phiên khác, có nghĩa là nếu bạn muốn --lưu-cookie đến
bảo quản chúng một lần nữa, bạn phải sử dụng --keep-session-cookie một lần nữa.

- chiều dài khủng khiếp
Thật không may, một số máy chủ HTTP (chính xác hơn là các chương trình CGI) gửi đi không có thật
Tiêu đề "Độ dài nội dung", khiến Wget trở nên hoang dã, vì nó cho rằng không phải tất cả tài liệu
đã được truy xuất. Bạn có thể phát hiện hội chứng này nếu Wget thử lại lấy cùng một tài liệu
lặp đi lặp lại, mỗi lần tuyên bố rằng kết nối (nếu không bình thường) đã đóng
trên cùng một byte.

Với tùy chọn này, Wget sẽ bỏ qua tiêu đề "Độ dài nội dung" --- như thể nó không bao giờ
tồn tại

--header =Dòng tiêu đề
Gửi Dòng tiêu đề cùng với phần còn lại của các tiêu đề trong mỗi yêu cầu HTTP. Các
tiêu đề đã cung cấp được gửi nguyên trạng, có nghĩa là nó phải chứa tên và giá trị được phân tách bằng
dấu hai chấm và không được chứa dòng mới.

Bạn có thể xác định nhiều hơn một tiêu đề bổ sung bằng cách chỉ định --tiêu đề nhiều hơn một lần.

wget --header = 'Tập ký tự chấp nhận: iso-8859-2' \
--header = 'Chấp nhận-Ngôn ngữ: hr' \
http://fly.srk.fer.hr/

Đặc tả của một chuỗi trống vì giá trị tiêu đề sẽ xóa tất cả người dùng trước đó-
tiêu đề xác định.

Kể từ Wget 1.10, tùy chọn này có thể được sử dụng để ghi đè các tiêu đề được tạo khác
tự động. Ví dụ này hướng dẫn Wget kết nối với localhost, nhưng để chỉ định
foo.bar trong tiêu đề "Máy chủ":

wget --header = "Máy chủ: foo.bar" http://localhost/

Trong các phiên bản của Wget trước 1.10, việc sử dụng --tiêu đề gây ra việc gửi bản sao
tiêu đề.

--max-redirect =con số
Chỉ định số lượng chuyển hướng tối đa cần tuân theo cho một tài nguyên. Mặc định là
20, thường là nhiều hơn mức cần thiết. Tuy nhiên, vào những dịp mà bạn
muốn cho phép nhiều hơn (hoặc ít hơn), đây là tùy chọn để sử dụng.

--proxy-user =người sử dụng
--proxy-password =mật khẩu
Chỉ định tên người dùng người sử dụng và mật khẩu mật khẩu để xác thực trên máy chủ proxy.
Wget sẽ mã hóa chúng bằng cách sử dụng lược đồ xác thực "cơ bản".

Các cân nhắc về bảo mật tương tự như những cân nhắc về --http-mật khẩu cũng ở đây.

--referer =url
Bao gồm `Người giới thiệu: urltiêu đề 'trong yêu cầu HTTP. Hữu ích để lấy tài liệu với
xử lý phía máy chủ giả định rằng chúng luôn được truy xuất bởi web tương tác
trình duyệt và chỉ xuất hiện đúng cách khi Người giới thiệu được đặt thành một trong các trang trỏ đến
đối với họ.

--save-tiêu đề
Lưu các tiêu đề do máy chủ HTTP gửi vào tệp, trước nội dung thực,
với một dòng trống làm dấu phân cách.

-U chuỗi đại lý
--user-agent =chuỗi đại lý
Xác định là chuỗi đại lý đến máy chủ HTTP.

Giao thức HTTP cho phép khách hàng tự nhận dạng bằng cách sử dụng "Tác nhân người dùng"
trường tiêu đề. Điều này cho phép phân biệt phần mềm WWW, thường là để thống kê
mục đích hoặc để truy tìm các vi phạm giao thức. Wget thường xác định là
Quên /phiên bản, phiên bản là số phiên bản hiện tại của Wget.

Tuy nhiên, một số trang web đã được biết là áp đặt chính sách điều chỉnh đầu ra
theo thông tin được cung cấp bởi "Tác nhân người dùng". Mặc dù đây không phải là một ý tưởng tồi
về lý thuyết, nó đã bị lạm dụng bởi các máy chủ từ chối thông tin cho các máy khách ngoài
(lịch sử) Netscape hoặc thường xuyên hơn là Microsoft Internet Explorer. Tùy chọn này
cho phép bạn thay đổi dòng "Tác nhân người dùng" do Wget phát hành. Sử dụng tùy chọn này là
nản lòng, trừ khi bạn thực sự biết mình đang làm gì.

Chỉ định tác nhân người dùng trống với --user-agent = "" hướng dẫn Wget không gửi
Tiêu đề "Tác nhân người dùng" trong các yêu cầu HTTP.

--post-data =chuỗi
--post-file =hồ sơ
Sử dụng POST làm phương thức cho tất cả các yêu cầu HTTP và gửi dữ liệu được chỉ định trong
yêu cầu nội dung. --post-dữ liệu gửi chuỗi dưới dạng dữ liệu, trong khi --post-tệp gửi
nội dung của hồ sơ. Ngoài ra, chúng hoạt động theo cùng một cách. Đặc biệt,
họ cả hai mong đợi nội dung có dạng "key1 = value1 & key2 = value2", với mã hóa phần trăm
cho các ký tự đặc biệt; sự khác biệt duy nhất là người ta mong đợi nội dung của nó là
tham số dòng lệnh và tham số khác chấp nhận nội dung của nó từ một tệp. Đặc biệt,
--post-tệp is không để truyền tệp dưới dạng tệp đính kèm biểu mẫu: những tệp đó phải xuất hiện dưới dạng
dữ liệu "key = value" (với mã hóa phần trăm thích hợp) giống như mọi thứ khác. Quên
hiện không hỗ trợ "nhiều phần / biểu mẫu-dữ liệu" để truyền dữ liệu POST; chỉ có
"application / x-www-form-urlencoded". Chỉ một trong số --post-dữ liệu--post-tệp nên là
được chỉ định.

Xin lưu ý rằng wget không yêu cầu nội dung phải có hình thức
"key1 = value1 & key2 = value2" và nó cũng không kiểm tra nó. Wget sẽ chỉ đơn giản là truyền
bất kỳ dữ liệu nào được cung cấp cho nó. Tuy nhiên, hầu hết các máy chủ đều mong muốn dữ liệu POST ở trong
định dạng trên khi xử lý Biểu mẫu HTML.

Khi gửi một yêu cầu ĐĂNG bằng cách sử dụng --post-tệp tùy chọn, Wget coi tệp như một
tệp nhị phân và sẽ gửi mọi ký tự trong yêu cầu ĐĂNG mà không bị tước
các ký tự dòng mới hoặc nguồn cấp dữ liệu theo sau. Mọi ký tự điều khiển khác trong văn bản sẽ
cũng được gửi nguyên trạng trong yêu cầu ĐĂNG.

Xin lưu ý rằng Wget cần biết trước kích thước của dữ liệu POST.
Do đó, đối số cho "--post-file" phải là một tệp thông thường; chỉ định FIFO hoặc
cái gì đó như / dev / stdin sẽ không hoạt động. Nó không hoàn toàn rõ ràng làm thế nào để giải quyết vấn đề này
hạn chế vốn có trong HTTP / 1.0. Mặc dù HTTP / 1.1 giới thiệu phân khúc chuyển cái đó
không yêu cầu biết trước độ dài yêu cầu, khách hàng không thể sử dụng chunked
trừ khi nó biết nó đang nói chuyện với máy chủ HTTP / 1.1. Và nó không thể biết điều đó cho đến khi nó
nhận được phản hồi, do đó yêu cầu phải được hoàn thành - a
vấn đề gà và trứng.

Lưu ý: Kể từ phiên bản 1.15, nếu Wget được chuyển hướng sau khi hoàn thành yêu cầu ĐĂNG,
hành vi của nó sẽ phụ thuộc vào mã phản hồi do máy chủ trả về. Trong trường hợp của một
301 Đã di chuyển vĩnh viễn, 302 Đã di chuyển tạm thời hoặc 307 Chuyển hướng tạm thời, Wget sẽ, trong
phù hợp với RFC2616, tiếp tục gửi một yêu cầu ĐĂNG. Trong trường hợp một máy chủ muốn
khách hàng để thay đổi phương thức Yêu cầu khi chuyển hướng, nó sẽ gửi 303 Xem Khác
mã phản hồi.

Ví dụ này cho thấy cách đăng nhập vào máy chủ bằng POST và sau đó tiến hành tải xuống
các trang mong muốn, có lẽ chỉ những người dùng được ủy quyền mới có thể truy cập được:

# Đăng nhập vào máy chủ. Điều này chỉ có thể được thực hiện một lần.
wget --save-cookies cookies.txt \
--post-data 'user = foo & password = bar' \
http://server.com/auth.php

# Bây giờ lấy trang hoặc các trang mà chúng tôi quan tâm.
wget --load-cookies cookies.txt \
-p http://server.com/interesting/article.php

Nếu máy chủ đang sử dụng cookie phiên để theo dõi xác thực người dùng, điều trên sẽ
không làm việc bởi vì --lưu-cookie sẽ không lưu chúng (và cả các trình duyệt cũng vậy) và
cookie.txt tệp sẽ trống. Trong trường hợp đó sử dụng --keep-session-cookie cùng với
--lưu-cookie để buộc lưu cookie phiên.

--method =Phương thức HTTP
Với mục đích tạo kịch bản RESTful, Wget cho phép gửi các Phương thức HTTP khác
mà không cần phải đặt chúng một cách rõ ràng bằng cách sử dụng --header = Tiêu đề-Dòng. Wget sẽ sử dụng
bất kỳ chuỗi nào được chuyển cho nó sau --phương pháp dưới dạng Phương thức HTTP cho máy chủ.

--body-data =Chuỗi dữ liệu
--body-file =Tập tin dữ liệu
Phải được đặt khi dữ liệu bổ sung cần được gửi đến máy chủ cùng với Phương thức
được chỉ định bằng cách sử dụng --phương pháp. --dữ liệu cơ thể gửi chuỗi dưới dạng dữ liệu, trong khi --body-file gửi
nội dung của hồ sơ. Ngoài ra, chúng hoạt động theo cùng một cách.

Hiện nay, --body-file is không để truyền toàn bộ tệp. Wget không
hiện hỗ trợ "đa phần / biểu mẫu-dữ liệu" để truyền dữ liệu; chỉ có
"application / x-www-form-urlencoded". Trong tương lai, điều này có thể được thay đổi để
gửi --body-file dưới dạng một tệp hoàn chỉnh thay vì gửi nội dung của nó đến
máy chủ. Xin lưu ý rằng Wget cần biết trước nội dung của Dữ liệu BODY,
và do đó đối số --body-file phải là một tệp thông thường. Nhìn thấy --post-tệp cho một
giải thích chi tiết hơn. Chỉ một trong số --dữ liệu cơ thể--body-file nên là
được chỉ định.

Nếu Wget được chuyển hướng sau khi yêu cầu hoàn thành, Wget sẽ tạm dừng hiện tại
và gửi yêu cầu GET cho đến khi quá trình chuyển hướng hoàn tất. Điều này đúng cho tất cả
mã phản hồi chuyển hướng ngoại trừ 307 Chuyển hướng tạm thời được sử dụng để
chỉ định rằng phương thức yêu cầu phải không biến đổi. Một ngoại lệ khác là khi
phương thức được đặt thành "POST", trong trường hợp này các quy tắc chuyển hướng được chỉ định trong
--post-dữ liệu được theo dõi.

- nội dung-bố trí
Nếu điều này được đặt thành bật, hỗ trợ thử nghiệm (không đầy đủ chức năng) cho
Tiêu đề "Bố trí nội dung" được bật. Điều này hiện có thể dẫn đến hiệp phụ-
chuyển đến máy chủ cho một yêu cầu "HEAD" và được biết là có một số lỗi,
đó là lý do tại sao nó hiện không được bật theo mặc định.

Tùy chọn này hữu ích cho một số chương trình CGI tải xuống tệp sử dụng
Tiêu đề "Nội dung-Bố trí" để mô tả tên của tệp đã tải xuống nên
được.

--nội dung có lỗi
Nếu cài đặt này được bật, wget sẽ không bỏ qua nội dung khi máy chủ phản hồi bằng
Mã trạng thái http cho biết lỗi.

--trust-server-name
Nếu điều này được đặt thành bật, trên chuyển hướng, thành phần cuối cùng của URL chuyển hướng sẽ là
được sử dụng làm tên tệp cục bộ. Theo mặc định, nó được sử dụng thành phần cuối cùng trong bản gốc
URL.

--auth-no-thử thách
Nếu tùy chọn này được đưa ra, Wget sẽ gửi thông tin xác thực HTTP cơ bản
(tên người dùng và mật khẩu bản rõ) cho tất cả các yêu cầu, giống như Wget 1.10.2 và trước đó
đã làm theo mặc định.

Việc sử dụng tùy chọn này không được khuyến khích và chỉ nhằm hỗ trợ một số
máy chủ che khuất, không bao giờ gửi thách thức xác thực HTTP, nhưng chấp nhận
chẳng hạn như thông tin xác thực không được yêu cầu, ngoài xác thực dựa trên biểu mẫu.

HTTPS (SSL / TLS) Các lựa chọn
Để hỗ trợ tải xuống HTTP được mã hóa (HTTPS), Wget phải được biên dịch với SSL bên ngoài
thư viện. Mặc định hiện tại là GnuTLS. Ngoài ra, Wget còn hỗ trợ HSTS (HTTP Nghiêm ngặt
An ninh Giao thông vận tải). Nếu Wget được biên dịch mà không hỗ trợ SSL, thì không có tùy chọn nào trong số này
có sẵn.

--secure-protocol =giao thức
Chọn giao thức an toàn sẽ được sử dụng. Giá trị pháp lý là tự động, SSLv2, SSLv3, TLSv1,
TLSv1_1, TLSv1_2PFS. Nếu tự động được sử dụng, thư viện SSL được trao quyền tự do
tự động chọn giao thức thích hợp, đạt được bằng cách gửi TLSv1
Lời chào. Đây là mặc định.

Chỉ định SSLv2, SSLv3, TLSv1, TLSv1_1 or TLSv1_2 buộc việc sử dụng
giao thức. Điều này rất hữu ích khi nói chuyện với các triển khai máy chủ SSL cũ và có lỗi
khiến thư viện SSL cơ bản khó chọn giao thức chính xác
phiên bản. May mắn thay, những máy chủ như vậy là khá hiếm.

Chỉ định PFS thực thi việc sử dụng cái gọi là mật mã Perfect Forward Security
dãy phòng. Tóm lại, PFS bổ sung bảo mật bằng cách tạo khóa một lần cho mỗi SSL
sự liên quan. Nó có tác động nhiều hơn một chút đến CPU trên máy khách và máy chủ. Chúng tôi sử dụng được biết đến là
mật mã an toàn (ví dụ: không có MD4) và giao thức TLS.

--https chỉ
Khi ở chế độ đệ quy, chỉ các liên kết HTTPS mới được tuân theo.

- không kiểm tra chứng chỉ
Không kiểm tra chứng chỉ máy chủ với các tổ chức phát hành chứng chỉ có sẵn.
Cũng không yêu cầu tên máy chủ URL phải khớp với tên thông thường được trình bày bởi
chứng chỉ.

Kể từ Wget 1.10, mặc định là xác minh chứng chỉ của máy chủ dựa trên
tổ chức phát hành chứng chỉ được công nhận, phá vỡ liên kết SSL và hủy bỏ
tải xuống nếu xác minh không thành công. Mặc dù điều này cung cấp các bản tải xuống an toàn hơn, nó
không phá vỡ khả năng tương tác với một số trang web đã hoạt động với các phiên bản Wget trước đó,
đặc biệt là những người sử dụng chứng chỉ tự ký, hết hạn hoặc không hợp lệ.
Tùy chọn này buộc chế độ hoạt động "không an toàn" biến chứng chỉ
xác minh lỗi thành cảnh báo và cho phép bạn tiếp tục.

Nếu bạn gặp phải lỗi "xác minh chứng chỉ" hoặc lỗi nói rằng "tên thông thường
không khớp với tên máy chủ được yêu cầu ", bạn có thể sử dụng tùy chọn này để bỏ qua xác minh
và tiến hành tải xuống. Chỉ có sử dụng điều này tùy chọn if bạn đang nếu không thì thuyết phục of
các của trang web tính xác thực, or if bạn có thật không không về các hiệu lực of của nó
chứng chỉ. Hầu như luôn luôn là một ý tưởng tồi không kiểm tra các chứng chỉ khi
truyền dữ liệu bí mật hoặc quan trọng. Đối với chứng chỉ tự ký / nội bộ,
bạn nên tải xuống chứng chỉ và xác minh điều đó thay vì ép buộc điều này
chế độ không an toàn. Nếu bạn thực sự chắc chắn không muốn bất kỳ xác minh chứng chỉ nào,
bạn có thể chỉ định --check-certificate = yên lặng để yêu cầu wget không in bất kỳ cảnh báo nào về
chứng chỉ không hợp lệ, mặc dù trong hầu hết các trường hợp, đây là việc làm sai trái.

--certificate =hồ sơ
Sử dụng chứng chỉ ứng dụng khách được lưu trữ trong hồ sơ. Điều này là cần thiết cho các máy chủ
được định cấu hình để yêu cầu chứng chỉ từ các máy khách kết nối với chúng. Bình thường a
chứng chỉ là không bắt buộc và công tắc này là tùy chọn.

--certificate-type =kiểu
Chỉ định loại chứng chỉ ứng dụng khách. Giá trị pháp lý là PEM (giả định theo mặc định)
DER, còn được biết là ASN1.

--private-key =hồ sơ
Đọc khóa cá nhân từ hồ sơ. Điều này cho phép bạn cung cấp khóa cá nhân trong một tệp
tách biệt với chứng chỉ.

--private-key-type =kiểu
Chỉ định loại khóa riêng tư. Các giá trị được chấp nhận là PEM (mặc định) và DER.

--ca-certificate =hồ sơ
Sử dụng hồ sơ dưới dạng tệp có gói tổ chức phát hành chứng chỉ ("CA") để xác minh
bạn bè đồng trang lứa. Chứng chỉ phải ở định dạng PEM.

Nếu không có tùy chọn này, Wget sẽ tìm chứng chỉ CA tại các vị trí do hệ thống chỉ định,
được chọn lúc cài đặt OpenSSL.

--ca-directory =thư mục
Chỉ định thư mục chứa chứng chỉ CA ở định dạng PEM. Mỗi tệp chứa một
Chứng chỉ CA và tên tệp dựa trên giá trị băm bắt nguồn từ
chứng chỉ. Điều này đạt được bằng cách xử lý thư mục chứng chỉ với
Tiện ích "c_rehash" được cung cấp cùng với OpenSSL. Sử dụng --ca-thư mục hiệu quả hơn
--ca-chứng chỉ khi nhiều chứng chỉ được cài đặt vì nó cho phép Wget tìm nạp
chứng chỉ theo yêu cầu.

Nếu không có tùy chọn này, Wget sẽ tìm chứng chỉ CA tại các vị trí do hệ thống chỉ định,
được chọn lúc cài đặt OpenSSL.

--crl-file =hồ sơ
Chỉ định một tệp CRL trong hồ sơ. Điều này là cần thiết cho các chứng chỉ đã được
bị CA thu hồi.

--random-file =hồ sơ
[Chỉ OpenSSL và LibreSSL] Sử dụng hồ sơ như là nguồn dữ liệu ngẫu nhiên để gieo mầm
bộ tạo số giả ngẫu nhiên trên các hệ thống không có / dev / urandom.

Trên các hệ thống như vậy, thư viện SSL cần một nguồn ngẫu nhiên bên ngoài để khởi tạo.
Tính ngẫu nhiên có thể được cung cấp bởi EGD (xem --egd-tệp dưới đây) hoặc đọc từ bên ngoài
nguồn do người dùng chỉ định. Nếu tùy chọn này không được chỉ định, Wget sẽ tìm kiếm ngẫu nhiên
dữ liệu trong $ RANDFILE hoặc, nếu chưa được đặt, trong $ HOME / .rnd.

Nếu bạn nhận được thông báo "Không thể khởi tạo OpenSSL PRNG; đang tắt SSL." lỗi, bạn nên
cung cấp dữ liệu ngẫu nhiên bằng cách sử dụng một số phương pháp được mô tả ở trên.

--egd-file =hồ sơ
[Chỉ OpenSSL] Sử dụng hồ sơ như ổ cắm EGD. EGD là viết tắt của Xáo trộn Thu thập daemon, Một
chương trình không gian người dùng thu thập dữ liệu từ nhiều nguồn hệ thống không thể đoán trước và
cung cấp nó cho các chương trình khác có thể cần nó. Phần mềm mã hóa, chẳng hạn như
thư viện SSL, cần các nguồn ngẫu nhiên không lặp lại để tạo ra số ngẫu nhiên
bộ tạo được sử dụng để tạo ra các khóa mật mã mạnh.

OpenSSL cho phép người dùng chỉ định nguồn entropy của riêng mình bằng cách sử dụng "RAND_FILE"
biến môi trường. Nếu biến này không được đặt hoặc nếu tệp được chỉ định không
tạo đủ ngẫu nhiên, OpenSSL sẽ đọc dữ liệu ngẫu nhiên từ ổ cắm EGD được chỉ định
bằng cách sử dụng tùy chọn này.

Nếu tùy chọn này không được chỉ định (và lệnh khởi động tương đương không được sử dụng), EGD
không bao giờ được liên lạc. EGD không cần thiết trên các hệ thống Unix hiện đại hỗ trợ
/ dev / urandom.

--không gian
Wget hỗ trợ HSTS (Bảo mật truyền tải nghiêm ngặt HTTP, RFC 6797) theo mặc định. Sử dụng
--không gian để làm cho Wget hoạt động như một UA không tuân thủ HSTS. Do đó, Wget sẽ
bỏ qua tất cả các tiêu đề "Nghiêm ngặt-Vận chuyển-Bảo mật" và sẽ không thực thi bất kỳ
Chính sách HSTS.

--hsts-file =hồ sơ
Theo mặc định, Wget lưu trữ cơ sở dữ liệu HSTS của nó trong ~ / .wget-hsts. Bạn có thể sử dụng --hsts-tệp đến
ghi đè cái này. Wget sẽ sử dụng tệp được cung cấp làm cơ sở dữ liệu HSTS. Tệp đó phải
tuân theo đúng định dạng cơ sở dữ liệu HSTS mà Wget sử dụng. Nếu Wget không thể phân tích cú pháp
tệp được cung cấp, hành vi là không xác định.

Cơ sở dữ liệu HSTS của Wget là một tệp văn bản thuần túy. Mỗi dòng chứa một mục nhập HSTS (ví dụ: a
trang web đã đưa ra tiêu đề "Nghiêm ngặt-Vận chuyển-Bảo mật" và do đó có
đã chỉ định một chính sách HSTS cụ thể sẽ được áp dụng). Các dòng bắt đầu bằng dấu gạch ngang ("#") là
bị bỏ qua bởi Wget. Xin lưu ý rằng mặc dù bàn tay có thể đọc thuận tiện của con người-
hack cơ sở dữ liệu HSTS nói chung không phải là một ý kiến ​​hay.

Một dòng mục nhập HSTS bao gồm một số trường được phân tách bằng một hoặc nhiều khoảng trắng:

" SP [ ] SP SP SP "

Sản phẩm hostnamecổng các trường cho biết tên máy chủ và cổng mà HSTS đã cho
chính sách áp dụng. Các cổng trường có thể bằng XNUMX, và nó sẽ, trong hầu hết các trường hợp. Điều đó
có nghĩa là số cổng sẽ không được tính đến khi quyết định liệu
Chính sách HSTS phải được áp dụng theo một yêu cầu nhất định (chỉ tên máy chủ mới được
đã đánh giá). Khi nào cổng khác XNUMX, cả tên máy chủ đích và cổng sẽ
được đánh giá và chính sách HSTS sẽ chỉ được áp dụng nếu cả hai đều phù hợp. Điều này
tính năng chỉ được bao gồm cho mục đích thử nghiệm / phát triển. The Wget testsuite
(Trong testenv /) tạo cơ sở dữ liệu HSTS với các cổng rõ ràng với mục đích đảm bảo
Hành vi đúng của Wget. Áp dụng các chính sách HSTS cho các cổng khác với các cổng mặc định
không được khuyến khích bởi RFC 6797 (xem Phụ lục B "Sự khác biệt giữa Chính sách HSTS và Chính sách giống nhau-
Chính sách xuất xứ "). Do đó, chức năng này không được sử dụng trong sản xuất
môi trường và cổng thường sẽ bằng không. Ba trường cuối cùng làm những gì chúng là
mong đợi. Cánh đồng include_ subdomains có thể là 1 hoặc 0 và nó báo hiệu liệu
miền phụ của miền đích cũng phải là một phần của chính sách HSTS nhất định.
Sản phẩm tạo ratuổi tối đa các trường giữ các giá trị dấu thời gian khi mục nhập đó là
được tạo (lần đầu tiên được nhìn thấy bởi Wget) và giá trị 'max-age' do HSTS xác định, cho biết cách thức
nếu chính sách HSTS đó vẫn hoạt động, được tính bằng giây kể từ khi
dấu thời gian được lưu trữ trong tạo ra. Khi thời gian đó trôi qua, chính sách HSTS đó sẽ không
còn giá trị và cuối cùng sẽ bị xóa khỏi cơ sở dữ liệu.

Nếu bạn cung cấp cơ sở dữ liệu HSTS của riêng mình qua --hsts-tệp, lưu ý rằng Wget có thể sửa đổi
tệp được cung cấp nếu có bất kỳ thay đổi nào xảy ra giữa các chính sách HSTS được yêu cầu bởi
máy chủ từ xa và những máy chủ trong tệp. Khi Wget tồn tại, nó sẽ cập nhật hiệu quả
Cơ sở dữ liệu HSTS bằng cách viết lại tệp cơ sở dữ liệu với các mục nhập mới.

Nếu tệp được cung cấp không tồn tại, Wget sẽ tạo một tệp. Tệp này sẽ chứa
các mục HSTS mới. Nếu không có mục nhập HSTS nào được tạo (không có "Nghiêm ngặt-Vận chuyển-Bảo mật"
tiêu đề được gửi bởi bất kỳ máy chủ nào) sau đó sẽ không có tệp nào được tạo, thậm chí không
cái trống. Hành vi này áp dụng cho tệp cơ sở dữ liệu mặc định (~ / .wget-hsts) cũng:
nó sẽ không được tạo cho đến khi một số máy chủ thực thi chính sách HSTS.

Cẩn thận để không ghi đè các thay đổi có thể xảy ra bởi các quy trình Wget khác tại
đồng thời trên cơ sở dữ liệu HSTS. Trước khi kết xuất các mục HSTS đã cập nhật trên tệp,
Wget sẽ đọc lại nó và hợp nhất các thay đổi.

Không khuyến khích sử dụng cơ sở dữ liệu HSTS tùy chỉnh và / hoặc sửa đổi cơ sở dữ liệu hiện có. Vì
thông tin thêm về các mối đe dọa an ninh tiềm ẩn phát sinh từ thực tiễn như vậy, xem
phần 14 "Cân nhắc về Bảo mật" của RFC 6797, đặc biệt là phần 14.9 "Sáng tạo
Thao tác với Kho chính sách HSTS ”.

--warc-file =hồ sơ
Sử dụng hồ sơ dưới dạng tệp WARC đích.

--warc-header =chuỗi
Sử dụng chuỗi thành bản ghi warcinfo.

--warc-max-size =kích thước
Đặt kích thước tối đa của tệp WARC thành kích thước.

--warc-cdx
Ghi các tệp chỉ mục CDX.

--warc-decup =hồ sơ
Không lưu trữ các bản ghi được liệt kê trong tệp CDX này.

- không-warc-nén
Không nén tệp WARC bằng GZIP.

--no-warc-digest
Không tính toán tiêu hóa SHA1.

--no-warc-keep-log
Không lưu trữ tệp nhật ký trong bản ghi WARC.

--warc-tempdir =dir
Chỉ định vị trí cho các tệp tạm thời được tạo bởi người viết WARC.

FTP Các lựa chọn
--ftp-user =người sử dụng
--ftp-password =mật khẩu
Chỉ định tên người dùng người sử dụng và mật khẩu mật khẩu trên máy chủ FTP. Nếu không có cái này, hoặc
tùy chọn khởi động tương ứng, mật khẩu được mặc định là -wget @, thường được sử dụng cho
FTP ẩn danh.

Một cách khác để chỉ định tên người dùng và mật khẩu là trong chính URL. Một trong hai phương pháp
tiết lộ mật khẩu của bạn cho bất kỳ ai muốn chạy "ps". Để ngăn chặn mật khẩu
khỏi bị nhìn thấy, hãy lưu trữ chúng trong .wgetrc or .netrcvà đảm bảo bảo vệ các tệp đó
từ những người dùng khác có "chmod". Nếu mật khẩu thực sự quan trọng, đừng để lại
chúng nằm trong các tệp đó --- chỉnh sửa tệp và xóa chúng sau khi Wget có
đã bắt đầu tải xuống.

--no-remove-list
Không xóa tạm thời .list các tệp được tạo bởi truy xuất FTP. Thông thường,
các tệp này chứa danh sách thư mục thô nhận được từ máy chủ FTP. Không
loại bỏ chúng có thể hữu ích cho mục đích gỡ lỗi hoặc khi bạn muốn
dễ dàng kiểm tra nội dung của các thư mục máy chủ từ xa (ví dụ: để xác minh rằng
gương bạn đang chạy đã hoàn tất).

Lưu ý rằng mặc dù Wget ghi vào một tên tệp đã biết cho tệp này, nhưng đây không phải là
lỗ hổng bảo mật trong trường hợp người dùng tạo ra .list một liên kết tượng trưng đến / etc / passwd
hoặc cái gì đó và yêu cầu "root" chạy Wget trong thư mục của anh ấy hoặc cô ấy. Tùy thuộc vào
các tùy chọn được sử dụng, Wget sẽ từ chối viết thư cho .list, làm cho
thao tác đánh dấu cầu / đệ quy / thời gian không thành công hoặc liên kết tượng trưng sẽ bị xóa
và được thay thế bằng thực tế .list hoặc danh sách sẽ được ghi vào một
.listing.số tập tin.

Mặc dù tình huống này không phải là vấn đề, nhưng "root" sẽ không bao giờ chạy Wget trong
thư mục của người dùng không đáng tin cậy. Người dùng có thể làm điều gì đó đơn giản như liên kết
index.html đến / etc / passwd và yêu cầu "root" chạy Wget với -N or -r vì vậy tập tin sẽ
được ghi đè.

- không cầu
Tắt chế độ xem FTP. Globbing đề cập đến việc sử dụng các ký tự đặc biệt giống như shell
(ký tự đại diện), giống *, ?, [] để lấy nhiều hơn một tệp từ cùng một thư mục
ngay lập tức, như:

wget ftp://gnjilux.srk.fer.hr/* .msg

Theo mặc định, tính năng lấp lánh sẽ được bật nếu URL chứa ký tự nhấp nháy. Điều này
tùy chọn này có thể được sử dụng để bật hoặc tắt vĩnh viễn.

Bạn có thể phải trích dẫn URL để bảo vệ nó khỏi bị mở rộng bởi shell của bạn.
Globbing khiến Wget tìm kiếm một danh sách thư mục, dành riêng cho hệ thống. Đây là
tại sao nó hiện chỉ hoạt động với máy chủ Unix FTP (và những máy chủ mô phỏng Unix "ls"
đầu ra).

--no-thụ động-ftp
Vô hiệu hóa việc sử dụng thụ động Chế độ truyền FTP. FTP thụ động yêu cầu
máy khách kết nối với máy chủ để thiết lập kết nối dữ liệu thay vì kết nối khác
cách xung quanh.

Nếu máy được kết nối trực tiếp với Internet, cả FTP thụ động và tích cực
nên hoạt động tốt như nhau. Đằng sau hầu hết các cấu hình tường lửa và NAT, FTP thụ động có
một cơ hội làm việc tốt hơn. Tuy nhiên, trong một số cấu hình tường lửa hiếm hoi, FTP hoạt động
thực sự hoạt động khi FTP thụ động không. Nếu bạn nghi ngờ đây là trường hợp, hãy sử dụng
hoặc đặt "passive_ftp = off" trong tệp init của bạn.

- bảo tồn quyền
Giữ quyền truy cập tệp từ xa thay vì quyền do umask đặt.

--retr-liên kết tượng trưng
Theo mặc định, khi truy xuất các thư mục FTP một cách đệ quy và một liên kết tượng trưng là
gặp phải, liên kết tượng trưng được duyệt và các tệp trỏ đến được truy xuất.
Hiện tại, Wget không duyệt các liên kết tượng trưng đến các thư mục để tải chúng xuống
đệ quy, mặc dù tính năng này có thể được thêm vào trong tương lai.

Thời Gian --retr-symlinks = không được chỉ định, tệp được liên kết đến không được tải xuống. Thay thế,
một liên kết tượng trưng phù hợp được tạo trên hệ thống tệp cục bộ. Tệp trỏ đến sẽ
không được truy xuất trừ khi truy xuất đệ quy này sẽ gặp nó một cách riêng biệt
và vẫn tải xuống. Tùy chọn này gây ra rủi ro bảo mật trong đó FTP độc hại
Máy chủ có thể khiến Wget ghi vào các tệp bên ngoài các thư mục dự định thông qua
tệp .LISTING được chế tạo đặc biệt.

Lưu ý rằng khi truy xuất một tệp (không phải một thư mục) vì nó đã được chỉ định trên
dòng lệnh, thay vì vì nó đã được đệ quy thành, tùy chọn này không có hiệu lực.
Các liên kết tượng trưng luôn được chuyển qua trong trường hợp này.

FTPS Các lựa chọn
--ftps-ẩn
Tùy chọn này yêu cầu Wget sử dụng FTPS một cách ngầm định. FTPS ngầm bao gồm khởi tạo
SSL / TLS ngay từ đầu của kết nối điều khiển. Tùy chọn này không gửi
lệnh "AUTH TLS": nó giả định máy chủ nói FTPS và trực tiếp bắt đầu
Kết nối SSL / TLS. Nếu nỗ lực thành công, phiên tiếp tục giống như
FTPS thông thường ("PBSZ" và "PROT" được gửi, v.v.). FTPS ngầm không còn là
yêu cầu triển khai FTPS và do đó nhiều máy chủ có thể không hỗ trợ nó. Nếu như
--ftps-ẩn được chuyển và không có số cổng rõ ràng được chỉ định, cổng mặc định cho
FTPS ngầm, 990, sẽ được sử dụng, thay vì cổng mặc định cho "bình thường"
(rõ ràng) FTPS giống như của FTP, 21.

--no-ftps-sơ yếu lý lịch-ssl
Không tiếp tục phiên SSL / TLS trong kênh dữ liệu. Khi bắt đầu một dữ liệu
kết nối, Wget cố gắng tiếp tục phiên SSL / TLS đã bắt đầu trước đó trong điều khiển
sự liên quan. Việc khôi phục lại phiên SSL / TLS tránh thực hiện một cú bắt tay hoàn toàn mới bằng cách
sử dụng lại các tham số SSL / TLS của phiên trước đó. Thông thường, các máy chủ FTPS muốn
theo cách đó, vì vậy Wget thực hiện điều này theo mặc định. Tuy nhiên, trong những trường hợp hiếm hoi, người ta có thể
muốn bắt đầu phiên SSL / TLS hoàn toàn mới trong mọi kết nối dữ liệu. Đây là những gì
--no-ftps-sơ yếu lý lịch-ssl là cho.

--ftps-xóa-dữ liệu-kết nối
Tất cả các kết nối dữ liệu sẽ ở dạng văn bản thuần túy. Chỉ kết nối điều khiển sẽ
theo SSL / TLS. Wget sẽ gửi một lệnh "PROT C" để đạt được điều này, lệnh này phải là
được chấp thuận bởi máy chủ.

--ftps-dự phòng-sang-ftp
Quay lại FTP nếu FTPS không được máy chủ đích hỗ trợ. Vì lý do bảo mật,
tùy chọn này không được xác nhận theo mặc định. Hành vi mặc định là thoát với một
lỗi. Nếu máy chủ không trả lời thành công lệnh "AUTH TLS" ban đầu hoặc
trong trường hợp FTPS ngầm định, nếu nỗ lực kết nối SSL / TLS ban đầu bị từ chối,
nó được coi là máy chủ đó không hỗ trợ FTPS.

Đệ quy Truy xuất Các lựa chọn
-r
--đệ quy
Bật truy xuất đệ quy. Độ sâu tối đa mặc định là 5.

-l chiều sâu
--level =chiều sâu
Chỉ định mức độ sâu tối đa của đệ quy chiều sâu.

--xóa-sau
Tùy chọn này yêu cầu Wget xóa từng tệp mà nó tải xuống, sau khi đã làm như vậy.
Nó hữu ích cho việc tìm nạp trước các trang phổ biến thông qua proxy, ví dụ:

wget -r -nd --delete-after http://whatever.com/~popular/page/

Sản phẩm -r tùy chọn là truy xuất đệ quy, và -NS để không tạo thư mục.

Lưu ý rằng --xóa-sau xóa các tệp trên máy cục bộ. Nó không phát hành
GIAO HÀNG chẳng hạn như lệnh tới các trang FTP từ xa. Cũng lưu ý rằng khi --xóa-sau is
chỉ định, --convert-liên kết bị bỏ qua, vì vậy .orig các tệp đơn giản là không được tạo trong
địa điểm đầu tiên.

-k
--convert-liên kết
Sau khi tải xuống hoàn tất, hãy chuyển đổi các liên kết trong tài liệu thành
thích hợp để xem tại địa phương. Điều này không chỉ ảnh hưởng đến các siêu liên kết hiển thị mà còn ảnh hưởng đến bất kỳ
một phần của tài liệu liên kết đến nội dung bên ngoài, chẳng hạn như hình ảnh được nhúng, liên kết đến
trang định kiểu, siêu liên kết đến nội dung không phải HTML, v.v.

Mỗi liên kết sẽ được thay đổi theo một trong hai cách:

· Các liên kết đến các tệp đã được tải xuống bởi Wget sẽ được thay đổi để tham khảo
tệp mà họ trỏ đến dưới dạng một liên kết tương đối.

Ví dụ: nếu tệp đã tải xuống /foo/doc.html liên kết đến /thanh/img.gif, Vì vậy,
đã tải xuống, sau đó liên kết trong doc.html sẽ được sửa đổi để trỏ đến ../bar/img.gif.
Loại chuyển đổi này hoạt động đáng tin cậy đối với các kết hợp tùy ý của
thư mục.

· Các liên kết đến các tệp chưa được tải xuống bởi Wget sẽ được thay đổi thành
bao gồm tên máy chủ và đường dẫn tuyệt đối của vị trí mà chúng trỏ đến.

Ví dụ: nếu tệp đã tải xuống /foo/doc.html liên kết đến /thanh/img.gif (hoặc để
../bar/img.gif), sau đó là liên kết trong doc.html sẽ được sửa đổi để trỏ đến
http://hostname/bar/img.gif.

Do đó, trình duyệt cục bộ hoạt động một cách đáng tin cậy: nếu một tệp được liên kết đã được tải xuống,
liên kết sẽ tham chiếu đến tên địa phương của nó; nếu nó không được tải xuống, liên kết sẽ tham chiếu đến
địa chỉ Internet đầy đủ của nó thay vì hiển thị một liên kết bị hỏng. Thực tế là
các liên kết cũ được chuyển đổi thành liên kết tương đối đảm bảo rằng bạn có thể di chuyển các liên kết đã tải xuống
phân cấp đến một thư mục khác.

Lưu ý rằng chỉ khi kết thúc quá trình tải xuống, Wget mới có thể biết được những liên kết nào đã được
đã tải xuống. Do đó, công việc được thực hiện bởi -k sẽ được thực hiện ở cuối tất cả
tải xuống.

--convert-only-file
Tùy chọn này chỉ chuyển đổi phần tên tệp của URL, để lại phần còn lại của URL
không bị đụng chạm. Phần tên tệp này đôi khi được gọi là "tên cơ sở", mặc dù chúng tôi
tránh thuật ngữ đó ở đây để không gây nhầm lẫn.

Nó hoạt động đặc biệt tốt khi kết hợp với --điều chỉnh-mở rộng, mặc dù điều này
khớp nối không được thực thi. Nó tỏ ra hữu ích khi đưa các tệp vào bộ nhớ đệm Internet
được tải xuống từ các máy chủ khác nhau.

Ví dụ: nếu một số liên kết trỏ đến //foo.com/bar.cgi?xyz với --điều chỉnh-mở rộng khẳng định
và điểm đến địa phương của nó được dự định là ./foo.com/bar.cgi?xyz.css, sau đó là liên kết
sẽ được chuyển đổi thành //foo.com/bar.cgi?xyz.css. Lưu ý rằng chỉ phần tên tệp có
đã được sửa đổi. Phần còn lại của URL đã được giữ nguyên, bao gồm cả đường dẫn ròng
("//") nếu không sẽ được Wget xử lý và chuyển đổi thành hiệu lực
lược đồ (tức là. "http: //").

-K
- dự phòng đã chuyển đổi
Khi chuyển đổi tệp, hãy sao lưu phiên bản gốc bằng .orig hậu tố. Ảnh hưởng đến
hành vi của -N.

-m
--gương
Bật các tùy chọn phù hợp để phản chiếu. Tùy chọn này bật đệ quy và thời gian-
dập, đặt độ sâu đệ quy vô hạn và giữ danh sách thư mục FTP. Nó là
hiện tương đương với -r -N -l inf --no-remove-list.

-p
- trang-điều kiện cần
Tùy chọn này khiến Wget tải xuống tất cả các tệp cần thiết để
hiển thị một trang HTML nhất định. Điều này bao gồm những thứ như hình ảnh nội tuyến, âm thanh và
các bảng định kiểu được tham chiếu.

Thông thường, khi tải xuống một trang HTML, bất kỳ tài liệu cần thiết nào có thể
cần thiết để hiển thị nó đúng cách sẽ không được tải xuống. Sử dụng -r Cùng với -l có thể giúp,
nhưng vì thông thường Wget không phân biệt giữa tài liệu bên ngoài và tài liệu nội tuyến,
một thường chỉ còn lại "tài liệu lá" mà thiếu các điều kiện cần thiết của họ.

Ví dụ, nói tài liệu 1.html chứa một " tham chiếu thẻ " 1.gif và một
thẻ "" trỏ đến tài liệu bên ngoài 2.html. Nói rằng 2.html tương tự nhưng điều đó
hình ảnh của nó là 2.gif và nó liên kết đến 3.html. Nói điều này tiếp tục đến một số tùy ý
số cao.

Nếu một người thực hiện lệnh:

wget -r -l 2 http: // /1.html

sau đó 1.html, 1.gif, 2.html, 2.gif3.html sẽ được tải xuống. Bạn có thể thấy,
3.html là không có điều kiện cần thiết của nó 3.gif bởi vì Wget chỉ đơn giản là đếm số lượng
nhảy (lên đến 2) cách xa 1.html để xác định vị trí dừng đệ quy.
Tuy nhiên, với lệnh này:

wget -r -l 2 -p http: // /1.html

tất cả các tệp trên 3.htmlđiều kiện cần thiết 3.gif sẽ được tải xuống. Tương tự,

wget -r -l 1 -p http: // /1.html

sẽ gây ra 1.html, 1.gif, 2.html2.gif để được tải xuống. Người ta có thể nghĩ rằng:

wget -r -l 0 -p http: // /1.html

sẽ chỉ tải xuống 1.html1.gif, nhưng tiếc là đây không phải là trường hợp, bởi vì
-l 0 tương đương với -l inf--- đó là, đệ quy vô hạn. Để tải xuống một HTML duy nhất
trang (hoặc một số ít trong số chúng, tất cả đều được chỉ định trên dòng lệnh hoặc trong -i Đầu vào URL
tệp) và các điều kiện cần thiết của nó (hoặc của chúng), chỉ cần bỏ đi -r-l:

wget -p http: // /1.html

Lưu ý rằng Wget sẽ hoạt động như thể -r đã được chỉ định, nhưng chỉ trang duy nhất đó và
các điều kiện cần thiết của nó sẽ được tải xuống. Các liên kết từ trang đó đến các tài liệu bên ngoài sẽ
không được theo dõi. Trên thực tế, để tải xuống một trang và tất cả các điều kiện cần thiết của nó (ngay cả khi
chúng tồn tại trên các trang web riêng biệt) và đảm bảo lô hiển thị đúng cục bộ,
tác giả này muốn sử dụng một vài tùy chọn ngoài -p:

wget -E -H -k -K -p http: // /

Để kết thúc chủ đề này, cần biết rằng ý tưởng của Wget về một tài liệu bên ngoài
liên kết là bất kỳ URL nào được chỉ định trong thẻ "", một " "tag hoặc" "gắn thẻ khác
hơn " ".

- bình luận hạn chế
Bật phân tích cú pháp nghiêm ngặt các nhận xét HTML. Mặc định là chấm dứt nhận xét tại
sự xuất hiện đầu tiên của ->.

Theo thông số kỹ thuật, các chú thích HTML được thể hiện dưới dạng SGML tờ khai.
Khai báo là đánh dấu đặc biệt bắt đầu bằng <! và kết thúc bằng >, Chẳng hạn như <!DOCTYPE
...>, có thể chứa các nhận xét giữa một cặp -- dấu phân cách. Nhận xét HTML là
"khai báo trống", khai báo SGML không có bất kỳ văn bản không chú thích nào. Vì vậy,
là một nhận xét hợp lệ, và cũng vậy <!--một-- --two ->, Nhưng không phải là.

Mặt khác, hầu hết người viết HTML không coi các nhận xét là bất kỳ thứ gì khác ngoài
văn bản được phân tách bằng <!--->, không hoàn toàn giống nhau. Ví dụ, một cái gì đó
Lượt thích hoạt động như một nhận xét hợp lệ miễn là số dấu gạch ngang là
bội số của bốn (!). Nếu không, nhận xét về mặt kỹ thuật sẽ kéo dài cho đến lần tiếp theo --, Mà
có thể ở đầu kia của tài liệu. Do đó, nhiều trình duyệt phổ biến
hoàn toàn bỏ qua thông số kỹ thuật và triển khai những gì người dùng mong đợi:
nhận xét được phân tách bằng <!--->.

Cho đến phiên bản 1.9, Wget đã giải thích các nhận xét một cách chặt chẽ, dẫn đến việc thiếu các liên kết
trong nhiều trang web hiển thị tốt trên các trình duyệt, nhưng không may là
chứa các bình luận không tuân thủ. Bắt đầu từ phiên bản 1.9, Wget đã tham gia
xếp hạng khách hàng thực hiện các nhận xét "ngây thơ", chấm dứt mỗi nhận xét tại
sự xuất hiện đầu tiên của ->.

Nếu, vì bất kỳ lý do gì, bạn muốn phân tích cú pháp nhận xét chặt chẽ, hãy sử dụng tùy chọn này để biến nó
vào.

Đệ quy Chấp nhận / Từ chối Các lựa chọn
-A danh sách --Chấp nhận danh sách
-R từ chối --Từ chối từ chối
Chỉ định danh sách được phân tách bằng dấu phẩy gồm các hậu tố hoặc mẫu tên tệp để chấp nhận hoặc từ chối.
Lưu ý rằng nếu có bất kỳ ký tự đại diện nào, *, ?, [ or ], xuất hiện trong một phần tử của
danh sách or từ chối, nó sẽ được coi là một mẫu chứ không phải là một hậu tố. Trong này
trường hợp, bạn phải đặt mẫu vào dấu ngoặc kép để ngăn vỏ của bạn mở rộng
nó, như trong -A "* .mp3" or -A '* .mp3'.

--chấp nhận-regex urlregex
--từ chối-regex urlregex
Chỉ định một biểu thức chính quy để chấp nhận hoặc từ chối URL hoàn chỉnh.

--regex-loại kiểu biểu thức chính quy
Chỉ định loại biểu thức chính quy. Các loại có thể là posix or máy tính. Lưu ý rằng
có thể sử dụng máy tính loại, wget phải được biên dịch với sự hỗ trợ của libpcre.

-D danh sách miền
--domains =danh sách miền
Đặt các miền sẽ được theo dõi. danh sách miền là danh sách các miền được phân tách bằng dấu phẩy. Ghi chú
nó làm không bật -H.

--exclude-domain danh sách miền
Chỉ định các miền không được theo dõi.

--theo dõi-ftp
Theo các liên kết FTP từ các tài liệu HTML. Nếu không có tùy chọn này, Wget sẽ bỏ qua tất cả
Các liên kết FTP.

--follow-tags =
Wget có một bảng nội bộ gồm các cặp thẻ / thuộc tính HTML mà nó xem xét khi
tìm kiếm các tài liệu được liên kết trong quá trình truy xuất đệ quy. Nếu người dùng chỉ muốn một
tập hợp con của các thẻ đó sẽ được xem xét, tuy nhiên, người đó phải được chỉ định các thẻ như vậy
được phân tách bằng dấu phẩy với tùy chọn này.

--ignore-tags =
Điều này trái ngược với --follow-thẻ lựa chọn. Để bỏ qua các thẻ HTML nhất định khi
đệ quy tìm kiếm tài liệu để tải xuống, chỉ định chúng bằng dấu phẩy được phân tách .

Trước đây, tùy chọn này là cách tốt nhất để tải xuống một trang và
điều kiện cần, sử dụng dòng lệnh như:

wget --ignore-tags = a, area -H -k -K -r http: // /

Tuy nhiên, tác giả của tùy chọn này đã xem một trang có các thẻ như "
HREF = "/"> "và nhận ra rằng việc chỉ định các thẻ để bỏ qua là không đủ.
Người ta không thể chỉ bảo Wget bỏ qua " ", bởi vì khi đó các bảng định kiểu sẽ không
đã tải xuống. Bây giờ, đặt cược tốt nhất để tải xuống một trang duy nhất và điều kiện cần là
dành riêng - trang-điều kiện cần tùy chọn.

--bỏ qua trường hợp
Bỏ qua trường hợp khi khớp tệp và thư mục. Điều này ảnh hưởng đến hành vi của -R,
Các tùy chọn -A, -I, và -X, cũng như việc triển khai toàn cầu khi tải xuống từ FTP
các trang web. Ví dụ: với tùy chọn này, -A "* .txt" sẽ phù hợp tệp1.txt, Mà còn
tệp2.TXT, tệp3.TxT, và như thế. Các dấu ngoặc kép trong ví dụ là để ngăn chặn trình bao
từ việc mở rộng mô hình.

-H
- máy chủ sải
Cho phép mở rộng trên các máy chủ khi thực hiện truy xuất đệ quy.

-L
--quan hệ
Chỉ theo các liên kết tương đối. Hữu ích để truy xuất một trang chủ cụ thể mà không có
sự phân tâm, thậm chí không phải từ cùng một máy chủ.

-I
--include-directory =
Chỉ định danh sách thư mục được phân tách bằng dấu phẩy mà bạn muốn theo dõi khi tải xuống.
Các yếu tố của có thể chứa các ký tự đại diện.

-X
--exclude-directory =
Chỉ định danh sách các thư mục được phân tách bằng dấu phẩy mà bạn muốn loại trừ khỏi tải xuống.
Các yếu tố của có thể chứa các ký tự đại diện.

-np
--không có cha mẹ
Không bao giờ đi lên thư mục mẹ khi truy xuất đệ quy. Đây là một
tùy chọn hữu ích, vì nó đảm bảo rằng chỉ các tệp phía dưới một hệ thống phân cấp nhất định sẽ
được tải xuống.

MÔI TRƯỜNG


Wget hỗ trợ proxy cho cả truy xuất HTTP và FTP. Cách tiêu chuẩn để chỉ định proxy
vị trí mà Wget nhận ra, đang sử dụng các biến môi trường sau:

http Proxy
https_proxy
Nếu được đặt, http Proxyhttps_proxy các biến phải chứa URL của
proxy cho các kết nối HTTP và HTTPS tương ứng.

ftp_proxy
Biến này phải chứa URL của proxy cho các kết nối FTP. Nó khá là
chung đó http Proxyftp_proxy được đặt thành cùng một URL.

không có proxy
Biến này phải chứa danh sách proxy được phân tách bằng dấu phẩy của phần mở rộng tên miền nên
không được sử dụng cho. Ví dụ: nếu giá trị của không có proxy is .mit.edu, proxy sẽ không
được sử dụng để lấy tài liệu từ MIT.

EXIT TÌNH TRẠNG


Wget có thể trả về một trong số các mã lỗi nếu nó gặp sự cố.

0 Không có vấn đề gì xảy ra.

1 Mã lỗi chung.

2 Lỗi phân tích cú pháp --- ví dụ: khi phân tích cú pháp các tùy chọn dòng lệnh, .wgetrc or
.netrchữu ích. Cảm ơn !

3 Lỗi I / O tệp.

4 Lỗi mạng.

5 Lỗi xác minh SSL.

6 Không xác thực được tên người dùng / mật khẩu.

7 Lỗi giao thức.

8 Máy chủ đưa ra phản hồi lỗi.

Với các ngoại lệ của 0 và 1, các mã thoát được đánh số thấp hơn sẽ được ưu tiên hơn các mã cao hơn-
đánh số, khi gặp nhiều loại lỗi.

Trong các phiên bản của Wget trước 1.12, trạng thái thoát của Wget có xu hướng không hữu ích và
không nhất quán. Tải xuống đệ quy hầu như luôn trả về 0 (thành công), bất kể
bất kỳ vấn đề nào gặp phải và tìm nạp không đệ quy chỉ trả về trạng thái tương ứng
cho lần tải xuống được cố gắng gần đây nhất.

Sử dụng wget trực tuyến bằng các dịch vụ onworks.net


Máy chủ & Máy trạm miễn phí

Tải xuống ứng dụng Windows & Linux

Lệnh Linux

Ad