EnglezăFrancezăSpaniolă

Rulați servere | Ubuntu > | Fedora > |


Favicon OnWorks

wget - Online în cloud

Rulați wget în furnizorul de găzduire gratuit OnWorks prin Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

Aceasta este comanda wget care poate fi rulată în furnizorul de găzduire gratuit OnWorks folosind una dintre multiplele noastre stații de lucru online gratuite, cum ar fi Ubuntu Online, Fedora Online, emulator online Windows sau emulator online MAC OS

PROGRAM:

NUME


Wget - Descărcătorul de rețea non-interactiv.

REZUMAT


wget [opțiune]... [URL-ul] ...

DESCRIERE


GNU Wget este un utilitar gratuit pentru descărcarea non-interactivă a fișierelor de pe Web. Aceasta
acceptă protocoalele HTTP, HTTPS și FTP, precum și preluarea prin proxy HTTP.

Wget este non-interactiv, ceea ce înseamnă că poate funcționa în fundal, în timp ce utilizatorul nu este
logat. Acest lucru vă permite să începeți o recuperare și să vă deconectați de la sistem, permițând
Să terminăm lucrarea. În schimb, majoritatea browserelor Web necesită un utilizator constant
prezență, care poate fi o mare piedică atunci când transferați o mulțime de date.

Wget poate urma link-uri din paginile HTML, XHTML și CSS, pentru a crea versiuni locale ale telecomenzii
site-uri web, recreând complet structura de directoare a site-ului original. Aceasta este
uneori denumită „descărcare recursiv”. În timp ce face asta, Wget respectă
Standard de excludere a robotilor (/roboți.txt). Wget poate fi instruit să convertească linkurile în
fișierele descărcate pentru a indica fișierele locale, pentru vizualizare offline.

Wget a fost proiectat pentru robustețe pe conexiuni de rețea lente sau instabile; în cazul în care o
Descărcarea eșuează din cauza unei probleme de rețea, va continua să reîncerce până când întregul fișier are
fost recuperat. Dacă serverul acceptă regetting, acesta va instrui serverul să continue
descărcarea de unde a rămas.

Wget nu acceptă liste de revocare a clienților (CRL-uri), deci certificatul HTTPS care sunteți
conectarea la ar putea fi revocată de proprietarul site-ului.

OPŢIUNI


Opțiune Sintaxă
Deoarece Wget folosește GNU getopt pentru a procesa argumentele liniei de comandă, fiecare opțiune are o formă lungă
împreună cu cel scurt. Opțiunile lungi sunt mai convenabile de reținut, dar necesită timp
tip. Puteți amesteca liber diferite stiluri de opțiuni sau puteți specifica opțiuni după comanda-
argumente de linie. Astfel puteți scrie:

wget -r --tries=10 http://fly.srk.fer.hr/ -o jurnal

Spațiul dintre opțiunea care acceptă un argument și argument poate fi omis.
În loc de -o log poti sa scrii -olog.

Puteți pune împreună mai multe opțiuni care nu necesită argumente, cum ar fi:

wget -drc

Acest lucru este complet echivalent cu:

wget -d -r -c

Deoarece opțiunile pot fi specificate după argumente, le puteți termina cu --.
Deci următoarele vor încerca să descarce URL-ul -x, raportând eșecul către log:

wget -o log -- -x

Opțiunile care acceptă liste separate prin virgulă respectă toate convenția care specifică
o listă goală își șterge valoarea. Acest lucru poate fi util pentru a șterge .wgetrc setări. Pentru
de exemplu, dacă dvs .wgetrc setează „exclude_directories” la /cgi-bin, exemplul următor
îl va reseta mai întâi, apoi îl va seta să excludă /~nimeni și /~cineva. Puteți, de asemenea,
șterge listele în .wgetrc.

wget -X " -X /~nimeni,/~cineva

Cele mai multe opțiuni care nu acceptă argumente sunt boolean opțiuni, numite așa pentru că lor
starea poate fi capturată cu o variabilă da sau nu ("booleană"). De exemplu, --follow-ftp
îi spune lui Wget să urmeze legăturile FTP din fișierele HTML și, pe de altă parte, --no-glob îi spune
să nu efectueze stocarea fișierelor pe adresele URL FTP. O opțiune booleană este fie afirmativ or
negativ (incepand cu --Nu). Toate aceste opțiuni au mai multe proprietăți.

Dacă nu este specificat altfel, se presupune că comportamentul implicit este opusul a ceea ce
optiunea realizeaza. De exemplu, existența documentată a --follow-ftp presupune
că implicit este să nu urmați legăturile FTP din paginile HTML.

Opțiunile afirmative pot fi anulate adăugând înainte --Nu- la numele opțiunii; negativ
opțiunile pot fi anulate prin omiterea --Nu- prefix. Acest lucru ar putea părea de prisos --- dacă
implicit pentru o opțiune afirmativă este să nu faci ceva, atunci de ce să oferi o modalitate de a
îl dezactivează în mod explicit? Dar fișierul de pornire poate schimba de fapt valoarea implicită. Pentru
exemplu, folosind „follow_ftp = on” în .wgetrc face Wget urma Legături FTP în mod implicit și
folosind --no-follow-ftp este singura modalitate de a restabili valorile implicite din fabrică din comandă
linia.

de bază Startup Opţiuni
-V
--versiune
Afișați versiunea de Wget.

-h
--Ajutor
Imprimați un mesaj de ajutor care descrie toate opțiunile de linie de comandă ale Wget.

-b
--fundal
Mergeți în fundal imediat după pornire. Dacă nu este specificat niciun fișier de ieșire prin intermediul
-o, ieșirea este redirecționată către wget-log.

-e comandă
--a executa comandă
Executa comandă de parcă ar fi o parte din .wgetrc. O comandă astfel invocată va fi
executat după comenzile în .wgetrc, având astfel prioritate asupra lor. Dacă aveți nevoie
pentru a specifica mai mult de o comandă wgetrc, utilizați mai multe instanțe ale -e.

Exploatari forestiere și Intrare Fișier Opţiuni
-o fișier jurnal
--output-file=fișier jurnal
Înregistrați toate mesajele la fișier jurnal. Mesajele sunt în mod normal raportate la eroare standard.

-a fișier jurnal
--append-output=fișier jurnal
Adăuga la fișier jurnal. Aceasta este la fel ca -o, doar se anexează la fișier jurnal în loc de
suprascriind vechiul fișier jurnal. Dacă fișier jurnal nu există, este creat un fișier nou.

-d
--depanare
Activați ieșirea de depanare, adică diverse informații importante pentru dezvoltatorii Wget
daca nu functioneaza corect. Este posibil ca administratorul dvs. de sistem să fi ales să compileze
Wget fără suport de depanare, caz în care -d nu va funcționa. Vă rugăm să rețineți că
compilarea cu suport de depanare este întotdeauna sigur --- Wget compilat cu suport de depanare
voi nu tipăriți orice informații de depanare, dacă nu sunt solicitate cu -d.

-q
--Liniște
Opriți ieșirea lui Wget.

-v
--verbos
Activați ieșirea verbosă, cu toate datele disponibile. Ieșirea implicită este verbose.

-nv
--nu-verbos
Dezactivați verbose fără a fi complet liniștit (utilizați -q pentru asta), ceea ce înseamnă că
mesajele de eroare și informațiile de bază sunt încă tipărite.

--raport-viteza=tip
Lățimea de bandă de ieșire ca tip. Singura valoare acceptată este biţi.

-i fişier
--input-file=fişier
Citiți adrese URL de la un local sau extern fişier. Dacă - este specificat ca fişier, URL-urile sunt citite
de la intrarea standard. (Utilizare ./- pentru a citi dintr-un fișier numit literalmente -.)

Dacă se utilizează această funcție, nu trebuie să fie prezente adrese URL pe linia de comandă. Dacă există
URL-uri atât pe linia de comandă, cât și într-un fișier de intrare, cele de pe liniile de comandă vor fi
primele care au fost recuperate. Dacă --force-html nu este specificat, atunci fişier
constau dintr-o serie de adrese URL, una pe linie.

Totuși, dacă specificați --force-html, documentul va fi considerat ca html. In aceea
în cazul în care este posibil să aveți probleme cu legăturile relative, pe care le puteți rezolva fie prin adăugare
"url">" la documente sau prin precizarea --bază=url pe linia de comandă.

În cazul în care fişier este unul extern, documentul va fi tratat automat ca html if
se potrivește tipul de conținut text / html. În plus, fişierlocația lui va fi
folosit implicit ca href de bază dacă nu a fost specificat niciunul.

--input-metalink=fişier
Descărcă fișiere acoperite în Metalink local fişier. Metalink versiunile 3 și 4 sunt
sprijinit.

--metalink-over-http
Emite cererea HTTP HEAD în loc de GET și extrage metadatele Metalink din răspuns
antete. Apoi trece la descărcarea Metalink. Dacă nu există metadate Metalink valide
găsit, se întoarce la descărcarea HTTP obișnuită.

--Locație preferata
Setați locația preferată pentru resursele Metalink. Acest lucru are efect dacă mai multe resurse
cu aceeași prioritate sunt disponibile.

-F
--force-html
Când intrarea este citită dintr-un fișier, forțați-l să fie tratat ca fișier HTML. Acest lucru permite
pentru a prelua link-uri relative din fișierele HTML existente de pe discul local, prin adăugare
"url">" la HTML, sau folosind --baza opțiunea de linie de comandă.

-B URL-ul
--bază=URL-ul
Rezolvă legăturile relative folosind URL-ul ca punct de referință, atunci când citiți link-uri din
un fișier HTML specificat prin intermediul -i/--fișier de intrare opțiunea (împreună cu --force-html, Sau
când fișierul de intrare a fost preluat de la distanță de pe un server care îl descrie ca HTML). Aceasta este
echivalent cu prezența unei etichete „BASE” în ​​fișierul de intrare HTML, cu URL-ul ca
valoare pentru atributul „href”.

De exemplu, dacă specificați http://foo/bar/a.html pentru URL-ul, iar Wget citește
../baz/b.html din fișierul de intrare, ar fi rezolvat http://foo/baz/b.html.

--config=FILE
Specificați locația unui fișier de pornire pe care doriți să îl utilizați.

--rejected-log=fișier jurnal
Înregistrează toate respingerea adreselor URL la fișier jurnal ca valori separate prin virgulă. Valorile includ
motivul respingerii, adresa URL și adresa URL părinte în care a fost găsit.

Descarcă Opţiuni
--bind-address=ADRESA
Când faceți conexiuni client TCP/IP, legați-vă la ADRESA pe mașina locală. ADRESA
poate fi specificat ca nume de gazdă sau adresă IP. Această opțiune poate fi utilă dacă dvs
mașina este legată de mai multe IP-uri.

-t număr
--încearcă=număr
Setați numărul de încercări la număr. Specificați 0 sau INF pentru reîncercare infinită. Valoarea implicită este
pentru a reîncerca de 20 de ori, cu excepția erorilor fatale precum „conexiune refuzată” sau
„not found” (404), care nu sunt reîncercate.

-O fişier
--output-document=fişier
Documentele nu vor fi scrise în dosarele corespunzătoare, dar toate vor fi
concatenate împreună și scrise către fişier. Dacă - este folosit ca fişier, documentele vor fi
tipărit la ieșire standard, dezactivând conversia linkului. (Utilizare ./- pentru a imprima într-un fișier
numit literal -.)

Utilizarea de -O is nu menită să însemne pur și simplu „folosește numele fişier în locul celui din
URL;" mai degrabă, este analog cu redirecționarea shell: wget -O fişier http://foo is
destinat să funcționeze ca wget -O - http://foo > fişier; fişier va fi trunchiat imediat,
și toate conținutul descărcat va fi scris acolo.

Din acest motiv, -N (pentru verificarea marcajului de timp) nu este acceptat în combinație cu -O:
întrucât fişier este întotdeauna nou creat, va avea întotdeauna un marcaj de timp foarte nou. A
va fi emis un avertisment dacă se utilizează această combinație.

În mod similar, folosind -r or -p cu -O este posibil să nu funcționeze așa cum vă așteptați: Wget nu se va descărca doar
primul dosar la fişier și apoi descărcați restul în numele lor normale: toate
conținutul descărcat va fi plasat în fişier. Aceasta a fost dezactivată în versiunea 1.11, dar a făcut-o
a fost reinstalat (cu un avertisment) în 1.11.2, deoarece există unele cazuri în care acest lucru
comportamentul poate avea de fapt un anumit folos.

O combinație cu -nc este acceptat numai dacă fișierul de ieșire dat nu există.

Rețineți că o combinație cu -k este permis numai la descărcarea unui singur document,
ca în acest caz, va converti doar toate URI-urile relative în cele externe; -k face nu
sens pentru mai multe URI atunci când toate sunt descărcate într-un singur fișier; -k poate fi
folosit numai atunci când rezultatul este un fișier obișnuit.

-nc
--no-clobber
Dacă un fișier este descărcat de mai multe ori în același director, comportamentul lui Wget depinde
pe câteva opțiuni, inclusiv -nc. În anumite cazuri, fișierul local va fi înfundat,
sau suprascris, la descărcare repetată. În alte cazuri se va păstra.

Când rulați Wget fără -N, -nc, -r, Sau -p, descarcând același fișier în același
directorul va avea ca rezultat copia originală a fişier fiind păstrat şi al doilea exemplar
fiind numit fişier.1. Dacă acel fișier este descărcat din nou, a treia copie va fi
numit fişier.2, si asa mai departe. (Acesta este și comportamentul cu -nd, chiar dacă -r or -p sunt în
efect.) Când -nc este specificat, acest comportament este suprimat și Wget va refuza
descărcați copii mai noi ale fişier. Prin urmare, „„no-clobber”” este de fapt o denumire greșită în
acest mod --- nu este împiedicat clobbering (cum erau deja sufixele numerice
prevenirea clobbering-ului), ci mai degrabă salvarea versiunilor multiple care este împiedicată.

Când rulați Wget cu -r or -p, Dar fără -N, -nd, Sau -nc, re-descărcând un fișier
va avea ca rezultat noua copie pur și simplu suprascriind cea veche. Adăugând -nc va preveni acest lucru
comportament, determinând în schimb păstrarea versiunii originale și a oricăror copii mai noi
serverul să fie ignorat.

Când rulați Wget cu -N, cu sau fără -r or -p, decizia dacă sau nu
pentru a descărca o copie mai nouă a unui fișier depinde de marcajul de timp și de dimensiunea locală și de la distanță
a dosarului. -nc poate să nu fie specificată în același timp cu -N.

O combinație cu -O/--document-ieșire este acceptat numai dacă fișierul de ieșire dat o face
nu exista.

Rețineți că atunci când -nc este specificat, fișierele cu sufixele . Html or .htm va fi încărcat
de pe discul local și analizate ca și cum ar fi fost preluate de pe Web.

--backup-uri=backup-uri
Înainte de a (supra)scrie un fișier, faceți o copie de rezervă a unui fișier existent adăugând o .1 sufix (_1 on
VMS) la numele fișierului. Astfel de fișiere de rezervă sunt rotite la .2, .3, și așa mai departe, până la
backup-uri (și pierdut dincolo de asta).

-c
--continua
Continuați să obțineți un fișier descărcat parțial. Acest lucru este util atunci când doriți să terminați
o descărcare începută de o instanță anterioară a Wget sau de un alt program. Pentru
instanță:

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z

Dacă există un fișier numit ls-lR.Z în directorul curent, Wget va presupune că este
prima parte a fișierului de la distanță și va cere serverului să continue
preluare dintr-un offset egal cu lungimea fișierului local.

Rețineți că nu trebuie să specificați această opțiune dacă doriți doar cea curentă
invocarea lui Wget pentru a reîncerca descărcarea unui fișier în cazul în care conexiunea se pierde la jumătatea drumului
prin. Acesta este comportamentul implicit. -c afectează doar reluarea descărcărilor
început anterior la această invocare a lui Wget și ale cărui fișiere locale încă se află
în jurul.

Fără -c, exemplul anterior ar descărca fișierul de la distanță în ls-lR.Z.1,
lăsând trunchiul ls-lR.Z dosar singur.

Începând cu Wget 1.7, dacă utilizați -c pe un fișier care nu este gol și se dovedește că
serverul nu acceptă descărcarea continuă, Wget va refuza să pornească descărcarea
de la zero, ceea ce ar distruge efectiv conținuturile existente. Dacă vrei cu adevărat
descărcați pentru a începe de la zero, eliminați fișierul.

De asemenea, începând cu Wget 1.7, dacă utilizați -c pe un fișier care este de dimensiune egală ca și
unul pe server, Wget va refuza să descarce fișierul și să imprime o explicație
mesaj. Același lucru se întâmplă atunci când fișierul este mai mic pe server decât local
(probabil pentru că a fost schimbat pe server de la ultima descărcare
încercare)---deoarece „continuare” nu are sens, nu are loc nicio descărcare.

Pe cealaltă parte a monedei, în timpul utilizării -c, orice fișier care este mai mare pe server
decât la nivel local va fi considerată o descărcare incompletă și doar „(lungime(la distanță) -
length(local))" octeți vor fi descărcați și atașați la sfârșitul fișierului local.
Acest comportament poate fi de dorit în anumite cazuri --- de exemplu, puteți utiliza wget -c la
descărcați doar porțiunea nouă care a fost atașată la o colecție de date sau un fișier jurnal.

Cu toate acestea, dacă fișierul este mai mare pe server pentru că a fost si-a schimbat hainele; , spre deosebire de
doar anexat la, veți ajunge cu un fișier deformat. Wget nu are cum să verifice
că fișierul local este într-adevăr un prefix valid al fișierului de la distanță. Tu trebuie sa fi
deosebit de atent la acest lucru atunci când utilizați -c în legătură cu -r, deoarece fiecare fișier va
fi considerat un candidat „descărcare incompletă”.

Un alt exemplu în care veți obține un fișier deformat dacă încercați să îl utilizați -c este dacă ai un
proxy HTTP șchiop care inserează un șir „transfer întrerupt” în fișierul local. În
pe viitor poate fi adăugată o opțiune de „retroducere” pentru a rezolva acest caz.

Rețineți că -c funcționează numai cu servere FTP și cu servere HTTP care acceptă
Antet „Range”.

--start-pos=OFFSET
Începeți descărcarea la poziția de bază zero OFFSET. Offset-ul poate fi exprimat în octeți,
kiloocteți cu sufixul „k” sau megaocteți cu sufixul „m” etc.

--start-poz are prioritate mai mare asupra --continua. Când --start-poz și --continua
sunt ambele specificate, wget va emite un avertisment apoi va continua ca și cum --continua a lipsit.

Este necesar suport de server pentru descărcarea continuă, în caz contrar --start-poz Nu pot ajuta.
Vedea -c pentru detalii.

--progres=tip
Selectați tipul indicatorului de progres pe care doriți să îl utilizați. Indicatorii legali sunt „punct”
și „bar”.

Indicatorul „bară” este utilizat în mod implicit. Desenează o bară de progres grafică ASCII
(aka display „termometru”) indicând starea de recuperare. Dacă ieşirea este
nu este un TTY, bara „punct” va fi utilizată în mod implicit.

Utilizare --progress = punct pentru a comuta la afișajul „punct”. Urmează recuperarea prin
tipărirea punctelor pe ecran, fiecare punct reprezentând o cantitate fixă ​​de date descărcate.

Progresul tip poate lua, de asemenea, unul sau mai mulți parametri. Parametrii variază în funcție de
il tip selectat. Parametrii la tip sunt trecute prin adăugarea lor la tip
sperat de un colon (:) astfel: --progres=tip:parameter1:parameter2.

Când utilizați recuperarea punctată, puteți seta stil prin specificarea tipului ca
punct:stil. Stiluri diferite atribuie un sens diferit unui punct. Cu "implicit"
stil fiecare punct reprezintă 1K, există zece puncte într-un grup și 50 de puncte într-o linie.
Stilul „binar” are o orientare mai asemănătoare „computerului” --- 8K puncte, clustere de 16 puncte
și 48 de puncte pe linie (ceea ce înseamnă 384K linii). Stilul „mega” este potrivit pentru
descărcarea fișierelor mari --- fiecare punct reprezintă 64K recuperați, există opt puncte într-un
cluster și 48 de puncte pe fiecare linie (deci fiecare linie conține 3M). Dacă „mega” nu este suficient
apoi puteți folosi stilul „giga” --- fiecare punct reprezintă 1M recuperat, există opt
puncte într-un grup și 32 de puncte pe fiecare linie (deci fiecare linie conține 32M).

Cu --progress=bara, în prezent există doi parametri posibili, putere și noscroll.

Când ieșirea nu este un TTY, bara de progres revine întotdeauna la „punct”, chiar dacă
--progress=bara a fost transmis lui Wget în timpul invocării. Acest comportament poate fi anulat
iar ieșirea „bară” forțată prin utilizarea parametrului „forță” ca --progress=bar:force.

Implicit, bar bara de progres de stil derulează numele fișierului de la stânga la dreapta
pentru fișierul care se descarcă dacă numele fișierului depășește lungimea maximă alocată pentru
afișajul acestuia. În anumite cazuri, cum ar fi cu --progress=bar:force, s-ar putea să nu vrea
numele fișierului care se derulează în bara de progres. Prin trecerea parametrului „noscroll”, Wget
poate fi forțat să afișeze cât mai mult din numele fișierului fără a derula
aceasta.

Rețineți că puteți seta stilul implicit folosind comanda „progres” în .wgetrc. Acea
setarea poate fi suprascrisă din linia de comandă. De exemplu, pentru a forța ieșirea barei
fără defilare, folosiți --progress=bar:force:noscroll.

--arată-progres
Forțați wget să afișeze bara de progres în orice nivel de verbozitate.

În mod implicit, wget afișează bara de progres numai în modul verbose. Se poate totuși,
doresc ca wget să afișeze bara de progres pe ecran împreună cu oricare altul
moduri de verbozitate precum --nu-verbos or --Liniște. Aceasta este adesea o proprietate dorită când
invocând wget pentru a descărca mai multe fișiere mici/mari. Într-un astfel de caz, wget ar putea
pur și simplu fi invocat cu acest parametru pentru a obține o ieșire mult mai curată pe ecran.

Această opțiune va forța, de asemenea, să fie tipărită bara de progres stderr atunci când sunt utilizate
alături de --fișier jurnal opțiune.

-N
--marcarea temporală
Activați marcarea timpului.

--nu-daca-modificat-dinca
Nu trimiteți antetul If-Modified-Since în -N modul. Trimiteți cererea HEAD preliminară
in schimb. Acest lucru are efect numai în -N Mod.

--no-use-server-timestamps
Nu setați marca temporală a fișierului local de către cel de pe server.

În mod implicit, atunci când un fișier este descărcat, marcajele de timp ale acestuia sunt setate să se potrivească cu cele din
fișier la distanță. Acest lucru permite utilizarea --marcarea temporală la invocarile ulterioare ale lui wget.
Cu toate acestea, uneori este util să se bazeze marcajul de timp al fișierului local pe când a fost
descărcat efectiv; în acest scop, --no-use-server-timestamps opțiunea a fost
cu condiția.

-S
--server-răspuns
Imprimați anteturile trimise de serverele HTTP și răspunsurile trimise de serverele FTP.

--păianjen
Când este invocat cu această opțiune, Wget se va comporta ca un Web păianjen, ceea ce înseamnă că
nu va descărca paginile, doar verificați dacă sunt acolo. De exemplu, puteți utiliza
Trebuie să vă verificați marcajele:

wget --spider --force-html -i bookmarks.html

Această caracteristică necesită mult mai multă muncă pentru ca Wget să se apropie de funcționalitatea realului
păianjeni de pânză.

-T secunde
--timeout=secunde
Setați expirarea rețelei la secunde secunde. Acest lucru este echivalent cu specificarea
--dns-timeout, --connect-timeout, și --read-timeout, totul in acelasi timp.

Când interacționează cu rețeaua, Wget poate verifica timpul de expirare și poate anula operația
dacă durează prea mult. Acest lucru previne anomalii precum citirile suspendate și infinite
conectează. Singurul timeout activat în mod implicit este un timeout de citire de 900 de secunde. Setare
un timeout până la 0 îl dezactivează complet. Dacă nu știi ce faci, cel mai bine este
pentru a nu modifica setările implicite de timeout.

Toate opțiunile legate de timeout acceptă valori zecimale, precum și valori subsecunde. Pentru
exemplu, 0.1 secunde este o alegere legală (deși neînțeleaptă) de timeout. Timeouts subsecunde
sunt utile pentru verificarea timpilor de răspuns al serverului sau pentru testarea latenței rețelei.

--dns-timeout=secunde
Setați timpul de expirare a căutării DNS la secunde secunde. Căutări DNS care nu se finalizează în termen
timpul specificat va eșua. În mod implicit, nu există timeout pentru căutările DNS, altele
decât cel implementat de bibliotecile de sistem.

--connect-timeout=secunde
Setați durata de conectare la secunde secunde. Conexiuni TCP care durează mai mult
stabilirea va fi anulată. În mod implicit, nu există niciun timeout de conectare, în afară de aceasta
implementat de bibliotecile de sistem.

--read-timeout=secunde
Setați timpul de expirare pentru citire (și scriere) la secunde secunde. „Timpul” acestui timeout
se referă la inactiv timp: dacă, în orice moment al descărcării, nu se primesc date pentru mai multe
decât numărul specificat de secunde, citirea eșuează și descărcarea este repornită.
Această opțiune nu afectează în mod direct durata întregii descărcări.

Desigur, serverul de la distanță poate alege să încheie conexiunea mai devreme
opțiunea necesită. Timpul de expirare implicit pentru citire este de 900 de secunde.

--limit-rate=sumă
Limitați viteza de descărcare la sumă octeți pe secundă. Suma poate fi exprimată în
octeți, kiloocteți cu k sufix, sau megaocteți cu m sufix. De exemplu,
--limit-rate=20k va limita rata de recuperare la 20KB/s. Acest lucru este util când, pentru
indiferent de motiv, nu doriți ca Wget să consume întreaga lățime de bandă disponibilă.

Această opțiune permite utilizarea numerelor zecimale, de obicei împreună cu puterea
sufixe; de exemplu, --limit-rate=2.5k este o valoare juridică.

Rețineți că Wget implementează limitarea prin dormirea timpului corespunzător
după o citire în rețea care a durat mai puțin decât cea specificată de tarif. Până la urmă asta
strategia face ca transferul TCP să încetinească la aproximativ rata specificată.
Cu toate acestea, poate dura ceva timp pentru ca acest echilibru să fie atins, așa că nu fi surprins
dacă limitarea ratei nu funcționează bine cu fișiere foarte mici.

-w secunde
--așteaptă=secunde
Așteptați numărul specificat de secunde între recuperări. Utilizarea acestei opțiuni este
recomandat, deoarece ușurează încărcarea serverului făcând cererile mai puțin frecvente.
În loc de secunde, timpul poate fi specificat în minute folosind sufixul „m”, în
ore folosind sufixul „h” sau în zile folosind sufixul „d”.

Specificarea unei valori mari pentru această opțiune este utilă dacă rețeaua sau destinația
gazda este inactivă, astfel încât Wget să poată aștepta suficient de mult pentru a se aștepta în mod rezonabil la eroarea de rețea
să fie remediat înainte de reîncercare. Intervalul de așteptare specificat de această funcție este
influențat de „--random-wait”, care vezi.

--waitretry=secunde
Dacă nu doriți să așteptați între fiecare regăsire, dar numai între reîncercări ale
descărcări eșuate, puteți utiliza această opțiune. Wget va folosi liniar retrage-te, așteptând 1
a doua după prima eșec la un fișier dat, apoi așteptând 2 secunde după
a doua eroare pe acel fișier, până la numărul maxim de secunde tu specifici.

În mod implicit, Wget va prelua o valoare de 10 secunde.

--aleatoriu-așteaptă
Unele site-uri web pot efectua analize de jurnal pentru a identifica programe de recuperare, cum ar fi Wget by
căutând asemănări semnificative statistic în timpul dintre solicitări. Acest
opțiunea face ca timpul dintre solicitări să varieze între 0.5 și 1.5 * aștepta secunde,
Unde aștepta a fost specificat folosind --aștepta opțiunea, pentru a masca prezența lui Wget
dintr-o astfel de analiză.

Un articol din 2001 într-o publicație dedicată dezvoltării pe o platformă populară pentru consumatori
cod furnizat pentru a efectua această analiză din mers. Autorul său a sugerat blocarea la
nivelul de adresă clasa C pentru a se asigura că programele de recuperare automată au fost blocate în ciuda
schimbarea adreselor furnizate de DHCP.

--aleatoriu-așteaptă opțiunea a fost inspirată de această recomandare prost de a bloca mulți
utilizatori neînrudiți de pe un site web din cauza acțiunilor unuia.

--fără-proxy
Nu utilizați proxy-uri, chiar dacă este definită variabila de mediu *_proxy corespunzătoare.

-Q cotă
--cota=cotă
Specificați cota de descărcare pentru preluări automate. Valoarea poate fi specificată în octeți
(implicit), kilobytes (cu k sufix), sau megaocteți (cu m sufix).

Rețineți că cota nu va afecta niciodată descărcarea unui singur fișier. Deci, dacă specificați wget
-Q10k ftp://wuarchive.wustl.edu/ls-lR.gz, toate din ls-lR.gz va fi descărcat. The
același lucru este valabil chiar și atunci când sunt specificate mai multe URL-uri pe linia de comandă. Cu toate acestea, cota este
respectat la preluarea fie recursiv, fie dintr-un fișier de intrare. Așa poți
tip în siguranță wget -Q2m -i site-uri---descărcarea va fi anulată când cota este depășită.

Setarea cotei la 0 sau la INF nelimitează cota de descărcare.

--no-dns-cache
Dezactivați stocarea în cache a căutărilor DNS. În mod normal, Wget își amintește adresele IP la care arăta
de la DNS, astfel încât să nu fie nevoie să contacteze în mod repetat serverul DNS pentru același lucru
(de obicei mic) set de gazde de la care preia. Acest cache există numai în memorie; A
noua rulare Wget va contacta DNS din nou.

Cu toate acestea, s-a raportat că în unele situații nu este de dorit să se memoreze cache
nume de gazdă, chiar și pentru durata unei aplicații de scurtă durată precum Wget. Cu asta
opțiunea Wget emite o nouă căutare DNS (mai precis, un nou apel la „gethostbyname” sau
„getaddrinfo”) de fiecare dată când face o nouă conexiune. Vă rugăm să rețineți că această opțiune va
nu afecta stocarea în cache care ar putea fi efectuată de biblioteca de rezolvare sau de un extern
stratul de stocare în cache, cum ar fi NSCD.

Dacă nu înțelegeți exact ce face această opțiune, probabil că nu veți avea nevoie de ea.

--restrict-file-names=moduri de
Schimbați caracterele găsite în adresele URL de la distanță care trebuie să fie eliminate în timpul generării
nume de fișiere locale. Personaje care sunt limitat prin această opțiune sunt scăpate, adică
inlocuit cu %HH, În cazul în care HH este numărul hexazecimal care corespunde cu
caracter restrâns. Această opțiune poate fi folosită și pentru a forța toate cazurile alfabetice
fie litere mici, fie majuscule.

În mod implicit, Wget scapă caracterele care nu sunt valide sau sigure ca parte a fișierului
nume de pe sistemul dvs. de operare, precum și caractere de control care sunt de obicei
neimprimabil. Această opțiune este utilă pentru modificarea acestor valori implicite, poate pentru că dvs
se descarcă într-o partiție non-nativă sau pentru că doriți să dezactivați evadarea
caracterele de control sau doriți să restricționați și mai mult caracterele doar la cele din
intervalul de valori ASCII.

moduri de sunt un set de valori text separate prin virgulă. Valorile acceptabile sunt unix,
ferestre, fara control, ascii, litere mici, și majuscule. Valorile unix și ferestre sunt
se exclud reciproc (unul îl va depăși pe celălalt), așa cum sunt litere mici și majuscule.
Acestea din urmă sunt cazuri speciale, deoarece nu schimbă setul de caractere care ar fi
poate fi scăpat, ci mai degrabă forțează căile de fișiere locale să fie convertite fie în inferior sau
majuscule.

Când este specificat „unix”, Wget scapă caracterul / iar personajele de control în
intervalele 0--31 și 128--159. Aceasta este valoarea implicită pe sistemele de operare asemănătoare Unix.

Când este dat „windows”, Wget scapă de caractere \, |, /, :, ?, ", *, <, >, și
caracterele de control din intervalele 0--31 și 128--159. În plus, Wget in
Utilizează modul Windows + în loc de : pentru a separa gazda și portul în numele fișierelor locale și
utilizări @ în loc de ? pentru a separa porțiunea de interogare a numelui fișierului de restul.
Prin urmare, o adresă URL care ar fi salvată ca www.xemacs.org:4300/search.pl?input=blah in
Modul Unix va fi salvat ca www.xemacs.org+4300/search.pl@input=blah în modul Windows.
Acest mod este implicit pe Windows.

Dacă specificați fara control, atunci evadarea caracterelor de control este de asemenea comutată
oprit. Această opțiune poate avea sens atunci când descărcați adrese URL ale căror nume conțin
Caractere UTF-8, pe un sistem care poate salva și afișa nume de fișiere în UTF-8 (unele
posibilele valori ale octetilor utilizate în secvențele de octeți UTF-8 se încadrează în intervalul de valori
desemnat de Wget drept „controale”).

ascii modul este folosit pentru a specifica orice octeți ale căror valori sunt în afara intervalului de
Caracterele ASCII (adică mai mari de 127) vor fi evadate. Acest lucru poate fi util atunci când
salvarea numelor de fișiere a căror codificare nu se potrivește cu cea utilizată local.

-4
--inet4-doar
-6
--inet6-doar
Forțați conectarea la adrese IPv4 sau IPv6. Cu --inet4-doar or -4, Wget va face numai
conectați-vă la gazde IPv4, ignorând înregistrările AAAA din DNS și refuzând să vă conectați la IPv6
adresele specificate în URL-uri. Invers, cu --inet6-doar or -6, Wget va face numai
conectați-vă la gazde IPv6 și ignorați înregistrările A și adresele IPv4.

Niciuna dintre opțiuni nu ar trebui să fie necesară în mod normal. În mod implicit, va folosi un Wget compatibil cu IPv6
familia de adrese specificată de înregistrarea DNS a gazdei. Dacă DNS-ul răspunde cu ambele
Adresele IPv4 și IPv6, Wget le va încerca în succesiune până când va găsi una pe care o poate
conectează la. (Consultați și opțiunea „--prefer-family” descrisă mai jos.)

Aceste opțiuni pot fi folosite pentru a forța în mod deliberat utilizarea adresei IPv4 sau IPv6
familii pe sisteme de familie duală, de obicei pentru a ajuta la depanare sau pentru a face față cu probleme
Configurarea Rețelei. Doar unul dintre --inet6-doar și --inet4-doar poate fi specificat la
acelasi timp. Nicio opțiune nu este disponibilă în Wget compilat fără suport IPv6.

--prefer-family=none/IPv4/IPv6
Când aveți posibilitatea de a alege dintre mai multe adrese, conectați-vă la adresele specificate
adresați-vă mai întâi familiei. Ordinea adresei returnate de DNS este utilizată fără modificare de
Mod implicit.

Acest lucru evită erorile false și încercările de conectare la accesarea gazdelor care rezolvă
ambele adrese IPv6 și IPv4 din rețelele IPv4. De exemplu, www.kame.net rezolvă
la 2001:200:0:8002:203:47ff:fea5:3085 și de a 203.178.141.194. Când este preferat
familia este „IPv4”, adresa IPv4 este folosită mai întâi; când familia preferată este „IPv6”,
adresa IPv6 este folosită mai întâi; dacă valoarea specificată este „niciuna”, ordinea adresei
returnat de DNS este utilizat fără modificare.

Spre deosebire de -4 și -6, această opțiune nu împiedică accesul la nicio familie de adrese, ci doar
schimbă comandă în care se accesează adresele. De asemenea, rețineți că reordonarea
efectuat de această opțiune este stabil--- nu afectează ordinea adreselor acestora
familie. Adică, ordinea relativă a tuturor adreselor IPv4 și a tuturor adreselor IPv6
rămâne intactă în toate cazurile.

--retry-connrefused
Considerați „conexiune refuzată” o eroare tranzitorie și încercați din nou. În mod normal, Wget renunță
pe o adresă URL atunci când nu se poate conecta la site, deoarece nu se conectează
ca semn că serverul nu rulează deloc și că reîncercările nu ar ajuta. Acest
opțiunea este pentru oglindirea site-urilor nesigure ale căror servere tind să dispară pe scurt
perioade de timp.

--utilizator=utilizator
--parola=parola
Specificați numele de utilizator utilizator și parola parola pentru regăsirea fișierelor FTP și HTTP.
Acești parametri pot fi suprascriși folosind --ftp-user și --ftp-parolă opțiuni pentru
Conexiuni FTP și --http-utilizator și --http-parolă opțiuni pentru conexiunile HTTP.

--cere-parola
Solicitați o parolă pentru fiecare conexiune stabilită. Nu poate fi specificat când
--parola este folosit, deoarece se exclud reciproc.

--no-iri
Dezactivați suportul pentru URI internaționalizate (IRI). Utilizare --iri pentru a porni. Suportul IRI este
activat implicit.

Puteți seta starea implicită a suportului IRI folosind comanda „iri” în .wgetrc. Acea
setarea poate fi suprascrisă din linia de comandă.

--local-encoding=codare
Forțați Wget să folosească codare ca codificare implicită de sistem. Asta afectează modul în care Wget
convertește URL-urile specificate ca argumente din locale în UTF-8 pentru suport IRI.

Utilizați funcția „nl_langinfo()” și apoi variabila de mediu „CHARSET”.
obțineți locația. Dacă eșuează, se folosește ASCII.

Puteți seta codarea locală implicită folosind comanda „local_encoding” în .wgetrc.
Această setare poate fi suprascrisă din linia de comandă.

--remote-encoding=codare
Forțați Wget să folosească codare ca codificare implicită de server la distanță. Asta afectează modul în care
Wget convertește URI-urile găsite în fișiere de la codificarea de la distanță în UTF-8 în timpul unei recursive
aduce. Această opțiune este utilă numai pentru suportul IRI, pentru interpretarea non-
caractere ASCII.

Pentru HTTP, codificarea de la distanță poate fi găsită în antetul HTTP „Content-Type” și în HTML
Metaetichetă „Content-Type http-equiv”.

Puteți seta codarea implicită folosind comanda „remoteencoding” în .wgetrc. Acea
setarea poate fi suprascrisă din linia de comandă.

--deconectați
Forțați Wget să deconecteze fișierul în loc să blocheze fișierul existent. Această opțiune este utilă
pentru descărcare în directorul cu hardlink-uri.

director Opţiuni
-nd
--fără-directoare
Nu creați o ierarhie de directoare atunci când recuperați recursiv. Cu asta
opțiunea activată, toate fișierele vor fi salvate în directorul curent, fără
clobbering (dacă un nume apare de mai multe ori, numele fișierelor vor primi extensii .n).

-x
--force-directoare
Opusul -nd---creați o ierarhie de directoare, chiar dacă nu ar fi
fost creat altfel. De exemplu wget -x http://fly.srk.fer.hr/robots.txt va salva
fișierul descărcat în fly.srk.fer.hr/robots.txt.

-nH
--no-host-directories
Dezactivați generarea de directoare cu prefix gazdă. În mod implicit, invocând Wget cu -r
http://fly.srk.fer.hr/ va crea o structură de directoare începând cu
fly.srk.fer.hr/. Această opțiune dezactivează un astfel de comportament.

--protocol-directoare
Utilizați numele protocolului ca componentă de director a numelor de fișiere locale. De exemplu, cu
această opțiune, wget -r http://gazdă va salva la http /gazdă/ ... mai degrabă decât doar să
gazdă/ ....

--cut-dirs=număr
Ignora număr componentele directorului. Acest lucru este util pentru a obține un control fin
peste directorul în care va fi salvată recuperarea recursivă.

Luați, de exemplu, directorul la ftp://ftp.xemacs.org/pub/xemacs/. Dacă recuperezi
cu -r, va fi salvat local sub ftp.xemacs.org/pub/xemacs/. In timp ce -nH
opțiunea poate elimina ftp.xemacs.org/ parte, încă ești blocat pub/xemacs. Acest
este unde --cut-dirs vine la îndemână; îl face pe Wget să nu „vadă” număr director la distanță
componente. Iată câteva exemple despre cum --cut-dirs optiunea functioneaza.

Fără opțiuni -> ftp.xemacs.org/pub/xemacs/
-nH -> pub/xemacs/
-nH --cut-dirs=1 -> xemacs/
-nH --cut-dirs=2 -> .

--cut-dirs=1 -> ftp.xemacs.org/xemacs/
...

Dacă doriți doar să scăpați de structura de directoare, această opțiune este similară cu a
combinatie de -nd și -P. Cu toate acestea, spre deosebire -nd, --cut-dirs nu pierde cu
subdirectoare --- de exemplu, cu -nH --cut-dirs=1, A beta/ subdirectorul va fi
plasat la xemacs/beta, așa cum ne-am aștepta.

-P prefix
--directory-prefix=prefix
Setați prefixul directorului la prefix. director prefix este directorul în care toate celelalte
fișierele și subdirectoarele vor fi salvate în, adică în partea de sus a arborelui de recuperare. The
implicit este . (directorul curent).

HTTP Opţiuni
--default-page=nume
Utilizare nume ca nume de fișier implicit atunci când nu este cunoscut (adică, pentru adresele URL care se termină cu a
slash), în loc de index.html.

-E
--ajustare-extensie
Dacă un fișier de tip application/xhtml+xml or text / html este descărcat și URL-ul
nu se termină cu expresia regulată \.[Hh][Tt][Mm][Ll]?, această opțiune va genera sufixul . Html
pentru a fi atașat la numele fișierului local. Acest lucru este util, de exemplu, când ești
oglindirea unui site la distanță care utilizează . Asp pagini, dar doriți ca paginile în oglindă să fie
vizibil pe serverul dvs. stoc Apache. O altă utilizare bună pentru aceasta este atunci când ești
descărcarea materialelor generate de CGI. O adresă URL ca http://site.com/article.cgi? 25 voi
fi salvat ca articol.cgi?25.html.

Rețineți că numele fișierelor modificate în acest fel vor fi re-descărcate de fiecare dată când re-oglindiți
un site, pentru că Wget nu poate spune că localul X.html fișierul corespunde adresei URL de la distanță X
(din moment ce nu știe încă că URL-ul produce rezultate de tip text / html or
application/xhtml+xml.

Începând cu versiunea 1.12, Wget se va asigura, de asemenea, că orice fișier de tip descărcat text/css
se termină în sufix .css, iar opțiunea a fost redenumită de la --html-extensie, spre mai bine
reflectă noul său comportament. Vechiul nume al opțiunii este încă acceptabil, dar ar trebui să fie acum
considerat depreciat.

La un moment dat în viitor, această opțiune poate fi extinsă pentru a include sufixe pentru
alte tipuri de conținut, inclusiv tipuri de conținut care nu sunt analizate de Wget.

--http-user=utilizator
--http-parola=parola
Specificați numele de utilizator utilizator și parola parola pe un server HTTP. In conformitate cu
tipul provocării, Wget le va codifica folosind fie „de bază” (nesigură), fie
„digest” sau schema de autentificare Windows „NTLM”.

O altă modalitate de a specifica numele de utilizator și parola este în URL-ul propriu-zis. Oricare metodă
vă dezvăluie parola oricui se deranjează să ruleze „ps”. Pentru a preveni parolele
de a fi văzut, depozitați-le în .wgetrc or .netrcși asigurați-vă că protejați fișierele respective
de la alți utilizatori cu „chmod”. Dacă parolele sunt cu adevărat importante, nu pleca
fie ele aflate în acele fișiere --- editați fișierele și ștergeți-le după ce Wget a făcut-o
a început descărcarea.

--no-http-keep-alive
Dezactivați funcția „menținere în viață” pentru descărcări HTTP. În mod normal, Wget întreabă serverul
pentru a menține conexiunea deschisă, astfel încât, atunci când descărcați mai mult de un document din
același server, sunt transferați prin aceeași conexiune TCP. Acest lucru economisește timp și
reduce in acelasi timp sarcina pe server.

Această opțiune este utilă atunci când, dintr-un anumit motiv, conexiunile persistente (menține în viață) nu
funcționează pentru dvs., de exemplu din cauza unei erori de server sau din cauza incapacității serverului
scripturi pentru a face față conexiunilor.

--fără-cache
Dezactivați memoria cache pe partea serverului. În acest caz, Wget va trimite serverului de la distanță un
directivă adecvată (Pragma: fără cache) pentru a obține fișierul de la serviciul de la distanță,
mai degrabă decât să returneze versiunea stocată în cache. Acest lucru este util în special pentru recuperare
și ștergerea documentelor învechite pe serverele proxy.

Memorarea în cache este permisă în mod implicit.

--fără cookie-uri
Dezactivați utilizarea cookie-urilor. Cookie-urile sunt un mecanism de menținere pe partea serverului
stat. Serverul trimite clientului un cookie folosind antetul „Set-Cookie” și
clientul răspunde cu același cookie la solicitări ulterioare. Deoarece cookie-urile permit
proprietarii de servere să țină evidența vizitatorilor și ca site-urile să schimbe aceste informații,
unii le consideră o încălcare a vieții private. Implicit este utilizarea cookie-urilor; in orice caz,
stocarea cookie-urile nu sunt activate implicit.

--încărcare-cookie-uri fişier
Încărcați cookie-uri de la fişier înainte de prima preluare HTTP. fişier este un fișier textual în
format utilizat inițial de Netscape cookie-uri.txt fișier.

De obicei, veți folosi această opțiune atunci când oglindiți site-uri care necesită acest lucru
autentificat pentru a accesa o parte sau tot conținutul acestora. Procesul de conectare funcționează de obicei
de către serverul web care emite un cookie HTTP la primirea și verificarea dvs
acreditările. Cookie-ul este apoi retrimis de browser la accesarea acelei părți a
site-ul și astfel vă dovedește identitatea.

Oglindirea unui astfel de site necesită ca Wget să trimită aceleași cookie-uri când browserul dvs. le trimite
comunicarea cu site-ul. Acest lucru se realizează prin --încărcare-cookie-uri--- pur și simplu punctează Wget
până la locația cookie-uri.txt fișier și va trimite aceleași cookie-uri ale dvs
browser-ul ar trimite în aceeași situație. Diferitele browsere păstrează cookie textual
fișiere în diferite locații:

„Netscape 4.x”.
Cookie-urile sunt în ~/.netscape/cookies.txt.

„Mozilla și Netscape 6.x”.
Fișierul cookie al Mozilla este de asemenea numit cookie-uri.txt, situat undeva sub
~/.mozilla, în directorul profilului tău. Calea completă se termină de obicei
arătând oarecum ca ~/.mozilla/default/some-weird-string/cookies.txt.

"Internet Explorer."
Puteți produce un fișier cookie pe care Wget îl poate utiliza utilizând meniul Fișier, Import și
Exportați, exportați cookie-uri. Acest lucru a fost testat cu Internet Explorer 5; nu este
garantat pentru a funcționa cu versiuni anterioare.

"Alte browsere."
Dacă utilizați un browser diferit pentru a vă crea module cookie, --încărcare-cookie-uri voi
funcționează numai dacă puteți găsi sau produce un fișier cookie în format Netscape care
Wget se așteaptă.

Dacă nu puteți utiliza --încărcare-cookie-uri, ar putea exista încă o alternativă. Dacă ale tale
browser-ul acceptă un „manager de cookie-uri”, îl puteți folosi pentru a vizualiza cookie-urile utilizate atunci când
accesând site-ul pe care îl oglindiți. Notați numele și valoarea cookie-ului și
instruiți manual Wget să trimită acele cookie-uri, ocolind suportul „oficial” pentru cookie-uri:

wget --no-cookies --header „Cookie: = "

--salvați cookie-urile fişier
Salvați cookie-urile în fişier înainte de a ieși. Acest lucru nu va salva cookie-urile care au expirat sau
care nu au timp de expirare (așa-numitele „cookie-uri de sesiune”), dar vezi și
--păstrați cookie-urile de sesiune.

--păstrați cookie-urile de sesiune
Când este specificat, cauze --salvați cookie-urile pentru a salva și cookie-urile de sesiune. Cookie-uri de sesiune
în mod normal, nu sunt salvate deoarece sunt menite să fie păstrate în memorie și uitate când
ieși din browser. Salvarea lor este utilă pe site-urile care necesită să vă conectați sau să vă conectați
vizitați pagina de pornire înainte de a putea accesa unele pagini. Cu această opțiune, mai multe Wget
rulările sunt considerate o singură sesiune de browser în ceea ce privește site-ul.

Deoarece formatul fișierului cookie nu conține în mod normal module cookie de sesiune, Wget le marchează
cu un marcaj de expirare de 0. Wget --încărcare-cookie-uri le recunoaște ca sesiune
cookie-uri, dar ar putea deruta alte browsere. De asemenea, rețineți că cookie-urile astfel încărcate vor fi
să fie tratate ca alte module cookie de sesiune, ceea ce înseamnă că dacă doriți --salvați cookie-urile la
păstrați-le din nou, trebuie să le utilizați --păstrați cookie-urile de sesiune din nou.

--ignora-lungimea
Din păcate, unele servere HTTP (programe CGI, pentru a fi mai precis) trimit false
Antetele „Content-Length”, ceea ce face ca Wget să devină sălbatic, deoarece nu gândește tot documentul
a fost recuperat. Puteți identifica acest sindrom dacă Wget reîncearcă să obțină același document
iar și iar, susținând de fiecare dată că conexiunea (altfel normală) s-a închis
pe același octet.

Cu această opțiune, Wget va ignora antetul „Lungimea conținutului” --- ca și cum nu ar fi niciodată
a existat.

--header=linia de antet
Trimite linia de antet împreună cu restul antetelor din fiecare cerere HTTP. The
antetul furnizat este trimis așa cum este, ceea ce înseamnă că trebuie să conțină numele și valoarea separate prin
două puncte și nu trebuie să conțină linii noi.

Puteți defini mai mult de un antet suplimentar prin specificarea --antet mai mult de o dată.

wget --header='Accept-Charset: iso-8859-2' \
--header='Accept-Limba: hr' \
http://fly.srk.fer.hr/

Specificarea unui șir gol ca valoare antet va șterge toate utilizatorii anterioare.
anteturi definite.

Începând cu Wget 1.10, această opțiune poate fi folosită pentru a suprascrie anteturile generate altfel
automat. Acest exemplu îi cere lui Wget să se conecteze la localhost, dar să specifice
foo.bar în antetul „Gazdă”:

wget --header="Gazdă: foo.bar" http://localhost/

În versiunile de Wget anterioare 1.10 o astfel de utilizare a --antet a provocat trimiterea unui duplicat
anteturi.

--max-redirect=număr
Specifică numărul maxim de redirecționări de urmat pentru o resursă. Valoarea implicită este
20, care este de obicei mult mai mult decât este necesar. Cu toate acestea, în acele ocazii în care tu
doriți să permiteți mai mult (sau mai puțin), aceasta este opțiunea de utilizat.

--proxy-user=utilizator
--proxy-parola=parola
Specificați numele de utilizator utilizator și parola parola pentru autentificare pe un server proxy.
Wget le va codifica folosind schema de autentificare „de bază”.

Considerații de securitate similare celor cu --http-parolă aparțin și aici.

--referer=url
Includeți `Referer: urlantetul din cererea HTTP. Util pentru preluarea documentelor cu
procesare pe partea serverului care presupun că sunt întotdeauna preluate de web interactiv
browsere și iese corect numai atunci când Referer este setat la una dintre paginile care indică
lor.

--save-headers
Salvați anteturile trimise de serverul HTTP în fișier, precedând conținutul real,
cu o linie goală ca separator.

-U șir-agent
--user-agent=șir-agent
Identificați ca șir-agent către serverul HTTP.

Protocolul HTTP permite clienților să se identifice folosind un „User-Agent”
câmp de antet. Acest lucru permite distingerea software-ului WWW, de obicei pentru statistici
scopuri sau pentru urmărirea încălcărilor protocolului. Wget se identifică în mod normal ca
Wget/versiune, versiune fiind numărul actual al versiunii Wget.

Cu toate acestea, se știe că unele site-uri impun politica de adaptare a rezultatelor
conform informațiilor furnizate de „User-Agent”. Deși aceasta nu este o idee atât de rea
în teorie, acesta a fost abuzat de servere care refuză informații altor clienți decât
(din punct de vedere istoric) Netscape sau, mai frecvent, Microsoft Internet Explorer. Această opțiune
vă permite să schimbați linia „User-Agent” emisă de Wget. Utilizarea acestei opțiuni este
descurajat, cu excepția cazului în care știi cu adevărat ce faci.

Se specifică agent utilizator gol cu --user-agent="" instruiește Wget să nu trimită fișierul
Antetul „User-Agent” în solicitările HTTP.

--post-data=şir
--post-file=fişier
Utilizați POST ca metodă pentru toate solicitările HTTP și trimiteți datele specificate în fișierul
organismul de cerere. --post-date trimite şir ca date, în timp ce --post-file trimite
conținutul fişier. În afară de asta, funcționează exact în același mod. În special,
ei atât așteptați conținut de forma „key1=value1&key2=value2”, cu codificare procentuală
pentru personaje speciale; singura diferență este că se așteaptă conținutul său ca a
parametrul liniei de comandă și celălalt își acceptă conținutul dintr-un fișier. În special,
--post-file is nu pentru transmiterea fișierelor ca atașamente de formular: acestea trebuie să apară ca
Datele „cheie=valoare” (cu codificare procentuală adecvată) la fel ca orice altceva. Wget
nu acceptă în prezent „multipart/form-data” pentru transmiterea datelor POST; numai
„application/x-www-form-urlencoded”. Doar unul dintre --post-date și --post-file ar trebui să fie
specificat.

Vă rugăm să rețineți că wget nu necesită ca conținutul să fie conform formularului
„key1=value1&key2=value2”, și nici nu testează pentru aceasta. Wget va transmite pur și simplu
orice date i se furnizează. Cu toate acestea, majoritatea serverelor se așteaptă ca datele POST să fie în
formatul de mai sus la procesarea formularelor HTML.

Când trimiteți o solicitare POST folosind --post-file opțiunea, Wget tratează fișierul ca un
fișier binar și va trimite fiecare caracter din cererea POST fără a elimina
caractere de tip newline sau formfeed în urmă. Orice alte caractere de control din text vor
de asemenea, să fie trimis așa cum este în cererea POST.

Vă rugăm să rețineți că Wget trebuie să cunoască dimensiunea datelor POST în avans.
Prin urmare, argumentul „--post-file” trebuie să fie un fișier obișnuit; specificând un FIFO sau
ceva asemănător cu /dev/stdin nu va funcționa. Nu este destul de clar cum să rezolvi asta
limitare inerentă HTTP/1.0. Deși HTTP/1.1 introduce zdrobit transfera asta
nu necesită cunoașterea lungimii cererii în avans, un client nu poate folosi chunked
dacă nu știe că vorbește cu un server HTTP/1.1. Și nu poate ști asta până nu
primește un răspuns, care la rândul său necesită ca cererea să fi fost finalizată -- a
problema cu puiul și ouăle.

Notă: Începând cu versiunea 1.15, dacă Wget este redirecționat după finalizarea cererii POST,
comportamentul acestuia va depinde de codul de răspuns returnat de server. În cazul unui
301 Mutat permanent, 302 Mutat temporar sau 307 Redirecționare temporară, Wget va, în
în conformitate cu RFC2616, continuați să trimiteți o solicitare POST. În cazul în care un server dorește
client pentru a schimba metoda de solicitare la redirecționare, ar trebui să trimită un 303 See Other
cod de răspuns.

Acest exemplu arată cum să vă conectați la un server utilizând POST și apoi să treceți la descărcare
paginile dorite, probabil accesibile numai utilizatorilor autorizați:

# Conectați-vă la server. Acest lucru se poate face o singură dată.
wget --save-cookies cookies.txt \
--post-data 'user=foo&password=bar' \
http://server.com/auth.php

# Acum apucați pagina sau paginile care ne interesează.
wget --load-cookies cookies.txt \
-p http://server.com/interesting/article.php

Dacă serverul utilizează module cookie de sesiune pentru a urmări autentificarea utilizatorului, cele de mai sus o vor face
nu funcționează pentru că --salvați cookie-urile nu le va salva (și nici browserele) și
cookie-uri.txt fișierul va fi gol. În acest caz folosiți --păstrați cookie-urile de sesiune împreuna cu
--salvați cookie-urile pentru a forța salvarea cookie-urilor de sesiune.

--metoda=Metoda HTTP
În scopul scriptării RESTful, Wget permite trimiterea altor metode HTTP
fără a fi nevoie să le setați în mod explicit folosind --header=Linie de antet. Wget va folosi
orice șir i se trece după --metodă ca metodă HTTP către server.

--body-data=Șir de date
--body-file=Fișier de date
Trebuie setat când trebuie trimise date suplimentare către server împreună cu Metoda
specificat folosind --metodă. --body-data trimite şir ca date, în timp ce --body-file trimite
continutul de fişier. În afară de asta, funcționează exact în același mod.

În prezent, --body-file is nu pentru transmiterea fișierelor în ansamblu. Wget nu
suport în prezent „multipart/form-data” pentru transmiterea datelor; numai
„application/x-www-form-urlencoded”. În viitor, acest lucru poate fi schimbat, astfel încât wget
trimite --body-file ca fișier complet în loc să-și trimită conținutul la
Server. Vă rugăm să rețineți că Wget trebuie să cunoască conținutul BODY Data în avans,
şi de aici argumentul pentru --body-file ar trebui să fie un fișier obișnuit. Vedea --post-file pentru o
explicatie mai detaliata. Doar unul dintre --body-data și --body-file ar trebui să fie
specificat.

Dacă Wget este redirecționat după finalizarea cererii, Wget va suspenda curentul
metoda și trimiteți o solicitare GET până la finalizarea redirecționării. Acest lucru este valabil pentru toți
codurile de răspuns de redirecționare, cu excepția redirecționării temporare 307, care este folosit în mod explicit
specificați că metoda de solicitare ar trebui nu Schimbare. O altă excepție este atunci când
metoda este setată la „POST”, caz în care regulile de redirecționare specificate în
--post-date sunt urmate.

--conținut-dispoziție
Dacă este setat la activat, suport experimental (nu complet funcțional) pentru
Anteturile „Conținut-Dispoziție” sunt activate. Acest lucru poate duce în prezent la o rotundă suplimentară-
călătorii la server pentru o solicitare „HEAD” și se știe că suferă de câteva erori,
motiv pentru care nu este activat în prezent în mod implicit.

Această opțiune este utilă pentru unele programe CGI de descărcare de fișiere care utilizează
Antete „Content-Disposition” pentru a descrie numele unui fișier descărcat
fi.

--conținut-pe-eroare
Dacă este setat la pornit, wget nu va sări peste conținut atunci când serverul răspunde cu a
Cod de stare http care indică o eroare.

--trust-server-names
Dacă aceasta este activată, pe o redirecționare va fi ultima componentă a adresei URL de redirecționare
folosit ca nume de fișier local. În mod implicit, se utilizează ultima componentă din original
URL.

--auth-no-challenge
Dacă această opțiune este dată, Wget va trimite informații de autentificare HTTP de bază
(nume de utilizator și parolă în text simplu) pentru toate solicitările, la fel ca Wget 1.10.2 și anterioare
făcut implicit.

Utilizarea acestei opțiuni nu este recomandată și este destinată doar să sprijine câteva
servere obscure, care nu trimit niciodată provocări de autentificare HTTP, dar acceptă
informații de autentificare nesolicitate, să zicem, pe lângă autentificarea bazată pe formular.

HTTPS (SSL/TLS) Opţiuni
Pentru a suporta descărcări HTTP criptate (HTTPS), Wget trebuie să fie compilat cu un SSL extern
bibliotecă. Valoarea implicită curentă este GnuTLS. În plus, Wget acceptă și HSTS (HTTP Strict
Securitatea transporturilor). Dacă Wget este compilat fără suport SSL, nici una dintre aceste opțiuni nu este
disponibile.

--secure-protocol=protocol
Alegeți protocolul securizat care trebuie utilizat. Valorile legale sunt Auto, SSLv2, SSLv3, TLSv1,
TLSv1_1, TLSv1_2 și PFS. Dacă Auto este utilizat, bibliotecii SSL i se acordă libertatea de a
alegerea automată a protocolului adecvat, care se realizează prin trimiterea unui TLSv1
Salut. Aceasta este valoarea implicită.

specificarea SSLv2, SSLv3, TLSv1, TLSv1_1 or TLSv1_2 obligă folosirea corespunzatoare
protocol. Acest lucru este util atunci când vorbiți cu implementări de server SSL vechi și cu erori
care îngreunează pentru biblioteca SSL de bază să aleagă protocolul corect
versiune. Din fericire, astfel de servere sunt destul de rare.

specificarea PFS impune utilizarea așa-numitului cifru Perfect Forward Security
apartamente. Pe scurt, PFS adaugă securitate prin crearea unei chei unice pentru fiecare SSL
conexiune. Are un impact puțin mai mare asupra CPU asupra clientului și serverului. Folosim cunoscut a fi
cifruri securizate (de exemplu, fără MD4) și protocolul TLS.

--Doar https
În modul recursiv, sunt urmate numai linkurile HTTPS.

--no-check-certificat
Nu verificați certificatul serverului cu autoritățile de certificare disponibile.
De asemenea, nu solicita ca numele gazdei URL să se potrivească cu numele comun prezentat de
certificat.

Începând cu Wget 1.10, implicit este verificarea certificatului serverului cu
autorități de certificare recunoscute, ruperea acordului de mână SSL și anularea
descărcați dacă verificarea eșuează. Deși acest lucru oferă descărcări mai sigure, acesta
întrerupe interoperabilitatea cu unele site-uri care au funcționat cu versiunile anterioare Wget,
în special cei care folosesc certificate autosemnate, expirate sau invalide în alt mod.
Această opțiune forțează un mod de operare „nesigur” care transformă certificatul
erori de verificare în avertismente și vă permite să continuați.

Dacă întâmpinați erori de „verificare a certificatului” sau cele care spun „nume comun
nu se potrivește cu numele de gazdă solicitat”, puteți folosi această opțiune pentru a ocoli verificarea
și continuați cu descărcarea. Numai utilizare acest opțiune if tu sunt in caz contrar convins of
il site-uri autenticitate, or if tu într-adevăr nu face pasă despre il valabilitate of ei
certificat. Este aproape întotdeauna o idee proastă să nu verificați certificatele când
transmiterea de date confidenţiale sau importante. Pentru certificatele autosemnate/interne,
ar trebui să descărcați certificatul și să verificați acest lucru în loc să forțați acest lucru
modul nesigur. Dacă sunteți cu adevărat sigur că nu doriți nicio verificare a certificatului,
puteți specifica --check-certificate=quiet pentru a-i spune wget să nu imprime niciun avertisment despre
certificate invalide, deși în majoritatea cazurilor acesta este un lucru greșit.

--certificat=fişier
Utilizați certificatul client stocat în fişier. Acest lucru este necesar pentru serverele care sunt
configurat să solicite certificate de la clienții care se conectează la ei. În mod normal a
certificatul nu este necesar, iar acest comutator este opțional.

--tip-certificat=tip
Specificați tipul de certificat de client. Valorile legale sunt PEM (presupus implicit)
și THE, de asemenea cunoscut ca si ASN1.

--cheie-privată=fişier
Citiți cheia privată de la fişier. Acest lucru vă permite să furnizați cheia privată într-un fișier
separat de certificat.

--private-key-type=tip
Specificați tipul cheii private. Valorile acceptate sunt PEM (implicit) și THE.

--ca-certificat=fişier
Utilizare fişier ca fișier cu pachetul de autorități de certificare ("CA") pentru a verifica
colegii. Certificatele trebuie să fie în format PEM.

Fără această opțiune, Wget caută certificate CA în locațiile specificate de sistem,
ales la momentul instalării OpenSSL.

--ca-directory=director
Specifică directorul care conține certificate CA în format PEM. Fiecare fișier conține unul
Certificat CA, iar numele fișierului se bazează pe o valoare hash derivată din
certificat. Acest lucru se realizează prin procesarea unui director de certificate cu
Utilitarul „c_rehash” furnizat cu OpenSSL. Folosind --ca-director este mai eficient decât
--ca-certificat când sunt instalate multe certificate deoarece permite ca Wget să preia
certificate la cerere.

Fără această opțiune, Wget caută certificate CA în locațiile specificate de sistem,
ales la momentul instalării OpenSSL.

--crl-file=fişier
Specifică un fișier CRL în fişier. Acest lucru este necesar pentru certificatele care au fost
revocate de CA.

--random-file=fişier
[Numai OpenSSL și LibreSSL] Utilizați fişier ca sursă de date aleatorii pentru însămânțarea
generator de numere pseudo-aleatoare pe sisteme fără / Dev / urandom.

Pe astfel de sisteme, biblioteca SSL are nevoie de o sursă externă de aleatorie pentru a se inițializa.
Aleatoritatea poate fi furnizată de EGD (vezi --egd-file de mai jos) sau citit dintr-un extern
sursa specificată de utilizator. Dacă această opțiune nu este specificată, Wget caută aleatoriu
date în $RANDFILE sau, dacă nu sunt setate, în $HOME/.rnd.

Dacă primiți „Nu s-a putut genera OpenSSL PRNG; dezactivarea SSL”. eroare, ar trebui
furnizați date aleatorii folosind unele dintre metodele descrise mai sus.

--egd-file=fişier
[Numai OpenSSL] Utilizați fişier ca priza EGD. EGD înseamnă Entropia adunare daemon, A
program de spațiu utilizator care colectează date din diverse surse de sistem imprevizibile și
îl pune la dispoziția altor programe care ar putea avea nevoie de el. Software de criptare, cum ar fi
biblioteca SSL, are nevoie de surse ale aleatoriei nerepetate pentru a genera numărul aleatoriu
generator folosit pentru a produce chei criptografice puternice.

OpenSSL permite utilizatorului să-și specifice propria sursă de entropie folosind „RAND_FILE”
variabilă de mediu. Dacă această variabilă nu este setată sau dacă fișierul specificat nu
produce suficientă aleatorie, OpenSSL va citi date aleatorii din soclul EGD specificat
folosind această opțiune.

Dacă această opțiune nu este specificată (și nu este utilizată comanda de pornire echivalentă), EGD
nu este niciodată contactat. EGD nu este necesar pe sistemele Unix moderne care acceptă
/ Dev / urandom.

--no-hsts
Wget acceptă HSTS (HTTP Strict Transport Security, RFC 6797) în mod implicit. Utilizare
--no-hsts pentru a face Wget să acționeze ca un UA neconform HSTS. În consecință, Wget ar face-o
ignora toate anteturile „Strict-Transport-Security” și nu ar impune niciunul existent
Politica HSTS.

--hsts-file=fişier
În mod implicit, Wget își stochează baza de date HSTS în ~/.wget-hsts. Puteți folosi --hsts-file la
trece peste asta. Wget va folosi fișierul furnizat ca bază de date HSTS. Un astfel de dosar trebuie
conform cu formatul corect al bazei de date HSTS utilizat de Wget. Dacă Wget nu poate analiza
fișierul furnizat, comportamentul este nespecificat.

Baza de date HSTS a Wget este un fișier text simplu. Fiecare linie conține o intrare HSTS (adică a
site care a emis un antet „Strict-Transport-Security” și care, prin urmare, are
a specificat o politică HSTS concretă care urmează să fie aplicată). Liniile care încep cu o liniuță ("#") sunt
ignorat de Wget. Vă rugăm să rețineți că, în ciuda acestei manuale convenabile de lizibilitate umană-
piratarea bazei de date HSTS nu este, în general, o idee bună.

O linie de intrare HSTS constă din mai multe câmpuri separate de unul sau mai multe spații albe:

" SP [ ] SP SP SP "

nume de gazdă și port câmpurile indică numele de gazdă și portul către care HSTS-ul dat
se aplică politica. The port câmpul poate fi zero și va fi, în majoritatea cazurilor. Acea
înseamnă că numărul portului nu va fi luat în considerare atunci când se decide dacă acest lucru
Politica HSTS ar trebui aplicată la o anumită solicitare (numai numele de gazdă va fi
evaluat). Când port este diferit de zero, atât numele gazdă țintă, cât și portul
fi evaluate și politica HSTS va fi aplicată numai dacă ambele se potrivesc. Acest
caracteristica a fost inclusă numai în scopuri de testare/dezvoltare. Setul de teste Wget
(În testenv/) creează baze de date HSTS cu porturi explicite cu scopul de a asigura
Comportamentul corect al lui Wget. Aplicarea politicilor HSTS la alte porturi decât cele implicite
este descurajat de RFC 6797 (vezi Anexa B „Diferențe între politica HSTS și aceeași
Politica de origine"). Astfel, această funcționalitate nu trebuie utilizată în producție
medii și port va fi de obicei zero. Ultimele trei domenii fac ceea ce sunt
așteptat să. Campul include_subdomains poate fi fie 1, fie 0 și semnalează dacă
subdomeniile domeniului țintă ar trebui să facă parte și din politica HSTS dată.
a creat și varsta maxima câmpurile conțin valorile marcajului temporal de când a fost o astfel de intrare
creat (văzut pentru prima dată de Wget) și valoarea definită de HSTS „max-age”, care afirmă cum
mult timp dacă politica HSTS rămâne activă, măsurată în secunde scurse de la
marca temporală stocată în a creat. Odată ce acest timp a trecut, acea politică HSTS va nu
va mai fi valabil și în cele din urmă va fi eliminat din baza de date.

Dacă vă furnizați propria bază de date HSTS prin --hsts-file, rețineți că Wget se poate modifica
fișierul furnizat dacă intervine vreo modificare între politicile HSTS solicitate de către
serverele la distanță și cele din fișier. Când există Wget, actualizează efectiv
Baza de date HSTS prin rescrierea fișierului bazei de date cu noile intrări.

Dacă fișierul furnizat nu există, Wget va crea unul. Acest fișier va conține
noi intrări HSTS. Dacă nu au fost generate intrări HSTS (nu „Strict-Transport-Security”
anteturile au fost trimise de către oricare dintre servere), atunci nu va fi creat niciun fișier, nici măcar un
unul gol. Acest comportament se aplică fișierului implicit al bazei de date (~/.wget-hsts) de asemenea:
nu va fi creat până când un server nu aplică o politică HSTS.

Se are grijă să nu se anuleze posibilele modificări efectuate de alte procese Wget la
în același timp prin baza de date HSTS. Înainte de a descărca intrările HSTS actualizate din fișier,
Wget îl va reciti și va îmbina modificările.

Utilizarea unei baze de date HSTS personalizată și/sau modificarea uneia existente este descurajată. Pentru
mai multe informații despre potențialele amenințări de securitate care decurg dintr-o astfel de practică, vezi
secțiunea 14 „Considerații de securitate” din RFC 6797, în special secțiunea 14.9 „Creative
Manipularea depozitului de politici HSTS”.

--warc-file=fişier
Utilizare fişier ca fișier WARC de destinație.

--warc-header=şir
Utilizare şir în ca înregistrarea warcinfo.

--warc-max-size=mărimea
Setați dimensiunea maximă a fișierelor WARC la mărimea.

--warc-cdx
Scrieți fișiere index CDX.

--warc-dedup=fişier
Nu stocați înregistrările listate în acest fișier CDX.

--fără-warc-compresie
Nu comprimați fișierele WARC cu GZIP.

--fără-warc-digeră
Nu calculați rezumatele SHA1.

--no-warc-keep-log
Nu stocați fișierul jurnal într-o înregistrare WARC.

--warc-tempdir=dir
Specificați locația fișierelor temporare create de scriitorul WARC.

FTP Opţiuni
--ftp-user=utilizator
--ftp-parola=parola
Specificați numele de utilizator utilizator și parola parola pe un server FTP. Fără asta, sau
opțiunea de pornire corespunzătoare, parola este implicită -wget@, folosit în mod normal pentru
FTP anonim.

O altă modalitate de a specifica numele de utilizator și parola este în URL-ul propriu-zis. Oricare metodă
vă dezvăluie parola oricui se deranjează să ruleze „ps”. Pentru a preveni parolele
de a fi văzut, depozitați-le în .wgetrc or .netrcși asigurați-vă că protejați fișierele respective
de la alți utilizatori cu „chmod”. Dacă parolele sunt cu adevărat importante, nu pleca
fie ele aflate în acele fișiere --- editați fișierele și ștergeți-le după ce Wget a făcut-o
a început descărcarea.

--no-remove-listing
Nu eliminați temporarul .listare fișiere generate de extrageri FTP. În mod normal,
aceste fișiere conțin listele de directoare brute primite de la serverele FTP. Nu
eliminarea acestora poate fi utilă în scopuri de depanare sau atunci când doriți să puteți
verificați cu ușurință conținutul directoarelor serverelor de la distanță (de exemplu, pentru a verifica dacă a
oglinda pe care o rulați este completă).

Rețineți că, deși Wget scrie într-un nume de fișier cunoscut pentru acest fișier, acesta nu este un
gaură de securitate în scenariul unui utilizator .listare o legătură simbolică către / Etc / passwd
sau ceva și cere „root” să ruleze Wget în directorul său. Depinzând de
opțiunile utilizate, fie Wget va refuza să scrie .listare, făcând
operațiunea de globbing/recursie/marcare temporală eșuează sau legătura simbolică va fi ștearsă
și înlocuită cu cea actuală .listare fișier sau lista va fi scrisă în a
.număr.înregistrare fișier.

Chiar dacă această situație nu este o problemă, totuși, „root” nu ar trebui să ruleze niciodată Wget într-un
directorul utilizatorului care nu este de încredere. Un utilizator ar putea face ceva la fel de simplu precum conectarea
index.html la / Etc / passwd și cereți „root” pentru a rula Wget cu -N or -r deci dosarul va
fi suprascris.

--no-glob
Dezactivați globalizarea FTP. Globbing se referă la utilizarea caracterelor speciale asemănătoare cochiliei
(metacaractere), ca *, ?, [ și ] pentru a prelua mai mult de un fișier din același director
deodată, cum ar fi:

wget ftp://gnjilux.srk.fer.hr/*.msg

În mod implicit, globul va fi activat dacă adresa URL conține un caracter globbing. Acest
opțiunea poate fi utilizată pentru a activa sau dezactiva permanent globbing.

Poate fi necesar să citați adresa URL pentru a o proteja de extinderea de către shell.
Globbing îl face pe Wget să caute o listă de directoare, care este specifică sistemului. Aceasta este
de ce funcționează în prezent doar cu serverele Unix FTP (și cu cele care emulează Unix „ls”
ieșire).

--no-passive-ftp
Dezactivați utilizarea pasiv Modul de transfer FTP. FTP pasiv impune ca
clientul se conectează la server pentru a stabili conexiunea de date, mai degrabă decât cealaltă
în jurul valorii de.

Dacă aparatul este conectat direct la Internet, atât FTP pasiv, cât și activ
ar trebui să funcționeze la fel de bine. În spatele celor mai multe configurații firewall și NAT are FTP pasiv
o șansă mai mare de a lucra. Cu toate acestea, în unele configurații rare de firewall, FTP activ
de fapt funcționează când FTP pasiv nu. Dacă bănuiți că acesta este cazul, utilizați acest lucru
opțiunea sau setați „passive_ftp=off” în fișierul de inițializare.

--preserve-permisiuni
Păstrați permisiunile fișierelor de la distanță în loc de permisiunile setate de umask.

--retr-legături simbolice
În mod implicit, atunci când se preiau directoare FTP în mod recursiv și o legătură simbolică este
întâlnite, legătura simbolică este parcursă și fișierele indicate sunt preluate.
În prezent, Wget nu traversează legături simbolice către directoare pentru a le descărca
recursiv, deși această caracteristică poate fi adăugată în viitor.

Cand --retr-symlinks=nu este specificat, fișierul asociat nu este descărcat. In schimb,
o legătură simbolică corespunzătoare este creată pe sistemul de fișiere local. Fișierul indicat va
nu poate fi extras decât dacă această extragere recursivă ar fi întâlnit-o separat
și oricum l-am descărcat. Această opțiune prezintă un risc de securitate în cazul unui FTP rău intenționat
Serverul poate determina Wget să scrie în fișiere din afara directoarelor dorite prin a
fișier .LISTING special creat.

Rețineți că atunci când preluați un fișier (nu un director), deoarece a fost specificat în fișierul
linia de comandă, mai degrabă decât pentru că a fost recurs la aceasta, această opțiune nu are niciun efect.
Legăturile simbolice sunt întotdeauna traversate în acest caz.

FTPS Opţiuni
--ftps-implicit
Această opțiune îi spune lui Wget să utilizeze implicit FTPS. FTPS implicit constă în inițializare
SSL/TLS de la începutul conexiunii de control. Această opțiune nu trimite
o comandă „AUTH TLS”: presupune că serverul vorbește FTPS și pornește direct un
Conexiune SSL/TLS. Dacă încercarea are succes, sesiunea continuă la fel
FTPS obișnuit („PBSZ” și „PROT” sunt trimise etc.). FTPS implicit nu mai este un
cerință pentru implementările FTPS și, prin urmare, este posibil ca multe servere să nu o accepte. Dacă
--ftps-implicit este trecut și nu este specificat niciun număr de port explicit, portul implicit pentru
FTPS implicit, 990, va fi folosit, în locul portului implicit pentru „normal”
(explicit) FTPS care este același cu cel al FTP, 21.

--no-ftps-resume-ssl
Nu reluați sesiunea SSL/TLS în canalul de date. La pornirea unei date
conexiune, Wget încearcă să reia sesiunea SSL/TLS începută anterior în control
conexiune. Reluarea sesiunii SSL/TLS evită efectuarea unei strângeri de mână complet noi
reutilizarea parametrilor SSL/TLS ai unei sesiuni anterioare. De obicei, serverele FTPS doresc
așa, așa că Wget face acest lucru în mod implicit. În circumstanțe rare, totuși, s-ar putea
doriți să începeți o sesiune SSL/TLS complet nouă în fiecare conexiune de date. Acesta este ce
--no-ftps-resume-ssl este pentru.

--ftps-clear-data-connection
Toate conexiunile de date vor fi în text simplu. Doar conexiunea de control va fi
sub SSL/TLS. Wget va trimite o comandă „PROT C” pentru a realiza acest lucru, ceea ce trebuie să fie
aprobat de server.

--ftps-fallback-to-ftp
Reveniți la FTP dacă FTPS nu este acceptat de serverul țintă. Din motive de securitate,
această opțiune nu este afirmată implicit. Comportamentul implicit este de a ieși cu un
eroare. Dacă un server nu răspunde cu succes la comanda inițială „AUTH TLS” sau
în cazul FTPS implicit, dacă încercarea inițială de conectare SSL/TLS este respinsă,
se considera ca un astfel de server nu suporta FTPS.

recursive Recuperare Opţiuni
-r
--recursiv
Activați recuperarea recursivă. Adâncimea maximă implicită este 5.

-l adâncime
--level=adâncime
Specificați nivelul maxim de adâncime al recursiunii adâncime.

--sterge-dupa
Această opțiune îi spune lui Wget să ștergă fiecare fișier pe care îl descarcă, după făcând asta.
Este util pentru preluarea prealabilă a paginilor populare printr-un proxy, de exemplu:

wget -r -nd --delete-după http://whatever.com/~popular/page/

-r opțiunea este de a prelua recursiv și -nd pentru a nu crea directoare.

Rețineți că --sterge-dupa șterge fișierele de pe computerul local. Nu emite
A LUI comandă către site-uri FTP la distanță, de exemplu. De asemenea, rețineți că atunci când --sterge-dupa is
specificat, --convert-link-uri este ignorat, deci .orig fișierele pur și simplu nu sunt create în
primul loc.

-k
--convert-link-uri
După ce descărcarea este completă, convertiți linkurile din document pentru a le crea
potrivit pentru vizionare locală. Acest lucru afectează nu numai hyperlinkurile vizibile, ci și orice
parte a documentului care face linkuri către conținut extern, cum ar fi imagini încorporate, linkuri către
foi de stil, hyperlinkuri către conținut non-HTML etc.

Fiecare link va fi modificat într-unul din cele două moduri:

· Legăturile către fișierele care au fost descărcate de Wget vor fi modificate pentru a se referi la
fișierul la care indică ca o legătură relativă.

Exemplu: dacă fișierul descărcat /foo/doc.html linkuri către /bar/img.gif, Deci,
descărcat, apoi linkul în doc.html va fi modificat pentru a indica ../bar/img.gif.
Acest tip de transformare funcționează în mod fiabil pentru combinații arbitrare de
directoare.

· Legăturile către fișiere care nu au fost descărcate de Wget vor fi schimbate în
includ numele gazdei și calea absolută a locației către care indică.

Exemplu: dacă fișierul descărcat /foo/doc.html linkuri către /bar/img.gif (sau la
../bar/img.gif), apoi linkul în doc.html va fi modificat pentru a indica
http://hostname/bar/img.gif.

Din acest motiv, navigarea locală funcționează în mod fiabil: dacă a fost descărcat un fișier legat, fișierul
linkul se va referi la numele local; dacă nu a fost descărcat, linkul se va referi la
adresa sa de Internet completă, în loc să prezinte o legătură întreruptă. Faptul că
link-urile anterioare sunt convertite în link-uri relative vă asigură că puteți muta cele descărcate
ierarhie către alt director.

Rețineți că numai la sfârșitul descărcării Wget poate ști ce link-uri au fost
descărcat. Din această cauză, munca făcută de -k va fi efectuată la sfârşitul tuturor
descărcările.

--convert-file-only
Această opțiune convertește numai partea de nume de fișier a adreselor URL, lăsând restul adreselor URL
neatins. Această parte a numelui de fișier este uneori denumită „nume de bază”, deși noi
evitați acest termen aici pentru a nu provoca confuzie.

Funcționează deosebit de bine împreună cu --ajustare-extensie, deși aceasta
cuplarea nu este impusă. Se dovedește util să populați cache-urile Internet cu fișiere
descărcat de pe diferite gazde.

Exemplu: dacă un link indică către //foo.com/bar.cgi?xyz cu --ajustare-extensie a afirmat
iar destinația sa locală se dorește să fie ./foo.com/bar.cgi?xyz.css, apoi linkul
ar fi convertit în //foo.com/bar.cgi?xyz.css. Rețineți că numai partea de nume de fișier are
fost modificată. Restul URL-ului a fost lăsat neatins, inclusiv calea rețelei
("//") care altfel ar fi procesat de Wget și convertit în efectiv
schema (adică „http://”).

-K
--backup-convertit
Când convertiți un fișier, faceți o copie de rezervă a versiunii originale cu a .orig sufix. Afectează
comportamentul de -N.

-m
--oglindă
Activați opțiunile potrivite pentru oglindire. Această opțiune activează recursiunea și timpul
ștampilare, setează adâncimea recursiunii infinite și păstrează listele de directoare FTP. Este
în prezent echivalent cu -r -N -l INF --no-remove-listing.

-p
--pagina-cerințe
Această opțiune face ca Wget să descarce corect toate fișierele necesare
afișează o anumită pagină HTML. Aceasta include lucruri precum imaginile, sunete și
foi de stil la care se face referire.

De obicei, atunci când descărcați o singură pagină HTML, orice documente necesare care ar putea fi
necesare pentru a-l afișa corect nu sunt descărcate. Folosind -r Împreună cu -l poate ajuta,
dar din moment ce Wget nu face de obicei o distincție între documentele externe și documentele integrate,
unul rămâne, în general, cu „documente de tip frunză” cărora le lipsesc cerințele.

De exemplu, să spunem document 1.html conține un „ " referire la etichetă 1.gif si un
Eticheta „ ” indicând documentul extern 2.html. Spune asta 2.html este asemanator dar atat
imaginea sa este 2.gif și se leagă la 3.html. Spune că asta continuă până la unii în mod arbitrar
număr mare.

Dacă cineva execută comanda:

wget -r -l 2 http:// /1.html

apoi 1.html, 1.gif, 2.html, 2.gif, și 3.html va fi descărcat. După cum puteți vedea,
3.html este fără cerinţele sale 3.gif deoarece Wget numără pur și simplu numărul de
hamei (până la 2) distanță de 1.html pentru a determina unde să oprească recursiunea.
Cu toate acestea, cu această comandă:

wget -r -l 2 -p http:// /1.html

toate fișierele de mai sus și 3.htmleste necesar 3.gif va fi descărcat. În mod similar,

wget -r -l 1 -p http:// /1.html

va cauza 1.html, 1.gif, 2.html, și 2.gif pentru a fi descărcat. S-ar putea crede că:

wget -r -l 0 -p http:// /1.html

ar descărca doar 1.html și 1.gif, dar din păcate nu este cazul, pentru că
-l 0 este echivalent cu -l INF---adică recursivitate infinită. Pentru a descărca un singur HTML
pagina (sau câteva dintre ele, toate specificate pe linia de comandă sau într-un -i Introducere URL
fișier) și cerințele sale (sau ale acestora), pur și simplu omiteți -r și -l:

wget -p http:// /1.html

Rețineți că Wget se va comporta ca și cum -r fusese specificată, dar numai acea singură pagină şi
cerinţele sale vor fi descărcate. Link-urile din pagina respectivă către documente externe vor fi
a nu fi urmat. De fapt, pentru a descărca o singură pagină și toate cerințele ei (chiar dacă
acestea există pe site-uri web separate) și asigurați-vă că lotul se afișează corect la nivel local,
acestui autor îi place să folosească câteva opțiuni în plus față de -p:

wget -E -H -k -K -p http:// /

Pentru a încheia acest subiect, merită să știți că ideea lui Wget de document extern
linkul este orice adresă URL specificată într-o etichetă „ „, un „ „etichetă sau un” " etichetați pe altul
decât " ".

--stricte-comentarii
Activați analiza strictă a comentariilor HTML. Implicit este de a termina comentariile la
prima apariție a ->.

Conform specificațiilor, comentariile HTML sunt exprimate ca SGML declarații.
Declarația este un marcaj special care începe cu <! și se termină cu >, Cum ar fi <!DOCTYPE
...>, care poate conține comentarii între o pereche de -- delimitatori. Comentariile HTML sunt
„Declarații goale”, declarații SGML fără niciun text fără comentarii. Prin urmare,
este un comentariu valid și așa este <!--one-- --doi-->, Dar nu este.

Pe de altă parte, majoritatea scriitorilor HTML nu percep comentariile ca altceva decât
text delimitat cu <!-- și ->, care nu este chiar la fel. De exemplu, ceva
ca funcționează ca un comentariu valid atâta timp cât numărul de liniuțe este a
multiplu de patru (!). Dacă nu, comentariul durează tehnic până la următorul --, Care
poate fi la celălalt capăt al documentului. Din acest motiv, multe browsere populare
ignora complet specificația și implementează ceea ce utilizatorii au ajuns să se aștepte:
comentarii delimitate cu <!-- și ->.

Până la versiunea 1.9, Wget a interpretat comentariile strict, ceea ce a dus la lipsă de legături
în multe pagini web care s-au afișat bine în browsere, dar au avut ghinionul
care conțin comentarii neconforme. Începând cu versiunea 1.9, Wget s-a alăturat
rânduri de clienți care implementează comentarii „naive”, terminând fiecare comentariu la
prima apariție a ->.

Dacă, din orice motiv, doriți o analiză strictă a comentariilor, utilizați această opțiune pentru a o transforma
pe.

recursive Accept/Respinge Opţiuni
-A acclist --Accept acclist
-R rejlist --respinge rejlist
Specificați liste separate prin virgulă de sufixe sau modele de nume de fișier de acceptat sau respins.
Rețineți că, dacă vreunul dintre caracterele wildcard, *, ?, [ or ], apar într-un element de
acclist or rejlist, va fi tratat ca un model, mai degrabă decât un sufix. In acest
În cazul în care, trebuie să includeți modelul între ghilimele pentru a preveni extinderea shell-ului
ea, ca în -A „*.mp3” or -A „*.mp3”.

--accept-regex urlregex
--reject-regex urlregex
Specificați o expresie regulată pentru a accepta sau a respinge adresa URL completă.

--tip regex tip regex
Specificați tipul expresiei regulate. Tipurile posibile sunt POSIX or pcre. Rețineți că pentru
să poată folosi pcre tip, wget trebuie să fie compilat cu suport libpcre.

-D lista de domenii
--domenii=lista de domenii
Setați domeniile de urmărit. lista de domenii este o listă de domenii separate prin virgulă. Notă
că o face nu aprinde -H.

--exclude-domenii lista de domenii
Specificați domeniile care sunt nu de urmat.

--follow-ftp
Urmați legăturile FTP din documentele HTML. Fără această opțiune, Wget va ignora toate
Legături FTP.

--follow-tags=listă
Wget are un tabel intern de perechi etichetă/atribut HTML pe care îl ia în considerare când
căutarea documentelor legate în timpul unei extrageri recursive. Dacă un utilizator dorește doar un
subsetul acelor etichete care trebuie luate în considerare, cu toate acestea, el sau ea ar trebui să specifice astfel de etichete
separate prin virgulă listă cu această opțiune.

--ignore-tags=listă
Acesta este opusul --follow-tag-uri opțiune. Pentru a sări peste anumite etichete HTML când
căutând recursiv documente de descărcat, specificați-le prin virgulă listă.

În trecut, această opțiune era cel mai bun pariu pentru descărcarea unei singure pagini și a acesteia
cerințe, folosind o linie de comandă precum:

wget --ignore-tags=a,area -H -k -K -r http:// /

Cu toate acestea, autorul acestei opțiuni a dat peste o pagină cu etichete precum „
HREF="/">" și și-a dat seama că specificarea etichetelor de ignorat nu era suficientă.
Nu se poate spune lui Wget să ignore" ", pentru că atunci foile de stil nu vor fi
descărcat. Acum, cel mai bun pariu pentru a descărca o singură pagină și cerințele acesteia este
dedicat --pagina-cerințe opțiune.

--ignora-majuscule
Ignorați majuscule și minuscule atunci când se potrivesc fișiere și directoare. Acest lucru influențează comportamentul lui -R,
Opțiunile -A, -I și -X, precum și globalizarea implementată la descărcarea de pe FTP
site-uri. De exemplu, cu această opțiune, -A "*.txt" se va potrivi fișier1.txt, Dar, de asemenea,
fisier2.TXT, fisier3.TxT, și așa mai departe. Citatele din exemplu sunt pentru a preveni shell-ul
de la extinderea tiparului.

-H
--span-hosts
Activați extinderea pe gazde atunci când faceți recuperarea recursivă.

-L
--relativ
Urmați numai link-uri relative. Util pentru a prelua o anumită pagină de pornire fără niciuna
distragerile, nici măcar cele de la aceleași gazde.

-I listă
--include-directories=listă
Specificați o listă de directoare separate prin virgulă pe care doriți să le urmați la descărcare.
Elemente de listă poate conține metacaractere.

-X listă
--exclude-directories=listă
Specificați o listă de directoare separate prin virgulă pe care doriți să le excludeți de la descărcare.
Elemente de listă poate conține metacaractere.

-np
--nu-părinte
Nu urcați niciodată în directorul părinte când recuperați recursiv. Acesta este un
opțiune utilă, deoarece garantează că numai fișierele de mai jos o anumită ierarhie va
fi descărcat.

MEDIUL


Wget acceptă proxy-uri atât pentru extrageri HTTP, cât și FTP. Modul standard de a specifica proxy
locația, pe care Wget o recunoaște, utilizează următoarele variabile de mediu:

Http proxy
https_proxy
Dacă este setat, Http proxy și https_proxy variabilele ar trebui să conțină adresele URL ale
proxy-uri pentru conexiunile HTTP și respectiv HTTPS.

ftp_proxy
Această variabilă ar trebui să conțină adresa URL a proxy-ului pentru conexiunile FTP. Este destul
comună că Http proxy și ftp_proxy sunt setate la aceeași adresă URL.

no_proxy
Această variabilă ar trebui să conțină o listă separată prin virgulă de extensii de domeniu ar trebui să fie proxy
nu a fi folosit pentru. De exemplu, dacă valoarea lui no_proxy is .mit.edu, proxy nu va
poate fi folosit pentru a prelua documente de la MIT.

EXIT STAREA


Wget poate returna unul dintre mai multe coduri de eroare dacă întâmpină probleme.

0 Nu au apărut probleme.

1 Cod de eroare generic.

2 Eroare de analiză --- de exemplu, la analizarea opțiunilor din linia de comandă, .wgetrc or
.netrc...

3 Eroare I/O fișier.

4 Eroare de rețea.

5 Eșec de verificare SSL.

6 Eroare la autentificarea numelui de utilizator/parolă.

7 Erori de protocol.

8 Serverul a emis un răspuns de eroare.

Cu excepția de la 0 și 1, codurile de ieșire cu numere mai mici au prioritate față de cele mai mari.
cele numerotate, când sunt întâlnite mai multe tipuri de erori.

În versiunile Wget anterioare versiunii 1.12, starea de ieșire a lui Wget tinde să fie inutilă și
inconsecventă. Descărcările recursive ar returna practic întotdeauna 0 (succes), indiferent de
orice probleme întâlnite, iar preluările nerecursive au returnat doar starea corespunzătoare
la cea mai recentă încercare de descărcare.

Utilizați wget online folosind serviciile onworks.net


Ad


Ad