אנגליתצרפתיתספרדי

Ad


סמל OnWorks

wget - מקוון בענן

הפעל wget בספק אירוח חינמי של OnWorks על Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

זהו הפקודה wget שניתן להפעיל בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS

תָכְנִית:

שֵׁם


Wget - הורדת הרשת הלא אינטראקטיבית.

תַקצִיר


wget [אוֹפְּצִיָה]... [כתובת האתר] ...

תיאור


GNU Wget הוא כלי חינמי להורדה לא אינטראקטיבית של קבצים מהאינטרנט. זה
תומך בפרוטוקולי HTTP, HTTPS ו-FTP, כמו גם אחזור דרך פרוקסי HTTP.

Wget אינו אינטראקטיבי, כלומר הוא יכול לעבוד ברקע, בעוד שהמשתמש לא
מחובר. זה מאפשר לך להתחיל שליפה ולהתנתק מהמערכת, נותן
בוא תסיים את העבודה. לעומת זאת, רוב דפדפני האינטרנט דורשים משתמש קבוע
נוכחות, שיכולה להוות מכשול גדול בעת העברת נתונים רבים.

Wget יכול לעקוב אחר קישורים בדפי HTML, XHTML ו-CSS, כדי ליצור גרסאות מקומיות של מרחוק
אתרי אינטרנט, בשחזור מלא של מבנה הספריות של האתר המקורי. זה
מכונה לפעמים "הורדה רקורסיבית". תוך כדי כך, Wget מכבד את
תקן אי הכללת רובוט (/robots.txt). ניתן להורות ל-Wget להמיר את הקישורים ב
קבצים שהורדו כדי להצביע על הקבצים המקומיים, לצפייה במצב לא מקוון.

Wget תוכנן לחוסן על פני חיבורי רשת איטיים או לא יציבים; אם
ההורדה נכשלת עקב בעיית רשת, היא תמשיך לנסות שוב עד שכל הקובץ יהיה
הוחזר. אם השרת תומך ב-Reketting, הוא ינחה את השרת להמשיך
ההורדה מהמקום שבו הפסיקה.

Wget אינו תומך ברשימות ביטול לקוחות (CRLs) ולכן אישור ה-HTTPS אתה
ההתחברות אל עשויה להתבטל על ידי בעל האתר.

אפשרויות


אפשרות תחביר
מכיוון ש-Wget משתמשת ב-GNU getopt כדי לעבד ארגומנטים של שורת הפקודה, לכל אפשרות יש צורה ארוכה
יחד עם הקצר. אפשרויות ארוכות יותר נוח לזכור, אבל לוקח זמן
סוּג. אתה יכול לערבב בחופשיות סגנונות אפשרויות שונות, או לציין אפשרויות לאחר הפקודה-
טיעוני קו. כך תוכל לכתוב:

wget -r --tries=10 http://fly.srk.fer.hr/ -o יומן

ניתן להשמיט את הרווח בין האפשרות קבלת טיעון לבין הטיעון.
במקום -o היכנס אתה יכול לכתוב -olog.

אתה יכול לשים כמה אפשרויות שאינן דורשות טיעונים ביחד, כמו:

wget -drc

זה לגמרי שווה ערך ל:

wget -d -r -c

מכיוון שניתן לציין את האפשרויות לאחר הארגומנטים, אתה יכול לסיים אותם עם --.
אז הבאים ינסו להוריד כתובת URL -x, דיווח על כישלון ל היכנס:

wget -o log -- -x

האפשרויות שמקבלות רשימות מופרדות בפסיקים כולן מכבדות את המוסכמה המציינת
רשימה ריקה מנקה את ערכה. זה יכול להיות שימושי כדי לנקות את .wgetrc הגדרות. ל
למשל, אם שלך .wgetrc מגדיר את "exclude_directories" ל /cgi-bin, הדוגמה הבאה
תחילה יאפס אותו, ולאחר מכן יגדיר אותו כך שלא תכלול /~אף אחד ו /~מישהו. אתה יכול גם
נקה את הרשימות .wgetrc.

wget -X " -X /~אף אחד,/~מישהו

רוב האפשרויות שאינן מקבלות טיעונים הן בוליאני אפשרויות, שנקראות כך בגלל שלהן
ניתן לתפוס מצב עם משתנה כן או לא ("בוליאני"). לדוגמה, --עקוב-ftp
אומר ל-Wget לעקוב אחר קישורי FTP מקובצי HTML, ומצד שני, --לא גלוב מספר את זה
לא לבצע חיפוש קבצים בכתובות FTP. אפשרות בוליאנית היא אחת מהאפשרויות חִיוּבִי or
שלילי (החל מ --לא). כל האפשרויות הללו חולקות מספר נכסים.

אלא אם נאמר אחרת, ההנחה היא שהתנהגות ברירת המחדל היא הפוכה ממה
האפשרות משיגה. לדוגמה, קיומו המתועד של --עקוב-ftp מניח
שברירת המחדל היא ל לֹא עקוב אחר קישורי FTP מדפי HTML.

ניתן לשלול אפשרויות חיוביות על ידי הצבת ה- --לא- לשם האופציה; שלילי
ניתן לשלול אפשרויות על ידי השמטת ה- --לא- קידומת. זה עשוי להיראות מיותר --- אם
ברירת המחדל של אפשרות חיובית היא לא לעשות משהו, אז למה לספק דרך לעשות זאת
לכבות אותו במפורש? אבל קובץ האתחול עשוי למעשה לשנות את ברירת המחדל. ל
דוגמה, באמצעות "follow_ftp = on" ב .wgetrc עושה את Wget לעקוב קישורי FTP כברירת מחדל, ו
באמצעות --no-follow-ftp היא הדרך היחידה לשחזר את ברירת המחדל של היצרן מהפקודה
קו.

בסיסי אתחול אפשרויות
-V
--גִרְסָה
הצג את הגרסה של Wget.

-h
- עזרה
הדפס הודעת עזרה המתארת ​​את כל אפשרויות שורת הפקודה של Wget.

-b
--רקע כללי
עבור לרקע מיד לאחר ההפעלה. אם לא צוין קובץ פלט דרך ה
-o, הפלט מנותב אל wget-log.

-e הפקודה
--לבצע הפקודה
לבצע הפקודה כאילו זה חלק מ .wgetrc. פקודה שתופעל כך תהיה
יצא לפועל לאחר הפקודות ב .wgetrc, ובכך מקבלים עדיפות על פניהם. אם אתה צריך
כדי לציין יותר מפקודת wgetrc אחת, השתמש במספר מופעים של -e.

רישום ו קֶלֶט שלח אפשרויות
-o קובץ לוג
--output-file=קובץ לוג
התחבר לכל ההודעות אל קובץ לוג. ההודעות מדווחות בדרך כלל לפי שגיאת תקן.

-a קובץ לוג
--append-output=קובץ לוג
לצרף קובץ לוג. זה אותו דבר כמו -o, רק זה מצריך קובץ לוג במקום
החלפת קובץ היומן הישן. אם קובץ לוג לא קיים, נוצר קובץ חדש.

-d
--לנפות
הפעל פלט באגים, כלומר מידע שונה חשוב למפתחי Wget
אם זה לא עובד כמו שצריך. ייתכן שמנהל המערכת שלך בחר לבצע קומפילציה
Wget ללא תמיכה באגים, במקרה זה -d לא יעבוד. שים לב ש
קומפילציה עם תמיכה באגים היא תמיד בטוחה --- Wget הידור עם תמיכה באגים
יצטרך לֹא להדפיס כל מידע על ניפוי באגים אלא אם כן התבקש עם -d.

-q
--שֶׁקֶט
כבה את הפלט של Wget.

-v
--מִלוּלִי
הפעל פלט מילולי, עם כל הנתונים הזמינים. פלט ברירת המחדל הוא מילולי.

-nv
--ללא מילים
כבה מילולית מבלי להיות שקט לחלוטין (השתמש -q בשביל זה), מה שאומר ש
הודעות שגיאה ומידע בסיסי עדיין מודפסות.

--report-speed=סוג
רוחב פס פלט כ סוג. הערך המקובל היחיד הוא ביטים.

-i פילה
--input-file=פילה
קרא כתובות URL מכתובת מקומית או חיצונית פילה. אם - מוגדר כ- פילה, כתובות אתרים נקראות
מהקלט הסטנדרטי. (להשתמש ./- לקרוא מקובץ ששמו המילולי -.)

אם נעשה שימוש בפונקציה זו, אין צורך להציג כתובות URL בשורת הפקודה. אם יש
כתובות URL הן בשורת הפקודה והן בקובץ קלט, אלו בשורות הפקודה יהיו
הראשונים שיושלמו. אם --force-html לא מצוין, אם כך פילה צריך
מורכב מסדרה של כתובות URL, אחת בכל שורה.

עם זאת, אם אתה מציין --force-html, המסמך ייחשב כ html. בתוך זה
במקרה שאולי יש לך בעיות עם קישורים יחסיים, שאותן תוכל לפתור על ידי הוספה
"url">" למסמכים או לפי ציון --base=כתובת אתר בשורת הפקודה.

אם פילה הוא חיצוני, המסמך יטופל באופן אוטומטי html if
התאמות מסוג Content-Type טקסט / HTML. יתר על כן, פילההמיקום של יהיה
משמש באופן מרומז כ-base href אם אף אחד לא צוין.

--input-metalink=פילה
מוריד קבצים המכוסים ב- Metalink המקומי פילה. Metalink גרסה 3 ו-4 הם
נתמך.

--metalink-over-http
מנפיק בקשת HTTP HEAD במקום GET ומחלץ מטא-נתונים של Metalink מהתגובה
כותרות. ואז זה עובר להורדה של Metalink. אם אין מטא נתונים חוקיים של Metalink
נמצא, זה נופל להורדה רגילה של HTTP.

--מיקום מועדף
הגדר מיקום מועדף עבור משאבי Metalink. זה משפיע על משאבים מרובים
עם אותה עדיפות זמינים.

-F
--force-html
כאשר הקלט נקרא מקובץ, הכריח אותו להתייחס כקובץ HTML. זה מאפשר
תוכל לאחזר קישורים יחסיים מקובצי HTML קיימים בדיסק המקומי שלך, על ידי הוספה
"url">" ל-HTML, או באמצעות ה --בסיס אפשרות שורת פקודה.

-B כתובת האתר
--base=כתובת האתר
פותר קישורים יחסיים באמצעות כתובת האתר כנקודת התייחסות, בעת קריאת קישורים מ
קובץ HTML שצוין באמצעות ה- -i/--קובץ קלט אפשרות (יחד עם --force-html, או
כאשר קובץ הקלט הובא מרחוק משרת המתאר אותו כ-HTML). זה
שווה ערך לנוכחות של תג "BASE" בקובץ הקלט HTML, עם כתובת האתר כמו
ערך עבור התכונה "href".

למשל, אם אתה מציין http://foo/bar/a.html ל כתובת האתר, ו-Wget קורא
../baz/b.html מקובץ הקלט, זה ייפתר ל http://foo/baz/b.html.

--config=קובץ
ציין את המיקום של קובץ הפעלה שבו ברצונך להשתמש.

--rejected-log=קובץ לוג
רושם את כל דחיות כתובות האתרים אל קובץ לוג כערכים מופרדים בפסיקים. הערכים כוללים את
סיבת הדחייה, כתובת האתר וכתובת האתר האב שבה היא נמצאה.

הורדה אפשרויות
--bind-address=כתובת
בעת יצירת חיבורי TCP/IP של לקוח, התחבר אל כתובת במכונה המקומית. כתובת
ניתן לציין כשם מארח או ככתובת IP. אפשרות זו יכולה להיות שימושית אם שלך
המכונה קשורה למספר כתובות IP.

-t מספר
--מנסה=מספר
הגדר מספר ניסיונות ל מספר. ציין 0 או inf לניסיון חוזר אינסופי. ברירת המחדל היא
לנסות שוב 20 פעמים, למעט שגיאות קטלניות כמו "החיבור נדחה" או
"לא נמצא" (404), אשר לא מנוסים שוב.

-O פילה
--output-document=פילה
המסמכים לא ייכתבו לקבצים המתאימים, אבל כולם יהיו
שרשור יחד ונכתב ל פילה. אם - משמש כ פילה, מסמכים יהיו
מודפס לפלט סטנדרטי, משבית המרת קישורים. (להשתמש ./- כדי להדפיס לקובץ
בשם מילולי -.)

שימוש -O is לֹא פירושו פשוט "השתמש בשם פילה במקום זה שב
URL;" במקום זאת, זה מקביל להפניה מחדש של מעטפת: wget -O פילה http://foo is
נועד לעבוד כמו wget -O - http://foo > פילה; פילה יקוצץ מיד,
ו את כל תוכן שהורד ייכתב שם.

מהסיבה הזו, -N (עבור בדיקת חותמת זמן) אינו נתמך בשילוב עם -O:
since פילה תמיד נוצר לאחרונה, תמיד תהיה לו חותמת זמן חדשה מאוד. א
תינתן אזהרה אם נעשה שימוש בשילוב זה.

באופן דומה, באמצעות -r or -p עם -O אולי לא יעבוד כפי שאתה מצפה: Wget לא יוריד רק
הקובץ הראשון ל פילה ולאחר מכן הורד את השאר לשמות הרגילים שלהם: את כל
תוכן שהורד יוצב ב פילה. זה הושבת בגרסה 1.11, אבל יש
הוחזר (עם אזהרה) ב-1.11.2, שכן ישנם מקרים שבהם זה
להתנהגות יכולה להיות שימוש מסוים.

שילוב עם -נ.צ. מתקבל רק אם קובץ הפלט הנתון אינו קיים.

שימו לב ששילוב עם -k מותר רק בהורדת מסמך בודד,
כמו במקרה זה, הוא פשוט ימיר את כל ה-URI היחסיים לאלה חיצוניים; -k עושה לא
חוש למספר URIs כאשר כולם יורדים לקובץ בודד; -k יכול להיות
משמש רק כאשר הפלט הוא קובץ רגיל.

-נ.צ.
--לא קלובר
אם הורדת קובץ יותר מפעם אחת באותה ספרייה, ההתנהגות של Wget תלויה
על כמה אפשרויות, כולל -נ.צ.. במקרים מסוימים, הקובץ המקומי יהיה מסורבל,
או מוחלף, בהורדה חוזרת ונשנית. במקרים אחרים הוא יישמר.

כשמריצים Wget בלי -N, -נ.צ., -r, או -p, הורדת אותו קובץ באותו
ספרייה תביא את העותק המקורי של פילה נשמר והעותק השני
להיות שם פילה.1. אם הקובץ הזה יורד שוב, העותק השלישי יהיה
בשם פילה.2, וכן הלאה. (זו גם ההתנהגות עם -nd, אפילו אם -r or -p נמצאים ב
השפעה.) מתי -נ.צ. צוין, התנהגות זו מדוכאת, ו-Wget יסרב לעשות זאת
הורד עותקים חדשים יותר של פילה. לכן, ""לא קלובר"" הוא למעשה כינוי שגוי
המצב הזה --- זה לא גזירה שנמנעה (מכיוון שהסיומות המספריות כבר היו
מניעת תקלות), אלא שמירת גרסאות מרובות שנמנעה.

בעת הפעלת Wget עם -r or -p, אבל בלי -N, -nd, או -נ.צ., הורדה מחדש של קובץ
יגרום לכך שהעותק החדש פשוט יחליף את הישן. מוֹסִיף -נ.צ. ימנע זאת
התנהגות, במקום זאת גורם לשימור הגרסה המקורית ולהשתמש בעותקים חדשים יותר
מהשרת שיש להתעלם ממנו.

בעת הפעלת Wget עם -N, עם או בלי -r or -p, ההחלטה האם או לא
הורדת עותק חדש יותר של קובץ תלוי בחותמת הזמן המקומית והמרוחקת ובגודל
של הקובץ. -נ.צ. לא ניתן לציין במקביל -N.

שילוב עם -O/--פלט-מסמך מתקבל רק אם קובץ הפלט הנתון כן
לא קיים.

שים לב שמתי -נ.צ. מצוין, קבצים עם הסיומות Html. or . Htm יוטען
מהדיסק המקומי ומנותח כאילו אוחזרו מהרשת.

--גיבויים=גיבויים
לפני (מעל) כתיבת קובץ, גבה קובץ קיים על ידי הוספת א .1 סיומת (_1 on
VMS) לשם הקובץ. קבצי גיבוי כאלה מסובבים ל .2, .3, וכן הלאה, עד
גיבויים (והפסיד מעבר לזה).

-c
--לְהַמשִׁיך
המשך לקבל קובץ שהורד חלקית. זה שימושי כאשר אתה רוצה לסיים
הורדה שהתחילה על ידי מופע קודם של Wget, או על ידי תוכנית אחרת. ל
למשל:

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z

אם יש קובץ בשם ls-lR.Z בספרייה הנוכחית, Wget יניח שכן
החלק הראשון של הקובץ המרוחק, ויבקש מהשרת להמשיך את
שליפה מקיזוז השווה לאורך הקובץ המקומי.

שים לב שאינך צריך לציין אפשרות זו אם אתה רק רוצה את הנוכחי
קריאת Wget לנסות להוריד קובץ אם החיבור יתאבד באמצע הדרך
דרך. זוהי התנהגות ברירת המחדל. -c משפיע רק על חידוש הורדות
החל קוֹדֵם לקריאה זו של Wget, ושתיקיה המקומיים עדיין נמצאים
סְבִיב.

ללא -c, הדוגמה הקודמת פשוט תוריד את הקובץ המרוחק אל ls-lR.Z.1,
משאירים את הקטום ls-lR.Z קובץ לבד.

החל מ-Wget 1.7, אם אתה משתמש -c על קובץ לא ריק, ומתברר שה
השרת אינו תומך בהמשך הורדה, Wget יסרב להתחיל את ההורדה
מאפס, מה שיהרוס למעשה את התוכן הקיים. אם אתה באמת רוצה את
הורד כדי להתחיל מאפס, הסר את הקובץ.

מתחיל גם ב-Wget 1.7, אם אתה משתמש -c על קובץ שגודלו שווה ל-
אחד בשרת, Wget יסרב להוריד את הקובץ ולהדפיס הסבר
הוֹדָעָה. אותו דבר קורה כאשר הקובץ קטן יותר בשרת מאשר מקומי
(כנראה בגלל שהוא השתנה בשרת מאז ההורדה האחרונה שלך
ניסיון)---מכיוון ש"המשך" אינו משמעותי, לא מתרחשת הורדה.

בצד השני של המטבע, תוך כדי שימוש -c, כל קובץ שגדול יותר בשרת
מאשר באופן מקומי ייחשב הורדה לא שלמה ורק "(אורך (מרחוק) -
length(local))" בייטים יורדו ויוצמדו לקצה הקובץ המקומי.
התנהגות זו יכולה להיות רצויה במקרים מסוימים --- לדוגמה, אתה יכול להשתמש wget -c ל
הורד רק את החלק החדש שצורף לאיסוף נתונים או לקובץ יומן.

עם זאת, אם הקובץ גדול יותר בשרת בגלל שהוא היה השתנה, בניגוד ל
רק צורף כדי, תקבל קובץ משובש. ל-Wget אין דרך לאמת
שהקובץ המקומי הוא באמת קידומת חוקית של הקובץ המרוחק. אתה צריך להיות
זהיר במיוחד מזה בעת השימוש -c בשיתוף עם -r, שכן כל קובץ יהיה
להיחשב כמועמד "הורדה לא שלמה".

מקרה נוסף שבו תקבל קובץ משובש אם תנסה להשתמש -c הוא אם יש לך א
פרוקסי HTTP צולע שמכניס מחרוזת "העברה מופרעת" לקובץ המקומי. ב
בעתיד עשויה להתווסף אפשרות "החזרה לאחור" לטיפול במקרה זה.

שים לב כי -c עובד רק עם שרתי FTP ועם שרתי HTTP התומכים ב
כותרת "טווח".

--start-pos=OFFSET
התחל להוריד במיקום מבוסס אפס OFFSET. היסט עשוי להתבטא בבתים,
קילובייט עם סיומת 'k', או מגה-בייט עם סיומת 'm' וכו'.

--התחל-פוזי יש עדיפות גבוהה יותר על --לְהַמשִׁיך. כאשר --התחל-פוזי ו --לְהַמשִׁיך
שניהם מצוינים, wget ישלח אזהרה ואז תמשיך כאילו --לְהַמשִׁיך נעדר.

נדרשת תמיכת שרת להמשך הורדה, אחרת --התחל-פוזי לא יכול לעזור.
לִרְאוֹת -c לקבלת פרטים.

--התקדמות=סוג
בחר את סוג מחוון ההתקדמות שבו ברצונך להשתמש. אינדיקטורים משפטיים הם "נקודה"
ו"בר".

מחוון "סרגל" משמש כברירת מחדל. זה מצייר גרפיקה של סרגל התקדמות ASCII
(המכונה תצוגת "מדחום") המציינת את מצב השליפה. אם הפלט הוא
לא TTY, סרגל ה"נקודות" ישמש כברירת מחדל.

השתמש - התקדמות = נקודה כדי לעבור לתצוגה "נקודה". זה עוקב אחר השליפה על ידי
הדפסת נקודות על המסך, כל נקודה מייצגת כמות קבועה של נתונים שהורדו.

ההתקדמות סוג יכול גם לקחת פרמטר אחד או יותר. הפרמטרים משתנים בהתאם
מה היא סוג נבחר. פרמטרים ל סוג מועברים על ידי צירופם לסוג
חולץ על ידי נקודתיים (:) כך: --התקדמות=סוג:parameter1:parameter2.

בעת שימוש באחזור המנוקד, אתה יכול להגדיר את סגנון על ידי ציון הסוג כ
נְקוּדָה:סגנון. סגנונות שונים מייחסים משמעות שונה לנקודה אחת. עם ה"ברירת מחדל"
סגנון כל נקודה מייצגת 1K, יש עשר נקודות באשכול ו-50 נקודות בקו.
לסגנון ה"בינארי" יש כיוון יותר דמוי "מחשב" --- 8K נקודות, אשכולות של 16 נקודות
ו-48 נקודות לכל קו (מה שמייצר 384K קווים). סגנון ה"מגה" מתאים ל
הורדת קבצים גדולים --- כל נקודה מייצגת 64K שאוחזרו, יש שמונה נקודות ב
אשכול, ו-48 נקודות בכל קו (כך שכל שורה מכילה 3M). אם "מגה" לא מספיק
אז אתה יכול להשתמש בסגנון "גיגה" --- כל נקודה מייצגת 1M שאוחזר, יש שמונה
נקודות במקבץ, ו-32 נקודות בכל קו (כך שכל שורה מכילה 32M).

עם --התקדמות=סרגל, יש כרגע שני פרמטרים אפשריים, כּוֹחַ ו אין גלילה.

כאשר הפלט אינו TTY, סרגל ההתקדמות תמיד נופל בחזרה ל"נקודה", גם אם
--התקדמות=סרגל הועבר ל-Wget במהלך הפנייה. ניתן לעקוף התנהגות זו
והפלט "סרגל" שנכפה על ידי שימוש בפרמטר "force" as --progress=bar:force.

כברירת מחדל, בָּר סרגל ההתקדמות בסגנון גלול את שם הקובץ משמאל לימין
עבור הקובץ המוורד אם שם הקובץ חורג מהאורך המרבי שהוקצה לו
התצוגה שלו. במקרים מסוימים, כמו עם --progress=bar:force, אולי לא רוצים
שם הקובץ הגלילה בסרגל ההתקדמות. על ידי העברת הפרמטר "noscroll", Wget
ניתן לאלץ להציג כמה שיותר משם הקובץ מבלי לגלול
זה.

שים לב שאתה יכול להגדיר את סגנון ברירת המחדל באמצעות הפקודה "התקדמות" ב .wgetrc. זה
ניתן לעקוף את ההגדרה משורת הפקודה. לדוגמה, כדי לאלץ את פלט הסרגל
מבלי לגלול, השתמש --progress=bar:force:noscroll.

--להראות-התקדמות
כפה על wget להציג את סרגל ההתקדמות בכל מילוליות.

כברירת מחדל, wget מציג רק את סרגל ההתקדמות במצב מילולי. אפשר עם זאת,
רוצה ש-wget יציג את סרגל ההתקדמות על המסך בשילוב עם כל סרגל אחר
מצבי מילוליות כמו --ללא מילים or --שֶׁקֶט. זה לעתים קרובות נכס רצוי כאשר
מפעיל את wget כדי להוריד כמה קבצים קטנים/גדולים. במקרה כזה, wget יכול
פשוט יופעל עם הפרמטר הזה כדי לקבל פלט הרבה יותר נקי על המסך.

אפשרות זו גם תאלץ את סרגל ההתקדמות להדפיס סטדרר כאשר משתמשים בו
לצד --קובץ לוג אוֹפְּצִיָה.

-N
--חותמת זמן
הפעל את החתמת זמן.

--לא-אם-שונה-מאז
אל תשלח את הכותרת If-Modified-Since פנימה -N מצב. שלח בקשת HEAD ראשונית
במקום זאת. זה משפיע רק ב -N מצב.

--לא-שימוש-שרת-חותמות זמן
אל תגדיר את חותמת הזמן של הקובץ המקומי לפי זה בשרת.

כברירת מחדל, כאשר קובץ מוורד, חותמות הזמן שלו מוגדרות כך שיתאימו לאלו מה-
קובץ מרוחק. זה מאפשר שימוש ב --חותמת זמן על קריאות עוקבות של wget.
עם זאת, לפעמים שימושי לבסס את חותמת הזמן של הקובץ המקומי על תאריך זה
הורד בפועל; לשם כך, ה --לא-שימוש-שרת-חותמות זמן האפשרות הייתה
בתנאי.

-S
--תגובת שרת
הדפס את הכותרות שנשלחו על ידי שרתי HTTP ואת התגובות שנשלחו על ידי שרתי FTP.

--עַכָּבִישׁ
כאשר מופעל עם אפשרות זו, Wget יתנהג כאינטרנט עכביש, מה שאומר שזה
לא יוריד את הדפים, רק תבדוק שהם שם. לדוגמה, אתה יכול להשתמש
Wget כדי לבדוק את הסימניות שלך:

wget --spider --force-html -i bookmarks.html

תכונה זו זקוקה להרבה יותר עבודה כדי ש-Wget יתקרב לפונקציונליות של real
עכבישי רשת.

-T שניות
--פסק זמן=שניות
הגדר את פסק הזמן של הרשת ל שניות שניות. זה שווה ערך לציון
--dns-timeout, --זמן קצוב לחיבור, ו --הפסקת קריאה, הכל במקביל.

בעת אינטראקציה עם הרשת, Wget יכול לבדוק פסק זמן ולבטל את הפעולה
אם זה לוקח יותר מדי זמן. זה מונע חריגות כמו קריאות תלייה ואינסופיות
מתחבר. פסק הזמן היחיד המופעל כברירת מחדל הוא פסק זמן קריאה של 900 שניות. הגדרה
פסק זמן עד 0 משבית אותו לחלוטין. אלא אם כן אתה יודע מה אתה עושה, זה הכי טוב
לא לשנות את הגדרות ברירת המחדל של הזמן הקצוב.

כל האפשרויות הקשורות לזמן קצוב מקבלים ערכים עשרוניים, כמו גם ערכים משנה. ל
דוגמא, 0.1 שניות היא בחירה חוקית (אם כי לא חכמה) של פסק זמן. פסק זמן משנה
שימושיים לבדיקת זמני תגובה של שרת או לבדיקת זמן אחזור של הרשת.

--dns-timeout=שניות
הגדר את פסק הזמן של בדיקת ה-DNS ל שניות שניות. חיפושי DNS שאינם מסתיימים בפנים
הזמן שצוין ייכשל. כברירת מחדל, אין פסק זמן בחיפושי DNS, אחרת
מזה שמיושם על ידי ספריות מערכת.

--connect-timeout=שניות
הגדר את פסק הזמן לחיבור ל שניות שניות. חיבורי TCP שלוקח יותר זמן
להקים יבוטל. כברירת מחדל, אין פסק זמן לחיבור, מלבד זאת
מיושם על ידי ספריות מערכת.

--קריאה-פסק זמן=שניות
הגדר את פסק הזמן לקריאה (וכתיבה) ל שניות שניות. ה"זמן" של פסק הזמן הזה
מתייחס להתבטל זמן: אם, בשלב כלשהו של ההורדה, לא יתקבלו נתונים עבור יותר
ממספר השניות שצוין, הקריאה נכשלת וההורדה מופעלת מחדש.
אפשרות זו אינה משפיעה ישירות על משך ההורדה כולה.

כמובן, השרת המרוחק עשוי לבחור לסיים את החיבור מוקדם יותר מזה
אפשרות דורשת. פסק זמן הקריאה המוגדר כברירת מחדל הוא 900 שניות.

--limit-rate=כמות
הגבל את מהירות ההורדה ל כמות בתים לשנייה. הסכום עשוי להתבטא ב
בתים, קילובייטים עם ה- k סיומת, או מגה-בייט עם ה- m סִיוֹמֶת. לדוגמה,
--limit-rate=20k יגביל את קצב האחזור ל-20KB/s. זה שימושי כאשר, עבור
תהיה הסיבה אשר תהיה, אתה לא רוצה ש-Wget יצרוך את כל רוחב הפס הזמין.

אפשרות זו מאפשרת שימוש במספרים עשרוניים, בדרך כלל בשילוב עם כוח
סיומות; לדוגמה, --limit-rate=2.5k הוא ערך משפטי.

שימו לב ש-Wget מיישמת את ההגבלה על ידי שינה את פרק הזמן המתאים
לאחר קריאת רשת שנמשכה פחות זמן ממה שצוין בקצב. בסופו של דבר זה
האסטרטגיה גורמת להאטת העברת ה-TCP לקצב שצוין בערך.
עם זאת, עשוי לקחת זמן עד שיושג איזון זה, אז אל תתפלאו
אם הגבלת הקצב לא עובדת טוב עם קבצים קטנים מאוד.

-w שניות
--חכה=שניות
המתן את מספר השניות שצוין בין השליפות. השימוש באפשרות זו הוא
מומלץ, מכיוון שהוא מקל על עומס השרת על ידי הפיכת הבקשות לפחות תכופות.
במקום בשניות, ניתן לציין את הזמן בדקות באמצעות הסיומת "m", in
שעות באמצעות סיומת "h", או בימים באמצעות סיומת "d".

ציון ערך גדול עבור אפשרות זו שימושי אם הרשת או היעד
המארח מושבת, כך ש-Wget יכול לחכות מספיק זמן כדי לצפות לשגיאת הרשת באופן סביר
לתקן לפני הניסיון החוזר. מרווח ההמתנה שצוין על ידי פונקציה זו הוא
מושפע מ-"--random-wait", אשר רואים.

--waitretry=שניות
אם אתה לא רוצה ש-Wget תחכה בין לבין כל שליפה, אבל רק בין ניסיונות חוזרים של
הורדות שנכשלו, אתה יכול להשתמש באפשרות זו. Wget תשתמש קווים התרחק, מחכה 1
שניה לאחר הכישלון הראשון בקובץ נתון, ולאחר מכן המתנה של 2 שניות לאחר ה
כשל שני בקובץ זה, עד למספר המרבי של שניות אתה מציין.

כברירת מחדל, Wget יניח ערך של 10 שניות.

--המתנה אקראית
אתרי אינטרנט מסוימים עשויים לבצע ניתוח יומן כדי לזהות תוכניות אחזור כגון Wget by
מחפש דמיון מובהק סטטיסטית בזמן שבין בקשות. זֶה
האפשרות גורמת לזמן בין בקשות להשתנות בין 0.5 ל-1.5 * לחכות שניות,
איפה לחכות צוין באמצעות ה --לַחֲכוֹת אפשרות, על מנת להסוות את נוכחותו של Wget
מניתוח כזה.

מאמר משנת 2001 בפרסום המוקדש לפיתוח בפלטפורמה צרכנית פופולרית
סיפק קוד לביצוע ניתוח זה תוך כדי תנועה. מחברו הציע לחסום ב-
רמת הכתובת Class C כדי להבטיח שתוכניות אחזור אוטומטיות נחסמו למרות זאת
שינוי כתובות שסופקו ב-DHCP.

אל האני --המתנה אקראית האופציה קיבלה השראה מהמלצה לא מומלצת זו לחסום רבים
משתמשים לא קשורים מאתר אינטרנט עקב פעולותיו של אחד מהם.

--ללא פרוקסי
אל תשתמש בפרוקסי, גם אם משתנה הסביבה המתאים *_proxy מוגדר.

-Q מכסת
--מכסה=מכסת
ציין מכסת הורדות עבור אחזורים אוטומטיים. ניתן לציין את הערך בבתים
(ברירת מחדל), קילובייט (עם k סיומת), או מגה-בייט (עם m סִיוֹמֶת).

שימו לב שמכסה לעולם לא תשפיע על הורדת קובץ בודד. אז אם תפרט wget
-Q10k ftp://wuarchive.wustl.edu/ls-lR.gz, כל ה ls-lR.gz יורדו. ה
כך גם כאשר צוינו מספר כתובות אתרים בשורת הפקודה. עם זאת, מכסה היא
מכובד בעת אחזור רקורסיבית או מקובץ קלט. כך אתה יכול
הקלד בטוח wget -Q2m -i אתרים---ההורדה תבוטל בעת חריגה מהמכסה.

הגדרת המכסה ל-0 או ל inf מגביל את מכסת ההורדות.

--no-dns-cache
כבה את שמירה במטמון של חיפושי DNS. בדרך כלל, Wget זוכר את כתובות ה-IP שהיא נראתה
למעלה מה-DNS כך שהוא לא יצטרך ליצור קשר שוב ושוב עם שרת ה-DNS עבור אותו הדבר
סט מארחים (בדרך כלל קטן) שמהם הוא מאחזר. מטמון זה קיים בזיכרון בלבד; א
הפעלת Wget חדשה תיצור קשר עם DNS שוב.

עם זאת, דווח שבמצבים מסוימים לא רצוי לשמור במטמון
שמות מארחים, אפילו למשך יישום קצר כמו Wget. עם זה
option Wget מנפיקה חיפוש DNS חדש (ליתר דיוק, קריאה חדשה ל-"gethostbyname" או
"getaddrinfo") בכל פעם שהוא יוצר חיבור חדש. שימו לב שאופציה זו תעשה זאת
לֹא להשפיע על שמירה במטמון שעשוי להתבצע על ידי הספרייה הפותרת או על ידי גורם חיצוני
שכבת מטמון, כגון NSCD.

אם אתה לא מבין בדיוק מה האפשרות הזו עושה, כנראה שלא תזדקק לה.

--restrict-file-names=מצבי
שנה אילו תווים שנמצאים בכתובות URL מרוחקות חייבים לעבור אסקייפ במהלך היצירה של
שמות קבצים מקומיים. דמויות שכן מוגבל על ידי אפשרות זו נמלטים, כלומר
הוחלף ב %HH, שם HH הוא המספר הקסדצימלי המתאים ל-
אופי מוגבל. ניתן להשתמש באפשרות זו גם כדי לאלץ את כל המקרים האלפביתיים לעשות זאת
להיות או באותיות קטנות או רישיות.

כברירת מחדל, Wget בורחת מהתווים שאינם חוקיים או בטוחים כחלק מהקובץ
שמות במערכת ההפעלה שלך, כמו גם תווי בקרה שהם בדרך כלל
לא ניתן להדפסה. אפשרות זו שימושית לשינוי ברירות מחדל אלה, אולי בגלל שאתה
מורידים למחיצה שאינה מקורית, או בגלל שברצונך לבטל את היציאה של
את תווי הבקרה, או שברצונך להגביל עוד יותר את התווים רק לאלו שנמצאים
טווח הערכים של ASCII.

אל האני מצבי הם קבוצה מופרדת בפסיקים של ערכי טקסט. הערכים המקובלים הם יוניקס,
חלונות, אין שליטה, ASCII, באותיות קטנות, ו באותיות רישיות. הערכים יוניקס ו חלונות יש לו
סותרים זה את זה (אחד יעקוף את השני), כפי שהם באותיות קטנות ו באותיות רישיות.
אלה האחרונים הם מקרים מיוחדים, מכיוון שהם לא משנים את קבוצת התווים
להימלט, אלא להכריח נתיבי קבצים מקומיים להיות מומרים או לנמוך או
אותיות רישיות.

כאשר "unix" מצוין, Wget בורח מהדמות / ותווי הבקרה ב
הטווחים 0--31 ו-128--159. זוהי ברירת המחדל במערכות הפעלה דמויות יוניקס.

כאשר ניתן "חלונות", Wget בורח מהדמויות \, |, /, :, ?, ", *, <, >, ו
תווי הבקרה בטווחים 0--31 ו-128--159. בנוסף לכך, Wget in
משתמש במצב Windows + במקום : להפריד מארח ויציאה בשמות קבצים מקומיים, ו
שימושים @ במקום ? כדי להפריד את חלק השאילתה של שם הקובץ מהשאר.
לכן, כתובת אתר שתישמר בשם www.xemacs.org:4300/search.pl?input=blah in
מצב Unix יישמר בתור www.xemacs.org+4300/search.pl@input=blah במצב Windows.
מצב זה הוא ברירת המחדל ב-Windows.

אם אתה מציין אין שליטה, אז גם הבריחה של תווי הבקרה משתנה
כבוי. אפשרות זו עשויה להיות הגיונית כאשר אתה מוריד כתובות אתרים ששמותיהן מכילים
תווי UTF-8, במערכת שיכולה לשמור ולהציג שמות קבצים ב-UTF-8 (חלקם
ערכי בתים אפשריים המשמשים ברצפי בתים UTF-8 נופלים בטווח הערכים
סומנה על ידי Wget כ"בקרות").

אל האני ASCII מצב משמש כדי לציין שכל בתים שהערכים שלהם נמצאים מחוץ לטווח של
תווי ASCII (כלומר, יותר מ-127) יהיו ב-escape. זה יכול להיות שימושי כאשר
שמירת שמות קבצים שהקידוד שלהם אינו תואם לזה שבשימוש מקומי.

-4
--inet4 בלבד
-6
--inet6 בלבד
כפה חיבור לכתובות IPv4 או IPv6. עם --inet4 בלבד or -4, Wget רק
להתחבר למארחי IPv4, התעלמות מרשומות AAAA ב-DNS וסירוב להתחבר ל-IPv6
כתובות שצוינו בכתובות URL. לעומת זאת, עם --inet6 בלבד or -6, Wget רק
להתחבר למארחי IPv6 ולהתעלם מרשומות A וכתובות IPv4.

אין צורך בשתי האפשרויות בדרך כלל. כברירת מחדל, Wget מודע ל-IPv6 ישתמש
משפחת הכתובות שצוינה ברשומת ה-DNS של המארח. אם ה-DNS מגיב בשניהם
כתובות IPv4 ו-IPv6, Wget ינסה אותן ברצף עד שימצא אחת שתוכל
להתחבר ל. (ראה גם אפשרות "--prefer-family" המתוארת להלן.)

ניתן להשתמש באפשרויות אלה כדי לאלץ שימוש בכוונה בכתובת IPv4 או IPv6
משפחות במערכות דו-משפחתיות, בדרך כלל כדי לסייע באיתור באגים או כדי להתמודד עם שבורים
תצורת רשת. רק אחד מ --inet6 בלבד ו --inet4 בלבד ניתן לציין ב
אותו זמן. אף אחת מהאפשרויות אינה זמינה ב-Wget הידור ללא תמיכה ב-IPv6.

--prefer-family=none/IPv4/IPv6
כאשר ניתנת בחירה בין מספר כתובות, התחבר לכתובות שצוינו
קודם כל לפנות למשפחה. הזמנת הכתובת המוחזרת על ידי DNS משמשת ללא שינוי על ידי
ברירת המחדל.

זה ימנע שגיאות מזויפות וניסיונות חיבור בעת גישה למארחים שפותרים
גם כתובות IPv6 וגם IPv4 מרשתות IPv4. לדוגמה, www.kame.net פותר
ל 2001:200:0:8002:203:47ff:fea5:3085 כדי 203.178.141.194. כאשר המועדף
המשפחה היא "IPv4", כתובת ה-IPv4 משמשת תחילה; כאשר המשפחה המועדפת היא "IPv6",
תחילה נעשה שימוש בכתובת ה-IPv6; אם הערך שצוין הוא "ללא", סדר הכתובות
מוחזר על ידי DNS משמש ללא שינוי.

שונה -4 ו -6, אפשרות זו אינה מונעת גישה לכל משפחת כתובות, היא בלבד
משנה את להזמין שבהם הגישה אל הכתובות. שימו לב גם שהסדר מחדש
מבוצע על ידי אפשרות זו יציב--- זה לא משפיע על סדר הכתובות של אותו הדבר
מִשׁפָּחָה. כלומר, הסדר היחסי של כל כתובות ה-IPv4 ושל כל כתובות ה-IPv6
נשאר שלם בכל המקרים.

- נסה שוב-סירב
שקול ש"החיבור נדחה" כשגיאה חולפת ונסה שוב. בדרך כלל Wget מוותר
בכתובת URL כאשר היא לא מצליחה להתחבר לאתר מכיוון שכשל בחיבור נלקח
כסימן לכך שהשרת אינו פועל כלל ושניסיונות חוזרים לא יעזרו. זֶה
האפשרות היא לשיקוף אתרים לא אמינים שהשרתים שלהם נוטים להיעלם בקיצור
תקופות זמן.

--user=המשתמש
--סיסמה=סיסמא
ציין את שם המשתמש המשתמש וסיסמא סיסמא עבור אחזור קבצי FTP ו-HTTP כאחד.
ניתן לעקוף פרמטרים אלה באמצעות ה- --ftp-user ו --ftp-סיסמה אפשרויות עבור
חיבורי FTP וה- --http-משתמש ו --http-סיסמה אפשרויות לחיבורי HTTP.

--שאל-סיסמה
בקש סיסמה עבור כל חיבור שנוצר. לא ניתן לציין מתי
--סיסמה נמצא בשימוש, כי הם סותרים זה את זה.

--לא-אירי
כבה את תמיכת URI בינלאומית (IRI). להשתמש --אירי להפעיל את זה. תמיכת IRI היא
מופעל כברירת מחדל.

אתה יכול להגדיר את מצב ברירת המחדל של תמיכת IRI באמצעות הפקודה "iri" ב .wgetrc. זה
ניתן לעקוף את ההגדרה משורת הפקודה.

--local-encoding=הַצפָּנָה
כפה על Wget להשתמש הַצפָּנָה כקידוד מערכת ברירת המחדל. זה משפיע על איך Wget
ממירה כתובות URL שצוינו כארגומנטים ממקום ל-UTF-8 לתמיכה ב-IRI.

Wget השתמש בפונקציה "nl_langinfo()" ולאחר מכן במשתנה הסביבה "CHARSET" כדי
לקבל את המקום. אם זה נכשל, נעשה שימוש ב-ASCII.

אתה יכול להגדיר את ברירת המחדל של הקידוד המקומי באמצעות הפקודה "local_encoding" ב .wgetrc.
ייתכן שהגדרה זו תידרוס משורת הפקודה.

--remote-encoding=הַצפָּנָה
כפה על Wget להשתמש הַצפָּנָה בתור קידוד ברירת המחדל של השרת המרוחק. זה משפיע על איך
Wget ממיר URIs שנמצאו בקבצים מקידוד מרחוק ל-UTF-8 במהלך רקורסיבי
לְהָבִיא. אפשרות זו שימושית רק עבור תמיכת IRI, עבור פרשנות של לא-
תווי ASCII.

עבור HTTP, ניתן למצוא קידוד מרחוק בכותרת HTTP "Content-Type" וב-HTML
מטא תג "Content-Type http-equiv".

אתה יכול להגדיר את קידוד ברירת המחדל באמצעות הפקודה "קידוד מרחוק" ב .wgetrc. זה
ניתן לעקוף את ההגדרה משורת הפקודה.

--בטל קישור
כפה על Wget לבטל את הקישור של הקובץ במקום לחסום את הקובץ הקיים. אפשרות זו שימושית
להורדה לספרייה עם קישורים קשיחים.

מַדרִיך אפשרויות
-nd
--ללא ספריות
אל תיצור היררכיה של ספריות בעת אחזור רקורסיבי. עם זה
האפשרות מופעלת, כל הקבצים יישמרו בספרייה הנוכחית, ללא
clobbering (אם שם מופיע יותר מפעם אחת, שמות הקבצים יקבלו סיומות .n).

-x
---force-directories
ההפך מ -nd--- ליצור היררכיה של ספריות, גם אם לא הייתה כזו
נוצרו אחרת. לְמָשָׁל wget -x http://fly.srk.fer.hr/robots.txt יחסוך את
הקובץ שהורד ל fly.srk.fer.hr/robots.txt.

-nH
--אין-מארחים-ספריות
השבת יצירת ספריות עם קידומת מארח. כברירת מחדל, הפעלת Wget עם -r
http://fly.srk.fer.hr/ תיצור מבנה של ספריות שמתחיל ב
fly.srk.fer.hr/. אפשרות זו משביתה התנהגות כזו.

--פרוטוקול-ספריות
השתמש בשם הפרוטוקול כרכיב ספרייה של שמות קבצים מקומיים. למשל, עם
אפשרות זו, wget -r http://המארח ישמור ל http /המארח/ ... ולא רק ל
המארח/ ....

--cut-dirs=מספר
להתעלם מספר רכיבי ספרייה. זה שימושי לקבלת שליטה עדינה
מעל הספרייה שבה תישמר אחזור רקורסיבי.

קח, למשל, את המדריך בכתובת ftp://ftp.xemacs.org/pub/xemacs/. אם תחזיר
זה עם -r, הוא יישמר באופן מקומי תחת ftp.xemacs.org/pub/xemacs/. בזמן ש -nH
אפשרות יכולה להסיר את ftp.xemacs.org/ חלק, אתה עדיין תקוע איתו פאב/xemacs. זֶה
הוא שם --cut-dirs בא שימושי; זה גורם ל-Wget לא "לראות" מספר ספרייה מרוחקת
רכיבים. להלן מספר דוגמאות כיצד --cut-dirs אפשרות עובדת.

אין אפשרויות -> ftp.xemacs.org/pub/xemacs/
-nH -> פאב/xemacs/
-nH --cut-dirs=1 -> xemacs/
-nH --cut-dirs=2 -> .

--cut-dirs=1 -> ftp.xemacs.org/xemacs/
...

אם אתה רק רוצה להיפטר ממבנה הספריות, אפשרות זו דומה ל-a
שילוב של -nd ו -P. עם זאת, בניגוד -nd, --cut-dirs לא מפסיד עם
ספריות משנה --- למשל, עם -nH --cut-dirs=1, בטא/ ספריית משנה תהיה
להציב ל xemacs/בטא, כפי שניתן היה לצפות.

-P קידומת
--directory-prefix=קידומת
הגדר את קידומת הספרייה ל קידומת. ה בספרייה קידומת הוא הספרייה שבה כל השאר
קבצים ותתי ספריות יישמרו, כלומר בראש עץ האחזור. ה
ברירת המחדל היא . (הספרייה הנוכחית).

HTTP אפשרויות
--default-page=שם
השתמש שם כשם הקובץ המוגדר כברירת מחדל כאשר הוא אינו ידוע (כלומר, עבור כתובות URL המסתיימות ב-a
סלאש), במקום index.html.

-E
--adjust-extension
אם קובץ מסוג יישום / xhtml + xml or טקסט / HTML הורד וכתובת האתר עושה זאת
לא מסתיים בביטוי הרגולרי \.[Hh][Tt][Mm][Ll]?, אפשרות זו תגרום לסיומת Html.
לצירוף לשם הקובץ המקומי. זה שימושי, למשל, כשאתה
שיקוף אתר מרוחק שמשתמש . Asp דפים, אבל אתה רוצה שדפי השיקוף יהיו
ניתן לצפייה בשרת Apache המניות שלך. שימוש טוב נוסף עבור זה הוא כשאתה
הורדת חומרים שנוצרו על ידי CGI. כתובת URL כמו http://site.com/article.cgi? 25 יצטרך
להישמר בתור article.cgi?25.html.

שים לב ששמות קבצים שהשתנו בדרך זו יורדו מחדש בכל פעם שתבצע שיקוף מחדש
אתר, כי Wget לא יכול לדעת שהמקומי X.html הקובץ מתאים לכתובת ה-URL המרוחקת X
(מכיוון שהוא עדיין לא יודע שכתובת האתר מייצרת פלט מסוג טקסט / HTML or
יישום / xhtml + xml.

החל מגרסה 1.12, Wget תבטיח גם שכל הקבצים שהורדו מסוג זה טקסט / css
סוף בסיומת . CSS, ושמה שונה לאפשרות מ --html-extension, לשפר
משקף את התנהגותו החדשה. שם האופציה הישן עדיין מקובל, אך אמור להיות כעת
נחשב מודח.

בשלב מסוים בעתיד, אפשרות זו עשויה להיות מורחב כך שתכלול סיומות עבור
סוגים אחרים של תוכן, כולל סוגי תוכן שאינם מנותחים על ידי Wget.

--http-user=המשתמש
--http-סיסמה=סיסמא
ציין את שם המשתמש המשתמש וסיסמא סיסמא בשרת HTTP. על פי
סוג האתגר, Wget יקודד אותם באמצעות ה"בסיסי" (לא מאובטח), ה
"digest", או ערכת האימות של Windows "NTLM".

דרך נוספת לציין שם משתמש וסיסמה היא בכתובת האתר עצמה. כל אחת מהשיטות
חושף את הסיסמה שלך לכל מי שטורח להפעיל "ps". כדי למנוע את הסיסמאות
מלהיראות, אחסן אותם בפנים .wgetrc or .netrc, והקפידו להגן על הקבצים הללו
ממשתמשים אחרים עם "chmod". אם הסיסמאות באמת חשובות, אל תעזוב
או שהם שוכבים בקבצים האלה --- ערוך את הקבצים ומחק אותם לאחר ש-Wget יש
התחיל את ההורדה.

--לא-http-לשמור בחיים
כבה את התכונה "לשמור בחיים" להורדות HTTP. בדרך כלל, Wget שואל את השרת
כדי לשמור על החיבור פתוח כך שכאשר אתה מוריד יותר ממסמך אחד מה-
אותו שרת, הם מועברים דרך אותו חיבור TCP. זה חוסך זמן ו
במקביל מפחית את העומס על השרת.

אפשרות זו שימושית כאשר, מסיבה כלשהי, קשרים מתמשכים (לשמור בחיים) אינם עושים זאת
לעבוד בשבילך, למשל בגלל באג בשרת או בגלל חוסר היכולת של צד השרת
סקריפטים כדי להתמודד עם החיבורים.

--ללא מטמון
השבת את המטמון בצד השרת. במקרה זה, Wget ישלח לשרת המרוחק an
הנחיה מתאימה (פרגמה: ללא מטמון) כדי לקבל את הקובץ מהשירות המרוחק,
במקום להחזיר את הגרסה השמורה. זה שימושי במיוחד לאחזור
וניקוי מסמכים לא מעודכנים בשרתי פרוקסי.

שמירה במטמון מותרת כברירת מחדל.

--אין עוגיות
השבת את השימוש בעוגיות. קובצי Cookie הם מנגנון לשמירה על צד השרת
מדינה. השרת שולח ללקוח קובץ Cookie באמצעות הכותרת "Set-Cookie", וה-
הלקוח מגיב עם אותה קובץ Cookie בבקשות נוספות. מכיוון שעוגיות מאפשרות את
בעלי שרתים לעקוב אחר המבקרים וכדי שאתרים יחליפו מידע זה,
יש הרואים בהם פגיעה בפרטיות. ברירת המחדל היא להשתמש בעוגיות; למרות זאת,
אחסון קובצי Cookie אינם פועלים כברירת מחדל.

--טעינת-עוגיות פילה
טען עוגיות מ פילה לפני אחזור ה-HTTP הראשון. פילה הוא קובץ טקסטואלי ב-
פורמט במקור בשימוש של Netscape's cookies.txt קובץ.

בדרך כלל תשתמש באפשרות זו בעת שיקוף אתרים שדורשים זאת
מחוברים כדי לגשת לחלק מהתוכן שלהם או כולו. תהליך הכניסה בדרך כלל עובד
על ידי שרת האינטרנט המנפיק קובץ Cookie של HTTP עם קבלת ואימות שלך
אישורים. לאחר מכן, הדפדפן שולח שוב את קובץ ה-cookie בעת גישה לאותו חלק של
אתר, וכך מוכיח את זהותך.

שיקוף אתר כזה מחייב את Wget לשלוח את אותם קובצי Cookie שהדפדפן שלך שולח כאשר
תקשורת עם האתר. זה מושג על ידי --טעינת-עוגיות---פשוט הצבע על Wget
למיקום של cookies.txt קובץ, והוא ישלח את אותם קובצי Cookie שלך
הדפדפן ישלח באותו מצב. דפדפנים שונים שומרים על קובץ Cookie טקסטואלי
קבצים במיקומים שונים:

"Netscape 4.x."
העוגיות בפנים ~/.netscape/cookies.txt.

"Mozilla ו-Netscape 6.x."
קובץ העוגיות של מוזילה נקרא גם בשם cookies.txt, ממוקם איפשהו מתחת
~/.mozilla, בספרייה של הפרופיל שלך. הדרך המלאה מסתיימת בדרך כלל
נראה קצת כמו ~/.mozilla/default/some-weird-string/cookies.txt.

"אינטרנט אקספלורר."
אתה יכול לייצר קובץ cookie שבו Wget יכול להשתמש באמצעות תפריט הקובץ, ייבוא ​​ו
ייצוא, ייצוא עוגיות. זה נבדק עם Internet Explorer 5; זה לא
מובטח לעבוד עם גרסאות קודמות.

"דפדפנים אחרים."
אם אתה משתמש בדפדפן אחר כדי ליצור את העוגיות שלך, --טעינת-עוגיות יצטרך
תעבוד רק אם אתה יכול לאתר או לייצר קובץ קובץ Cookie בפורמט Netscape
וגט מצפה.

אם אינך יכול להשתמש --טעינת-עוגיות, ייתכן שעדיין יש אלטרנטיבה. אם שלך
הדפדפן תומך ב"מנהל קובצי cookie", אתה יכול להשתמש בו כדי להציג את קובצי העוגיות שבהם נעשה שימוש
גישה לאתר שאתה משקף. רשום את השם והערך של העוגיה, וכן
הוראה ידנית ל-Wget לשלוח את העוגיות האלה, תוך עקיפת התמיכה ה"רשמית" בעוגיות:

wget --no-cookies --header "Cookie: = "

--שמור-עוגיות פילה
שמור עוגיות ב פילה לפני היציאה. זה לא ישמור עוגיות שפג תוקפן או
שאין להם זמן תפוגה (מה שנקרא "עוגיות הפעלה"), אבל גם רואים
--שמור קובצי Cookie.

--שמור קובצי Cookie
כאשר מצוין, גורם --שמור-עוגיות כדי לשמור גם קובצי Cookie של הפעלה. קובצי Cookie של הפעלה
בדרך כלל לא נשמרים כי הם אמורים להישמר בזיכרון ולשכוח מתי
אתה יוצא מהדפדפן. שמירתם שימושית באתרים הדורשים ממך להתחבר או להיכנס אליהם
בקר בדף הבית לפני שתוכל לגשת לדפים מסוימים. עם אפשרות זו, Wget מרובה
הריצות נחשבות להפעלת דפדפן בודדת מבחינת האתר.

מכיוון שפורמט קובץ ה-cookie אינו נושא בדרך כלל קובצי Cookie של הפעלה, Wget מסמן אותם
עם חותמת זמן תפוגה של 0. Wget's --טעינת-עוגיות מזהה את אלה כמושב
עוגיות, אבל זה עלול לבלבל דפדפנים אחרים. שים לב גם שעוגיות שנטענו כך יהיו
להתייחס כאל עוגיות הפעלה אחרות, מה שאומר שאם תרצה --שמור-עוגיות ל
לשמר אותם שוב, אתה חייב להשתמש --שמור קובצי Cookie שוב.

--התעלם מאורך
לרוע המזל, שרתי HTTP מסוימים (תוכניות CGI, ליתר דיוק) שולחים מזויפים
כותרות "Content-Length", מה שגורם ל-Wget להשתולל, מכיוון שהוא חושב שלא כל המסמך
הוחזר. אתה יכול לזהות את התסמונת הזו אם Wget מנסה לקבל שוב את אותו מסמך
שוב ושוב, בכל פעם בטענה שהחיבור (אחרת רגיל) נסגר
על אותו בייט ממש.

עם אפשרות זו, Wget יתעלם מהכותרת "תוכן-אורך" --- כאילו היא מעולם לא
היה קיים.

--header=קו כותרת
שילחו קו כותרת יחד עם שאר הכותרות בכל בקשת HTTP. ה
הכותרת המסופקת נשלחת כפי שהיא, כלומר עליה להכיל שם וערך מופרדים על ידי
נקודתיים, ואסור להכיל שורות חדשות.

תוכל להגדיר יותר מכותרת נוספת אחת על ידי ציון --כּוֹתֶרֶת יותר מפעם אחת.

wget --header='Accept-Charset: iso-8859-2' \
--header='Accept-Language: hr' \
http://fly.srk.fer.hr/

מפרט של מחרוזת ריקה כערך הכותרת ימחק את כל המשתמשים הקודמים-
כותרות מוגדרות.

החל מ-Wget 1.10, ניתן להשתמש באפשרות זו כדי לעקוף כותרות שנוצרו אחרת
אוטומטית. דוגמה זו מורה ל-Wget להתחבר ל-localhost, אך לציין
פו בר בכותרת "מארח":

wget --header="Host: foo.bar" http://localhost/

בגרסאות של Wget לפני 1.10 שימוש כזה ב --כּוֹתֶרֶת גרם לשליחת כפילויות
כותרות.

--max-redirect=מספר
מציין את המספר המרבי של הפניות מחדש לביצוע עבור משאב. ברירת המחדל היא
20, שזה בדרך כלל הרבה יותר מהנדרש. עם זאת, בהזדמנויות שבהן אתה
רוצה לאפשר יותר (או פחות), זו האפשרות להשתמש.

--proxy-user=המשתמש
--proxy-password=סיסמא
ציין את שם המשתמש המשתמש וסיסמא סיסמא לאימות בשרת פרוקסי.
Wget יקודד אותם באמצעות סכימת האימות ה"בסיסית".

שיקולי אבטחה דומים לאלו עם --http-סיסמה נוגעים גם כאן.

--מפנה=כתובת אתר
כלול `מפנה: כתובת אתר' כותרת בבקשת HTTP. שימושי לאחזור מסמכים עם
עיבוד בצד השרת בהנחה שהם תמיד מאוחזרים על ידי אינטרנט אינטראקטיבי
דפדפנים ויוצאים כראוי רק כאשר Referer מוגדר לאחד מהעמודים המצביעים
להם.

--שמור-כותרות
שמור את הכותרות שנשלחו על ידי שרת HTTP לקובץ, לפני התוכן בפועל,
עם שורה ריקה כמפריד.

-U מחרוזת סוכן
--user-agent=מחרוזת סוכן
זהה בתור מחרוזת סוכן לשרת HTTP.

פרוטוקול ה-HTTP מאפשר ללקוחות לזהות את עצמם באמצעות "User-Agent"
שדה כותרת. זה מאפשר להבחין בתוכנת WWW, בדרך כלל עבור סטטיסטיקה
למטרות או למעקב אחר הפרות פרוטוקול. Wget בדרך כלל מזהה כ
Wget/גרסה, גרסה הוא מספר הגרסה הנוכחי של Wget.

עם זאת, ידוע שחלק מהאתרים כופים את המדיניות של התאמת הפלט
לפי המידע שסופק על ידי "User-Agent". אמנם זה לא רעיון כל כך רע
בתיאוריה, זה נוצל לרעה על ידי שרתים המכחישים מידע מלקוחות אחרים
(באופן היסטורי) Netscape או, לעתים קרובות יותר, Microsoft Internet Explorer. אפשרות זו
מאפשר לך לשנות את שורת "User-Agent" שהונפקה על ידי Wget. השימוש באפשרות זו הוא
מיואש, אלא אם כן אתה באמת יודע מה אתה עושה.

ציון סוכן משתמש ריק עם --user-agent="" מורה ל-Wget לא לשלוח את
כותרת "User-Agent" בבקשות HTTP.

--פוסט-נתונים=מחרוזת
--פוסט-קובץ=פילה
השתמש ב-POST כשיטה עבור כל בקשות ה-HTTP ושלח את הנתונים שצוינו ב-
גוף הבקשה. --פוסט-נתונים שולח מחרוזת כנתונים, ואילו --פוסט-קובץ שולח את
תכנים של פילה. חוץ מזה, הם עובדים בדיוק באותו אופן. באופן מיוחד,
הֵם שניהם צפו לתוכן בצורת "key1=value1&key2=value2", עם קידוד אחוז
עבור תווים מיוחדים; ההבדל היחיד הוא שמצפים לתוכן שלו בתור א
פרמטר שורת הפקודה והשני מקבל את התוכן שלו מקובץ. באופן מיוחד,
--פוסט-קובץ is לֹא להעברת קבצים כקבצים מצורפים: אלה חייבים להופיע בתור
נתוני "key=value" (עם קידוד אחוז מתאים) בדיוק כמו כל דבר אחר. וגט
אינו תומך כרגע ב"נתונים מרובי חלקים/טופס" להעברת נתוני POST; רק
"application/x-www-form-urlencoded". רק אחד מ --פוסט-נתונים ו --פוסט-קובץ צריך להיות
נָקוּב.

שים לב ש-wget אינו מחייב שהתוכן יהיה מהטופס
"key1=value1&key2=value2", וגם זה לא בודק את זה. Wget פשוט ישדר
כל הנתונים שיסופקו לו. רוב השרתים מצפים שנתוני POST יהיו בפנים
הפורמט לעיל בעת עיבוד טפסי HTML.

בעת שליחת בקשת POST באמצעות ה --פוסט-קובץ אפשרות, Wget מתייחס לקובץ כאל
קובץ בינארי וישלח כל תו בבקשת POST ללא הפשטה
תווים נגררים בשורה חדשה או בצורת הזנה. כל תו שליטה אחר בטקסט יעשה זאת
גם להישלח כפי שהוא בבקשת POST.

אנא שים לב ש-Wget צריך לדעת את גודל נתוני ה-POST מראש.
לכן הטיעון ל-"--post-file" חייב להיות קובץ רגיל; ציון FIFO או
משהו כמו /dev/stdin לא יעבוד. לא ממש ברור איך לעקוף את זה
מגבלה הטבועה ב-HTTP/1.0. למרות ש-HTTP/1.1 מציג נתח להעביר את זה
לא דורש לדעת את אורך הבקשה מראש, לקוח לא יכול להשתמש ב-chunked
אלא אם כן הוא יודע שהוא מדבר לשרת HTTP/1.1. וזה לא יכול לדעת את זה עד שזה
מקבל תשובה, אשר בתורה דורשת את מילוי הבקשה -- א
בעיית תרנגולת וביצה.

הערה: החל מגרסה 1.15 אם Wget מנותב מחדש לאחר השלמת בקשת ה-POST,
ההתנהגות שלו תהיה תלויה בקוד התגובה שיחזיר השרת. במקרה של א
301 הועבר לצמיתות, 302 הועבר באופן זמני או 307 הפניה זמנית, Wget יהיה, ב
בהתאם ל-RFC2616, המשך לשלוח בקשת POST. במקרה ששרת רוצה את
לקוח כדי לשנות את שיטת הבקשה בעת הפנייה מחדש, הוא צריך לשלוח 303 See Other
קוד תגובה.

דוגמה זו מראה כיצד להיכנס לשרת באמצעות POST ולאחר מכן להמשיך להורדה
הדפים הרצויים, ככל הנראה נגישים רק למשתמשים מורשים:

# היכנס לשרת. זה יכול להיעשות רק פעם אחת.
wget --save-cookies cookies.txt \
--post-data 'user=foo&password=bar' \
http://server.com/auth.php

# עכשיו תפוס את העמוד או הדפים שאכפת לנו מהם.
wget --load-cookies cookies.txt \
-p http://server.com/interesting/article.php

אם השרת משתמש בעוגיות הפעלה כדי לעקוב אחר אימות המשתמש, האמור לעיל יעשה זאת
לא עובד כי --שמור-עוגיות לא ישמור אותם (וגם דפדפנים לא) ואת
cookies.txt הקובץ יהיה ריק. במקרה כזה השתמש --שמור קובצי Cookie יחד עם
--שמור-עוגיות כדי לאלץ שמירת קובצי Cookie של הפעלה.

--שיטה=שיטת HTTP
למטרת סקריפטים RESTful, Wget מאפשרת שליחת שיטות HTTP אחרות
ללא צורך להגדיר אותם במפורש באמצעות --header=Header-Line. Wget תשתמש
כל מחרוזת שתועבר אליו לאחר מכן --שיטה כשיטת HTTP לשרת.

--body-data=מחרוזת נתונים
--body-file=קובץ מידע
יש להגדיר כאשר יש לשלוח נתונים נוספים לשרת יחד עם השיטה
שצוין באמצעות --שיטה. --נתוני גוף שולח מחרוזת כנתונים, ואילו --גוף-קובץ שולח
התוכן של פילה. חוץ מזה, הם עובדים בדיוק באותו אופן.

נכון לעכשיו, --גוף-קובץ is לֹא להעברת קבצים כמכלול. Wget לא
תמיכה כרגע ב-"רב-חלק/טופס-נתונים" להעברת נתונים; רק
"application/x-www-form-urlencoded". בעתיד, זה עשוי להשתנות כך ש-wget
שולח את --גוף-קובץ כקובץ שלם במקום לשלוח את תוכנו ל-
שרת. אנא שים לב ש-Wget צריכה לדעת את התוכן של BODY Data מראש,
ומכאן הטיעון ל --גוף-קובץ צריך להיות קובץ רגיל. לִרְאוֹת --פוסט-קובץ עבור
הסבר מפורט יותר. רק אחד מ --נתוני גוף ו --גוף-קובץ צריך להיות
נָקוּב.

אם Wget יופנה מחדש לאחר השלמת הבקשה, Wget תשה את הזרם
שיטה ושלח בקשת GET עד להשלמת ההפניה מחדש. זה נכון לכל
קודי תגובה לניתוב מחדש למעט 307 Temporary Redirect המשמש באופן מפורש
ציין ששיטת הבקשה צריכה לֹא שינוי. חריג נוסף הוא כאשר ה
השיטה מוגדרת ל-"POST", ובמקרה זה כללי ההפניה מחדש שצוינו תחת
--פוסט-נתונים עוקבים אחריהם.

--תוכן-נטייה
אם זה מופעל, תמיכה ניסיונית (לא מתפקדת במלואה) עבור
כותרות "Content-Disposition" מופעלות. זה יכול כרגע לגרום לסיבוב נוסף-
מגיע לשרת לבקשת "HEAD", וידוע שהוא סובל מכמה באגים,
וזו הסיבה שזה לא מופעל כרגע כברירת מחדל.

אפשרות זו שימושית עבור כמה תוכניות CGI להורדת קבצים המשתמשות
כותרות "Content-Disposition" כדי לתאר מה צריך השם של קובץ שהורד
לִהיוֹת.

--תוכן-על-שגיאה
אם זה מוגדר ל-On, wget לא ידלג על התוכן כאשר השרת יגיב ב-a
קוד מצב http המציין שגיאה.

--שם שרת אמון
אם זה מוגדר לפועל, בהפניה מחדש הרכיב האחרון של כתובת האתר להפניה מחדש יהיה
משמש כשם הקובץ המקומי. כברירת מחדל הוא משמש ברכיב האחרון במקור
כתובת אתר.

--אישור-ללא אתגר
אם אפשרות זו תינתן, Wget ישלח מידע אימות HTTP בסיסי
(שם משתמש וסיסמה בטקסט רגיל) עבור כל הבקשות, בדיוק כמו Wget 1.10.2 ואילך
עשה כברירת מחדל.

השימוש באפשרות זו אינו מומלץ, והוא נועד רק לתמוך בכמה בודדים
שרתים לא ברורים, שלעולם אינם שולחים אתגרי אימות HTTP, אך מקבלים
מידע אימות לא רצוי, למשל, בנוסף לאימות מבוסס טפסים.

HTTPS (SSL/TLS) אפשרויות
כדי לתמוך בהורדות HTTP (HTTPS) מוצפנות, Wget חייב להיות הידור עם SSL חיצוני
סִפְרִיָה. ברירת המחדל הנוכחית היא GnuTLS. בנוסף, Wget תומך גם ב-HSTS (HTTP Strict
אבטחת תחבורה). אם Wget מורכב ללא תמיכה ב-SSL, אף אחת מהאפשרויות הללו לא
זמין.

--פרוטוקול מאובטח=פרוטוקול
בחר את הפרוטוקול המאובטח לשימוש. ערכים משפטיים הם המכונית, SSLv2, SSLv3, TLSv1,
TLSv1_1, TLSv1_2 ו PFS. אם המכונית משמש, ספריית SSL ניתנת לחופש
בחירת הפרוטוקול המתאים באופן אוטומטי, אשר מושגת על ידי שליחת TLSv1
בְּרָכָה. זוהי ברירת המחדל.

מפרט SSLv2, SSLv3, TLSv1, TLSv1_1 or TLSv1_2 מאלץ את השימוש המקביל
נוהל. זה שימושי כאשר מדברים עם יישומי שרת SSL ישנים ובעייתיים
שמקשים על ספריית SSL הבסיסית לבחור את הפרוטוקול הנכון
גִרְסָה. למרבה המזל, שרתים כאלה הם די נדירים.

מפרט PFS אוכפת את השימוש בצופן המכונה Perfect Forward Security
סוויטות. בקיצור, PFS מוסיף אבטחה על ידי יצירת מפתח חד פעמי עבור כל SSL
חיבור. יש לזה קצת יותר השפעה על המעבד על הלקוח והשרת. אנחנו משתמשים ידוע להיות
צפנים מאובטחים (למשל ללא MD4) ופרוטוקול TLS.

--https בלבד
במצב רקורסיבי, עוקבים אחר קישורי HTTPS בלבד.

- אין תעודת צ'ק
אל תבדוק את אישור השרת מול רשויות האישורים הזמינות.
כמו כן, אל תדרוש ששם המארח של כתובת האתר יתאים לשם הנפוץ שמוצג על ידי
תעודה.

החל מ-Wget 1.10, ברירת המחדל היא לאמת את אישור השרת מול
רשויות אישורים מוכרות, שבירת לחיצת היד של SSL והפסקת ה-
הורד אם האימות נכשל. למרות שזה מספק הורדות מאובטחות יותר, זה
שובר יכולת פעולה הדדית עם כמה אתרים שעבדו עם גרסאות Wget קודמות,
במיוחד אלה המשתמשים בתעודות בחתימה עצמית, שפג תוקפן או לא חוקיים בדרך אחרת.
אפשרות זו מאלצת מצב פעולה "לא מאובטח" שהופך את התעודה
שגיאות אימות לתוך אזהרות ומאפשר לך להמשיך.

אם אתה נתקל בשגיאות "אימות אישור" או כאלה שאומרות כי "שם נפוץ
לא תואם את שם המארח המבוקש", תוכל להשתמש באפשרות זו כדי לעקוף את האימות
והמשך בהורדה. רק להשתמש זֶה אוֹפְּצִיָה if אתה יש לו אַחֶרֶת משוכנע of
מה היא אתרים אוֹתֶנְטִיוּת, or if אתה בֶּאֱמֶת לא אשר על מה היא תוֹקֶף of שלה
תעודה. זה כמעט תמיד רעיון רע לא לבדוק את התעודות מתי
העברת נתונים סודיים או חשובים. עבור אישורים בחתימה עצמית/פנימית,
עליך להוריד את האישור ולאמת זאת במקום לכפות זאת
מצב לא מאובטח. אם אתה באמת בטוח שאתה לא רוצה אימות תעודה כלשהו,
אתה יכול לציין --check-certificate=quiet כדי לומר ל-wget לא להדפיס שום אזהרה לגביו
תעודות לא חוקיות, אם כי ברוב המקרים זה הדבר הלא נכון לעשות.

--תעודה=פילה
השתמש בתעודת הלקוח המאוחסנת ב פילה. זה נחוץ עבור שרתים שכן
מוגדר לדרוש אישורים מהלקוחות שמתחברים אליהם. בדרך כלל א
אין צורך באישור ומתג זה הוא אופציונלי.

--certificate-type=סוג
ציין את סוג אישור הלקוח. ערכים משפטיים הם PEM (בהנחה כברירת מחדל)
ו DER, ידוע גם כ ASN1.

--private-key=פילה
קרא את המפתח הפרטי מ פילה. זה מאפשר לך לספק את המפתח הפרטי בקובץ
נפרד מהתעודה.

--private-key-type=סוג
ציין את סוג המפתח הפרטי. הערכים המקובלים הם PEM (ברירת המחדל) ו- DER.

--ca-certificate=פילה
השתמש פילה בתור הקובץ עם חבילת רשויות האישורים ("CA") כדי לאמת את
עמיתים. על האישורים להיות בפורמט PEM.

ללא אפשרות זו Wget מחפש אישורי CA במיקומים שצוינו במערכת,
נבחר בזמן התקנת OpenSSL.

--ca-directory=בספרייה
מציין ספרייה המכילה אישורי CA בפורמט PEM. כל קובץ מכיל אחד
אישור CA, ושם הקובץ מבוסס על ערך hash הנגזר מה-
תְעוּדָה. זה מושג על ידי עיבוד ספריית אישורים עם
כלי השירות "c_rehash" מסופק עם OpenSSL. באמצעות --ca-directory יעיל יותר מ
--ca-certificat כאשר אישורים רבים מותקנים כי זה מאפשר ל-Wget לאחזר
תעודות לפי דרישה.

ללא אפשרות זו Wget מחפש אישורי CA במיקומים שצוינו במערכת,
נבחר בזמן התקנת OpenSSL.

--crl-file=פילה
מציין קובץ CRL ב פילה. זה נחוץ עבור תעודות שכבר היו
בוטל על ידי ה-CAs.

--קובץ אקראי=פילה
[OpenSSL ו-LibreSSL בלבד] השתמש פילה כמקור לנתונים אקראיים לזריעה של
מחולל מספרים פסאודו אקראיים במערכות ללא / dev / urandom.

במערכות כאלה ספריית SSL זקוקה למקור חיצוני של אקראיות כדי לאתחל.
אקראיות עשויה להיות מסופקת על ידי EGD (ראה --egd-file להלן) או לקרוא ממקור חיצוני
מקור שצוין על ידי המשתמש. אם אפשרות זו לא צוינה, Wget מחפש אקראי
נתונים ב-$RANDFILE או, אם זה לא מוגדר, ב $HOME/.rnd.

אם אתה מקבל את ההודעה "לא ניתן היה לראות את OpenSSL PRNG; השבתת SSL." שגיאה, אתה צריך
לספק נתונים אקראיים באמצעות כמה מהשיטות שתוארו לעיל.

--egd-file=פילה
[OpenSSL בלבד] השתמש פילה בתור שקע EGD. EGD מייצג אנטרופיה איסוף דמון,
תוכנית מרחב משתמש שאוספת נתונים ממקורות מערכת שונים בלתי צפויים ו
הופך אותו לזמין לתוכניות אחרות שעשויות להזדקק לו. תוכנות הצפנה, כגון
ספריית SSL, זקוקה למקורות של אקראיות שאינה חוזרת על עצמה כדי לחלץ את המספר האקראי
מחולל המשמש לייצור מפתחות חזקים מבחינה קריפטוגרפית.

OpenSSL מאפשר למשתמש לציין את מקור האנטרופיה שלו באמצעות "RAND_FILE"
משתנה הסביבה. אם משתנה זה אינו מוגדר, או אם הקובץ שצוין אינו מוגדר
לייצר מספיק אקראיות, OpenSSL יקרא נתונים אקראיים משקע ה-EGD שצוין
באמצעות אפשרות זו.

אם אפשרות זו לא צוינה (ולא נעשה שימוש בפקודת האתחול המקבילה), EGD
אף פעם לא נוצר קשר. אין צורך ב-EGD במערכות יוניקס מודרניות התומכות
/ dev / urandom.

--לא-הסטות
Wget תומך ב-HSTS (HTTP Strict Transport Security, RFC 6797) כברירת מחדל. להשתמש
--לא-הסטות לגרום ל-Wget לפעול כ-UA שאינו תואם HSTS. כתוצאה מכך, Wget יעשה זאת
להתעלם מכל הכותרות "קפדנית-תחבורה-אבטחה", ולא לאכוף כל קיים
מדיניות HSTS.

--hsts-file=פילה
כברירת מחדל, Wget מאחסנת את מסד הנתונים HSTS שלה ב ~/.wget-hsts. אתה יכול להשתמש --hsts-קובץ ל
לעקוף את זה. Wget תשתמש בקובץ שסופק כמסד הנתונים של HSTS. קובץ כזה חייב
תואם את הפורמט הנכון של מסד הנתונים של HSTS בשימוש על ידי Wget. אם Wget לא יכול לנתח את
הקובץ שסופק, ההתנהגות אינה מוגדרת.

מסד הנתונים HSTS של Wget הוא קובץ טקסט רגיל. כל שורה מכילה ערך HSTS (כלומר א
אתר שהוציא כותרת "קפדנית-תחבורה-אבטחה" ולכן יש
ציינו מדיניות HSTS קונקרטית שיש ליישם). שורות המתחילות במקף ("#") הן
התעלמה על ידי Wget. אנא שימו לב שלמרות היד הנוחה לקריאה אנושית זו-
פריצה למסד הנתונים של HSTS היא בדרך כלל לא רעיון טוב.

שורת כניסה HSTS מורכבת ממספר שדות המופרדים ברווח לבן אחד או יותר:

" SP [ ] SP SP SP "

אל האני המארח ו נמל שדות מציינים את שם המארח והיציאה שאליהם ה-HSTS הנתון
חלה מדיניות. ה נמל השדה עשוי להיות אפס, והוא יהיה, ברוב המקרים. זֶה
פירושו שמספר היציאה לא יילקח בחשבון בעת ​​ההחלטה אם כן
יש להחיל מדיניות HSTS על בקשה נתונה (רק שם המארח יהיה
העריך). מתי נמל שונה מאפס, גם שם המארח של היעד וגם היציאה יהיו
להעריך ומדיניות HSTS תיושם רק אם שתיהן תואמות. זֶה
התכונה נכללה למטרות בדיקה/פיתוח בלבד. חבילת הבדיקות של Wget
testenv/) יוצר מסדי נתונים HSTS עם יציאות מפורשות במטרה להבטיח
ההתנהגות הנכונה של Wget. החלת מדיניות HSTS על יציאות שאינן ברירת המחדל
מונע מ-RFC 6797 (ראה נספח ב' "הבדלים בין מדיניות HSTS לאותו-
מדיניות מקור"). לפיכך, אין להשתמש בפונקציונליות זו בייצור
סביבות ו נמל בדרך כלל יהיה אפס. שלושת השדות האחרונים עושים מה שהם
מצפה ל. השדה include_subdomains יכול להיות 1 או 0 וזה מסמן אם
תת-הדומיינים של תחום היעד צריכים להיות חלק ממדיניות ה-HSTS הנתונה גם כן.
אל האני נוצר ו גיל מקסימלי שדות מכילים את ערכי חותמת הזמן של מועד ערך כזה
נוצר (נראה לראשונה על ידי Wget) והערך המוגדר ב-HSTS 'max-age', המציין כיצד
זמן רב אם מדיניות ה-HSTS תישאר פעילה, נמדדת בשניות שחלפו מאז
חותמת זמן מאוחסנת ב נוצר. לאחר שהזמן הזה חלף, מדיניות ה-HSTS הזו לא תהיה
עוד יהיה תקף ובסופו של דבר יוסר ממסד הנתונים.

אם אתה מספק מסד נתונים HSTS משלך באמצעות --hsts-קובץ, שים לב ש-Wget עשוי להשתנות
הקובץ שסופק אם מתרחש שינוי כלשהו בין מדיניות ה-HSTS המבוקשת על ידי
שרתים מרוחקים ואלו שבקובץ. כאשר Wget קיים, הוא מעדכן למעשה את ה
מסד נתונים HSTS על ידי שכתוב קובץ מסד הנתונים עם הערכים החדשים.

אם הקובץ שסופק לא קיים, Wget תיצור אחד. קובץ זה יכיל את ה
ערכי HSTS חדשים. אם לא נוצרו ערכי HSTS (ללא "קפדנית-תחבורה-אבטחה"
כותרות נשלחו על ידי כל אחד מהשרתים) ואז לא ייווצר קובץ, אפילו לא
אחד ריק. התנהגות זו חלה על קובץ מסד הנתונים המוגדר כברירת מחדל (~/.wget-hsts) גם כן:
הוא לא ייווצר עד ששרת כלשהו יאכוף מדיניות HSTS.

זהירות לא לעקוף שינויים אפשריים שנעשו על ידי תהליכי Wget אחרים ב-
באותו זמן על מסד הנתונים של HSTS. לפני השלכת ערכי ה-HSTS המעודכנים לקובץ,
Wget יקרא אותו מחדש וימזג את השינויים.

לא מומלץ להשתמש במסד נתונים HSTS מותאם אישית ו/או לשנות מסד נתונים קיים. ל
מידע נוסף על איומי האבטחה הפוטנציאליים הנובעים מתרגול כזה, ראה
סעיף 14 "שיקולי אבטחה" של RFC 6797, במיוחד סעיף 14.9 "Creative
מניפולציה של חנות המדיניות של HSTS".

--warc-file=פילה
השתמש פילה בתור קובץ היעד WARC.

--warc-header=מחרוזת
השתמש מחרוזת לתוך כתיעוד warcinfo.

--warc-max-size=גודל
הגדר את הגודל המרבי של קבצי WARC ל גודל.

--warc-cdx
כתוב קבצי אינדקס CDX.

--warc-dedup=פילה
אין לאחסן רשומות הרשומות בקובץ CDX זה.

--ללא-דחיסה-warc
אל תדחס קבצי WARC עם GZIP.

--ללא-warc-digests
אין לחשב תקלות SHA1.

--no-warc-keep-log
אין לאחסן את קובץ היומן ברשומת WARC.

--warc-tempdir=dir
ציין את המיקום עבור קבצים זמניים שנוצרו על ידי כותב WARC.

fTP אפשרויות
--ftp-user=המשתמש
--ftp-password=סיסמא
ציין את שם המשתמש המשתמש וסיסמא סיסמא בשרת FTP. בלי זה, או
אפשרות ההפעלה המתאימה, ברירת המחדל של הסיסמה היא -wget@, משמש בדרך כלל עבור
FTP אנונימי.

דרך נוספת לציין שם משתמש וסיסמה היא בכתובת האתר עצמה. כל אחת מהשיטות
חושף את הסיסמה שלך לכל מי שטורח להפעיל "ps". כדי למנוע את הסיסמאות
מלהיראות, אחסן אותם בפנים .wgetrc or .netrc, והקפידו להגן על הקבצים הללו
ממשתמשים אחרים עם "chmod". אם הסיסמאות באמת חשובות, אל תעזוב
או שהם שוכבים בקבצים האלה --- ערוך את הקבצים ומחק אותם לאחר ש-Wget יש
התחיל את ההורדה.

--לא-הסרה-רישום
אל תסיר את הזמני .listing קבצים שנוצרו על ידי אחזור FTP. בדרך כלל,
קבצים אלה מכילים את רשימות הספריות הגולמיות שהתקבלו משרתי FTP. לֹא
הסרתם יכולה להיות שימושית למטרות ניפוי באגים, או כאשר אתה רוצה להיות מסוגל
בדוק בקלות את התוכן של ספריות שרתים מרוחקים (למשל כדי לוודא שא
המראה שאתה מפעיל הושלמה).

שים לב שלמרות ש-Wget כותב לשם קובץ ידוע עבור קובץ זה, זה לא א
חור אבטחה בתרחיש של משתמש עושה .listing קישור סמלי ל / etc / passwd
או משהו ומבקש "root" להפעיל את Wget בספרייה שלו. תלוי ב
בשימוש באפשרויות, או Wget יסרב לכתוב .listing, מה שהופך את
פעולת הגלובינג/רקורסיה/החתמת זמן נכשלה, או שהקישור הסמלי יימחק
והוחלף בממשי .listing הקובץ, או שהרישום ייכתב ל-a
.listing.number קובץ.

למרות שמצב זה אינו מהווה בעיה, "שורש" לעולם לא אמור להפעיל את Wget ב-a
ספריית משתמש לא מהימן. משתמש יכול לעשות משהו פשוט כמו קישור
index.html ל / etc / passwd ומבקשים "root" להפעיל את Wget איתו -N or -r אז הקובץ יהיה
להיות מוחלף.

--לא גלוב
כבה את גלוב ה-FTP. גלובינג מתייחס לשימוש בדמויות מיוחדות דמויות קליפה
(כתוביות בעברית), כמו *, ?, [ ו ] כדי לאחזר יותר מקובץ אחד מאותה ספרייה
בבת אחת, כמו:

wget ftp://gnjilux.srk.fer.hr/*.msg

כברירת מחדל, הגלובינג יופעל אם כתובת האתר מכילה תו גלוב. זֶה
ניתן להשתמש באפשרות כדי להפעיל או לכבות את הגלובינג לצמיתות.

ייתכן שיהיה עליך לצטט את כתובת האתר כדי להגן עליה מפני הרחבה על ידי המעטפת שלך.
Globbing גורם ל-Wget לחפש רישום ספריות, שהוא ספציפי למערכת. זה
למה זה עובד כרגע רק עם שרתי FTP של Unix (ואלה שמחקים Unix "ls"
תְפוּקָה).

--לא-פסיבי-ftp
השבת את השימוש ב- פסיבי מצב העברת FTP. FTP פסיבי מחייב את
חיבור לקוח לשרת כדי ליצור את חיבור הנתונים במקום השני
מסביב.

אם המכשיר מחובר ישירות לאינטרנט, FTP פסיבי ופעיל כאחד
צריך לעבוד באותה מידה. מאחורי רוב תצורות חומת האש ו-NAT יש ל-FTP פסיבי
סיכוי טוב יותר לעבוד. עם זאת, בכמה תצורות חומת אש נדירות, FTP פעיל
למעשה עובד כאשר FTP פסיבי לא. אם אתה חושד שזה המקרה, השתמש בזה
אפשרות, או הגדר "passive_ftp=off" בקובץ init שלך.

--לשמור-הרשאות
שמור על הרשאות קובץ מרחוק במקום הרשאות שנקבעו על ידי umask.

--retr-symlinks
כברירת מחדל, בעת אחזור ספריות FTP באופן רקורסיבי וקישור סמלי הוא
נתקלתם, עוברים על הקישור הסמלי והקבצים המצביעים אל מאוחזרים.
נכון לעכשיו, Wget לא עוברת קישורים סמליים לספריות כדי להוריד אותם
באופן רקורסיבי, אם כי תכונה זו עשויה להתווסף בעתיד.

מתי --retr-symlinks=לא צוין, הקובץ המקושר לא הורד. במקום זאת,
נוצר קישור סמלי תואם במערכת הקבצים המקומית. הקובץ המצביע יעשה זאת
לא ניתן לאחזר אלא אם כן אחזור רקורסיבי זה היה נתקל בו בנפרד
והורדתי את זה בכל מקרה. אפשרות זו מהווה סיכון אבטחה כאשר FTP זדוני
השרת עלול לגרום ל-Wget לכתוב לקבצים מחוץ לספריות המיועדות באמצעות a
קובץ .LISTING בעל מבנה מיוחד.

שים לב שכשאחזור קובץ (לא ספריה) מכיוון שהוא צוין ב-
שורת הפקודה, במקום בגלל שנעשה עליה חזרה, לאפשרות זו אין השפעה.
תמיד עוברים קישורים סמליים במקרה זה.

FTPS אפשרויות
--ftps-implicit
אפשרות זו אומרת ל-Wget להשתמש ב-FTPS באופן מרומז. FTPS מרומז מורכב מאתחול
SSL/TLS מתחילת חיבור הבקרה. אפשרות זו אינה שולחת
פקודת "AUTH TLS": היא מניחה שהשרת מדבר FTPS ומתחיל ישירות
חיבור SSL/TLS. אם הניסיון מצליח, ההפעלה נמשכת בדיוק כמו
FTPS רגיל ("PBSZ" ו-"PROT" נשלחות וכו'). FTPS מרומז אינו עוד א
דרישה ליישומי FTPS, ולכן שרתים רבים עשויים שלא לתמוך בה. אם
--ftps-implicit עבר ולא צוין מספר יציאה מפורש, יציאת ברירת המחדל עבור
ישמש FTPS מרומז, 990, במקום יציאת ברירת המחדל עבור ה"רגיל"
FTPS (מפורש) שזהה לזה של FTP, 21.

--no-ftps-resume-ssl
אל תחדש את הפעלת SSL/TLS בערוץ הנתונים. כאשר מתחילים נתונים
חיבור, Wget מנסה לחדש את הפעלת SSL/TLS שהחלה קודם לכן בפקד
חיבור. חידוש הפעלת SSL/TLS נמנע מביצוע לחיצת יד חדשה לגמרי על ידי
שימוש חוזר בפרמטרי SSL/TLS של הפעלה קודמת. בדרך כלל, שרתי FTPS רוצים
זה ככה, אז Wget עושה זאת כברירת מחדל. עם זאת, בנסיבות נדירות, אפשר
רוצה להתחיל הפעלת SSL/TLS חדשה לגמרי בכל חיבור נתונים. זה מה
--no-ftps-resume-ssl בשביל.

--ftps-clear-data-connection
כל חיבורי הנתונים יהיו בטקסט רגיל. רק חיבור הבקרה יהיה
תחת SSL/TLS. Wget ישלח פקודת "PROT C" כדי להשיג זאת, וזו חייבת להיות
אושר על ידי השרת.

--ftps-fallback-to-ftp
חזור ל-FTP אם FTPS אינו נתמך על ידי שרת היעד. מטעמי ביטחון,
אפשרות זו אינה מוגדרת כברירת מחדל. התנהגות ברירת המחדל היא יציאה עם an
שְׁגִיאָה. אם שרת לא עונה בהצלחה לפקודה הראשונית "AUTH TLS", או
במקרה של FTPS מרומז, אם ניסיון החיבור הראשוני של SSL/TLS נדחה,
זה נחשב ששרת כזה אינו תומך ב-FTPS.

רקורסיבי אחזור אפשרויות
-r
- רקורסיבי
הפעל אחזור רקורסיבי. ברירת המחדל של העומק המרבי הוא 5.

-l עומק
--level=עומק
ציין את רמת העומק המקסימלית של רקורסיה עומק.

--מחק-אחרי
אפשרות זו אומרת ל-Wget למחוק כל קובץ שהוא מוריד, לאחר לאחר שעשה זאת.
זה שימושי לאחזור מראש של דפים פופולריים דרך פרוקסי, למשל:

wget -r -nd --delete-after http://whatever.com/~popular/page/

אל האני -r האפשרות היא לאחזר רקורסיבית, ו -nd כדי לא ליצור ספריות.

שים לב כי --מחק-אחרי מוחק קבצים במחשב המקומי. זה לא מנפיק את
DELE פקודה לאתרי FTP מרוחקים, למשל. שימו לב גם שמתי --מחק-אחרי is
נָקוּב, --המר קישורים מתעלמים, אז .orig קבצים פשוט לא נוצרים ב-
המקום הראשון.

-k
--המר קישורים
לאחר השלמת ההורדה, המר את הקישורים במסמך כדי ליצור אותם
מתאים לצפייה מקומית. זה משפיע לא רק על ההיפר-קישורים הגלויים, אלא על כל אחד מהם
חלק מהמסמך שמקשר לתוכן חיצוני, כגון תמונות מוטבעות, מקשר אליו
גיליונות סגנונות, היפר-קישורים לתוכן שאינו HTML וכו'.

כל קישור ישתנה באחת משתי הדרכים:

· הקישורים לקבצים שהורדו על ידי Wget ישתנו להתייחס אליהם
הקובץ שהם מצביעים עליו כקישור יחסי.

דוגמה: אם הקובץ שהורד /foo/doc.html קישורים אל /bar/img.gif, אז
הורד, ואז הקישור נכנס doc.html ישונה כדי להצביע על ../bar/img.gif.
סוג זה של טרנספורמציה עובד בצורה מהימנה עבור שילובים שרירותיים של
ספריות.

· הקישורים לקבצים שלא הורדו על ידי Wget ישתנו ל
כלול את שם המארח והנתיב המוחלט של המיקום שאליו הם מצביעים.

דוגמה: אם הקובץ שהורד /foo/doc.html קישורים אל /bar/img.gif (או ל
../bar/img.gif), ואז הקישור פנימה doc.html ישונה כדי להצביע על
http://hostname/bar/img.gif.

בגלל זה, גלישה מקומית עובדת בצורה מהימנה: אם הורד קובץ מקושר, ה
קישור יפנה לשמו המקומי; אם זה לא הורד, הקישור יפנה אליו
כתובת האינטרנט המלאה שלו במקום להציג קישור שבור. העובדה שה
קישורים קודמים מומרים לקישורים יחסיים מבטיח שאתה יכול להעביר את ההורדה
היררכיה לספרייה אחרת.

שימו לב שרק בסוף ההורדה Wget יכול לדעת אילו קישורים היו
הורדת. בגלל זה, העבודה שנעשתה על ידי -k יבוצע בסופו של דבר
ההורדות.

--המר-קובץ בלבד
אפשרות זו ממירה רק את חלק שם הקובץ של כתובות ה-URL, ומשאירה את שאר כתובות ה-URL
ללא נגיעה. חלק שם הקובץ הזה מכונה לפעמים "שם הבסיס", למרות שאנו
הימנע מהמונח הזה כאן כדי לא לגרום לבלבול.

זה עובד טוב במיוחד בשילוב עם --adjust-extension, למרות שזה
צימוד לא נאכף. זה מוכיח שימושי כדי לאכלס מטמונים באינטרנט בקבצים
הורדה ממארחים שונים.

דוגמה: אם קישור כלשהו מצביע על //foo.com/bar.cgi?xyz עם --adjust-extension טענו
והיעד המקומי שלו נועד להיות ./foo.com/bar.cgi?xyz.css, ואז הקישור
יוסב ל //foo.com/bar.cgi?xyz.css. שימו לב שרק לחלק שם הקובץ יש
שונתה. שאר כתובת ה-URL לא נגעה, כולל נתיב הרשת
("//") אשר אחרת יעובד על ידי Wget ויומר לאפקטיבי
סכמה (כלומר "http://").

-K
--הומר גיבוי
בעת המרת קובץ, גבה את הגרסה המקורית באמצעות א .orig סִיוֹמֶת. משפיע על
התנהגות של -N.

-m
--מַרְאָה
הפעל אפשרויות המתאימות לשיקוף. אפשרות זו מפעילה רקורסיה וזמן-
הטבעה, מגדירה עומק רקורסיה אינסופי ושומרת רשימות ספריות FTP. זה
כרגע שווה ערך ל -r -N -l inf --לא-הסרה-רישום.

-p
דרישות עמוד
אפשרות זו גורמת ל-Wget להוריד את כל הקבצים הדרושים כדי כהלכה
להציג דף HTML נתון. זה כולל דברים כמו תמונות מוטבעות, צלילים ו
גיליונות סגנונות המוזכרים.

בדרך כלל, כאשר מורידים דף HTML בודד, כל המסמכים הדרושים שיכולים להיות
הדרושים כדי להציג אותו כראוי אינם מורידים. באמצעות -r יחד עם -l יכול לעזור,
אבל מכיוון ש-Wget בדרך כלל לא מבחין בין מסמכים חיצוניים למסמכים מוטבעים,
בדרך כלל נשארים עם "מסמכי עלה" שחסרים להם את הדרישות.

למשל, נניח מסמך 1.html מכיל " "הפניה לתג 1.gif ו
תג " " המצביע על מסמך חיצוני 2.html. אומר ש 2.html דומה אבל זה
התמונה שלו היא 2.gif וזה מקשר ל 3.html. נגיד שזה ממשיך עד כמה באופן שרירותי
מספר גבוה.

אם אחד מבצע את הפקודה:

wget -r -l 2 http:// /1.html

אז 1.html, 1.gif, 2.html, 2.gif, ו 3.html יורדו. כמו שאתה רואה,
3.html הוא ללא הדרישות שלו 3.gif כי Wget פשוט סופר את המספר של
דילוגים (עד 2) הרחק מ 1.html על מנת לקבוע היכן לעצור את הרקורסיה.
עם זאת, עם הפקודה הזו:

wget -r -l 2 -p http:// /1.html

כל הקבצים לעיל ו 3.htmlדרוש 3.gif יורדו. באופן דומה,

wget -r -l 1 -p http:// /1.html

יגרום 1.html, 1.gif, 2.html, ו 2.gif להורדה. אפשר לחשוב ש:

wget -r -l 0 -p http:// /1.html

יוריד רק 1.html ו 1.gif, אבל למרבה הצער זה לא המקרה, כי
-l 0 שווה -l inf--- כלומר רקורסיה אינסופית. להורדת HTML בודד
עמוד (או קומץ מהם, כולם מצוינים בשורת הפקודה או ב-a -i קלט כתובת אתר
קובץ) והדרישות שלו (או שלהם), פשוט עזבו -r ו -l:

wget -p http:// /1.html

שימו לב ש-Wget יתנהג כאילו -r צוין, אבל רק אותו עמוד בודד ו
הדרישות שלו יורדו. קישורים מאותו עמוד למסמכים חיצוניים יהיו
לא לעקוב. למעשה, להוריד עמוד בודד ואת כל הדרישות שלו (גם אם
הם קיימים באתרי אינטרנט נפרדים), וודא שהמגרש מוצג כהלכה באופן מקומי,
מחבר זה אוהב להשתמש בכמה אפשרויות בנוסף ל -p:

wget -E -H -k -K -p http:// /

כדי לסיים את הנושא הזה, כדאי לדעת שהרעיון של Wget לגבי מסמך חיצוני
קישור הוא כל כתובת אתר שצוינה בתג " ", " "תג, או " "תייג אחר
מאשר " ".

--הערות-מחמירות
הפעל ניתוח קפדני של הערות HTML. ברירת המחדל היא לסיים הערות ב-
המופע הראשון של ->.

על פי המפרט, הערות HTML מתבטאות כ-SGML הצהרות.
Declaration הוא סימון מיוחד שמתחיל ב <! ומסתיים ב >, כמו <!DOCTYPE
...>, שעשויים להכיל הערות בין זוג של -- תוחמים. הערות HTML הן
"הצהרות ריקות", הצהרות SGML ללא כל טקסט ללא הערה. לָכֵן,
היא הערה תקפה, וכך גם <!--אחד-- --שניים-->, אבל לא.

מצד שני, רוב כותבי ה-HTML לא תופסים הערות כמשהו אחר מלבד
טקסט מופרד עם <!-- ו ->, שזה לא ממש אותו הדבר. למשל, משהו
כמו פועל כהערה חוקית כל עוד מספר המקפים הוא a
כפולה של ארבע (!). אם לא, ההערה טכנית נמשכת עד להבא --, אשר
יכול להיות בקצה השני של המסמך. בגלל זה, דפדפנים פופולריים רבים
התעלם לחלוטין מהמפרט ויישם את מה שהמשתמשים למדו לצפות בו:
הערות שתוחמו עם <!-- ו ->.

עד גרסה 1.9, Wget פירשה הערות בקפדנות, מה שהוביל לקישורים חסרים
בדפי אינטרנט רבים שהוצגו בסדר בדפדפנים, אך פגעו בהם
המכיל הערות שאינן עומדות בדרישות. החל מגרסה 1.9, Wget הצטרפה ל
דרגות של לקוחות שמיישמות הערות "נאיביות", ומסיימות כל הערה ב-
המופע הראשון של ->.

אם, מסיבה כלשהי, אתה רוצה ניתוח קפדני של הערות, השתמש באפשרות זו כדי להפוך אותה
על.

רקורסיבי קבל/דחה אפשרויות
-A להתאמן --לְקַבֵּל להתאמן
-R דחה רשימה --לִדחוֹת דחה רשימה
ציין רשימות מופרדות בפסיקים של סיומות או תבניות של שמות קבצים שיש לקבל או לדחות.
שים לב שאם אחד מהתווים הכלליים, *, ?, [ or ], מופיעים באלמנט של
להתאמן or דחה רשימה, הוא יטופל כתבנית, ולא כסיומת. בזה
במקרה, עליך לכלול את התבנית במרכאות כדי למנוע מהקליפה שלך להתרחב
זה, כמו ב -A "*.mp3" or -A '*.mp3'.

--accept-regex urlregex
--reject-regex urlregex
ציין ביטוי רגולרי כדי לקבל או לדחות את כתובת האתר המלאה.

--סוג regex סוג ביטוי רגולרי
ציין את סוג הביטוי הרגולרי. סוגים אפשריים הם פוסיקס or PCRE. שימו לב כי ל
להיות מסוגל להשתמש PCRE סוג, יש להרכיב wget עם תמיכת libpcre.

-D רשימת דומיינים
--דומיינים=רשימת דומיינים
הגדר דומיינים שיש לעקוב אחריהם. רשימת דומיינים היא רשימה מופרדת בפסיקים של דומיינים. הערה
שזה כן לֹא להדליק -H.

--exclude-domains רשימת דומיינים
ציין את הדומיינים שהם לֹא לעקוב אחריו.

--עקוב-ftp
עקוב אחר קישורי FTP ממסמכי HTML. ללא אפשרות זו, Wget יתעלם מכל ה
קישורי FTP.

--עקוב-תגים=רשימה
ל-Wget יש טבלה פנימית של צמדי תגי HTML / תכונות שהיא מחשיבה מתי
מחפש מסמכים מקושרים במהלך שליפה רקורסיבית. אם משתמש רוצה רק א
קבוצת משנה של תגים אלה שיש לקחת בחשבון, עם זאת, יש לציין תגים כאלה
בפסיקים רשימה עם אפשרות זו.

--ignore-tags=רשימה
זה ההפך מה- --תגי מעקב אוֹפְּצִיָה. כדי לדלג על תגי HTML מסוימים כאשר
מחפשים באופן רקורסיבי מסמכים להורדה, ציין אותם בפסיקים רשימה.

בעבר, אפשרות זו הייתה ההימור הטוב ביותר להורדת עמוד בודד ושלו
דרישות, באמצעות שורת פקודה כמו:

wget --ignore-tags=a,area -H -k -K -r http:// /

עם זאת, המחבר של אפשרות זו נתקל בדף עם תגים כמו "
HREF="/">" והגיעו להבנה שציינת תגיות שיש להתעלם מהן אינה מספיקה.
אי אפשר פשוט להגיד ל-Wget להתעלם" ", כי אז גיליונות סגנונות לא יהיו
הורדת. כעת ההימור הטוב ביותר להורדת עמוד בודד והדרישות שלו הוא
מוקדש דרישות עמוד אוֹפְּצִיָה.

--התעלם ממקרה
התעלם מרישיות בעת התאמת קבצים וספריות. זה משפיע על ההתנהגות של -R,
אפשרויות -A, -I ו-X, כמו גם גלובינג מיושמות בעת הורדה מ-FTP
אתרים. לדוגמה, עם אפשרות זו, -A "*.טקסט" יתאים file1.txt, אלא גם
file2.TXT, file3.TxT, וכן הלאה. המרכאות בדוגמה נועדו למנוע את הקליפה
מהרחבת התבנית.

-H
--span-hosts
אפשר התפשטות בין מארחים בעת ביצוע אחזור רקורסיבי.

-L
--קרוב משפחה
עקוב אחר קישורים יחסיים בלבד. שימושי לאחזור דף בית ספציפי ללא כל
הסחות דעת, אפילו לא אלה מאותם מארחים.

-I רשימה
--include-directories=רשימה
ציין רשימה מופרדת בפסיקים של ספריות שברצונך לעקוב אחריהם בעת ההורדה.
אלמנטים של רשימה עשוי להכיל תווים כלליים.

-X רשימה
--exclude-directories=רשימה
ציין רשימה מופרדת בפסיקים של ספריות שברצונך לא לכלול בהורדה.
אלמנטים של רשימה עשוי להכיל תווים כלליים.

-נ.פ.
--ללא הורה
לעולם אל תעלה לספריית האב בעת אחזור רקורסיבי. זה
אפשרות שימושית, מכיוון שהיא מבטיחה שרק הקבצים להלן היררכיה מסוימת תהיה
להיות מוריד.

הסביבה


Wget תומך בפרוקסי עבור אחזורי HTTP ו-FTP כאחד. הדרך הסטנדרטית לציין פרוקסי
המיקום, ש-Wget מזהה, משתמש במשתני הסביבה הבאים:

http_proxy
https_proxy
אם מוגדר, ה http_proxy ו https_proxy המשתנים צריכים להכיל את כתובות ה-URL של
פרוקסי עבור חיבורי HTTP ו-HTTPS בהתאמה.

ftp_proxy
משתנה זה צריך להכיל את כתובת ה-Proxy עבור חיבורי FTP. זה די
נפוץ כי http_proxy ו ftp_proxy מוגדרים לאותה כתובת URL.

no_proxy
משתנה זה צריך להכיל רשימה מופרדת בפסיקים של הרחבות דומיינים ש-proxy צריך
לֹא לשמש עבור. לדוגמה, אם הערך של no_proxy is .mit.edu, פרוקסי לא יעשה זאת
לשמש לאחזור מסמכים מ-MIT.

יְצִיאָה סטָטוּס


Wget עשוי להחזיר אחד ממספר קודי שגיאה אם ​​הוא נתקל בבעיות.

0 לא התרחשו בעיות.

1 קוד שגיאה כללי.

2 שגיאת ניתוח --- לדוגמה, בעת ניתוח אפשרויות שורת הפקודה, ה .wgetrc or
.netrc...

3 שגיאת קלט/פלט של קובץ.

4 כשל ברשת.

5 כשל באימות SSL.

6 כשל באימות שם משתמש/סיסמה.

7 שגיאות פרוטוקול.

8 השרת הוציא תגובת שגיאה.

למעט 0 ו-1, קודי היציאה עם מספר נמוך יותר מקבלים עדיפות על פני
ממוספרים, כאשר נתקלים במספר סוגים של שגיאות.

בגרסאות של Wget לפני 1.12, סטטוס היציאה של Wget נטה להיות לא מועיל
לא עקבי. הורדות רקורסיביות יחזירו כמעט תמיד 0 (הצלחה), ללא קשר ל
כל בעיה שנתקלה בה ואחזורים לא רקורסיביים החזירו רק את הסטטוס המתאים
לניסיון ההורדה האחרון.

השתמש ב-wget באינטרנט באמצעות שירותי onworks.net


שרתים ותחנות עבודה בחינם

הורד אפליקציות Windows & Linux

פקודות לינוקס

Ad