webcheck - عبر الإنترنت في السحابة

هذا هو الأمر Webcheck الذي يمكن تشغيله في مزود الاستضافة المجانية OnWorks باستخدام إحدى محطات العمل المجانية المتعددة عبر الإنترنت مثل Ubuntu Online أو Fedora Online أو محاكي Windows عبر الإنترنت أو محاكي MAC OS عبر الإنترنت

برنامج:

اسم


webcheck - مدقق ارتباط الموقع

موجز


webcheck [OPTION] ... URL

الوصف


webcheck سيتحقق من المستند على عنوان URL المحدد للحصول على روابط لمستندات أخرى ، اتبع
هذه الروابط بشكل متكرر وإنشاء تقرير HTML.

-أنا، - داخلي =نمط
ضع علامة على عناوين URL المطابقة لملف نمط (تعبير عادي من نوع perl) كارتباط داخلي.
يمكن استخدامها عدة مرات. لاحظ أن النمط يطابق عنوان URL الكامل.
ستُعتبر عناوين URL المطابقة لـ PATTERN داخلية ، حتى لو كانت تتطابق مع أحد
- الأنماط الخارجية.

-x ، - خارجي =نمط
ضع علامة على عناوين URL المطابقة لملف نمط (تعبير عادي من نوع perl) كارتباط خارجي.
يمكن استخدامها عدة مرات. لاحظ أن النمط يطابق عنوان URL الكامل.

-ص ، - يانك =نمط
لا تتحقق من عناوين URL المطابقة لملف نمط (تعبير عادي من نوع perl). مثل x
علامة ، على الرغم من أن هذا الخيار سيؤدي إلى عدم فحص Webcheck للرابط المطابق للتعبير العادي
في حين أن -x سيتحقق من الرابط وليس عناصره الفرعية. يمكن استخدامها عدة مرات.
لاحظ أن النمط يطابق عنوان URL الكامل.

-ب، - أساسي فقط
ضع في اعتبارك أن أي عنوان URL لا يبدأ بعنوان URL الأساسي يكون خارجيًا. على سبيل المثال ، إذا
أنت تركض
webcheck -b http://www.example.com/foo
then http://www.example.com/foo/bar سيتم اعتباره داخليًا حيث
http://www.example.com/ سيتم اعتباره خارجيًا. افتراضيا جميع الصفحات على
سيتم اعتبار الموقع داخليًا.

-a، - تجنب الخارجية
تجنب الروابط الخارجية. عادة إذا كان webcheck يفحص صفحة HTML ويجد
ارتباط يشير إلى مستند خارجي ، فسيقوم بالتحقق لمعرفة ما إذا كان ذلك خارجيًا
المستند موجود. هذه العلامة تعطل هذا الإجراء.

--أجور الروبوتات
لا تقم باسترداد ملفات robots.txt وتحليلها. بشكل افتراضي ، ملفات robots.txt هي
استرجاعها وتكريمها. إذا كنت متأكدًا من رغبتك في تجاهل وتجاوز ملف
يمكن استخدام قرار مشرف الموقع هذا الخيار.
لمزيد من المعلومات حول التعامل مع ملف robots.txt ، راجع قسم الملاحظات أدناه.

-q ، --هادئ، --صامتة
لا تطبع التقدم حيث أن webcheck يجتاز موقعًا.

-د، --Debug
اطبع معلومات تصحيح الأخطاء أثناء الزحف إلى الموقع. هذا الخيار مفيد بشكل أساسي
للمطورين.

-o ، - الخرج =الدليل
دليل الإخراج. تستخدم لتحديد الدليل حيث سيقوم webcheck بتفريغ ملفات
التقارير. الافتراضي هو الدليل الحالي أو كما هو محدد بواسطة config.py. اذا هذا
الدليل غير موجود سيتم إنشاؤه لك (إن أمكن).

-c ، --استمر
حاول الاستمرار من تشغيل سابق. عند استخدام هذا الخيار سيبحث Webcheck عن
webcheck.dat في دليل الإخراج. تتم قراءة هذا الملف لاستعادة الحالة
من التشغيل السابق. هذا يسمح لفحص الويب بمتابعة ملف
يجري. عند استخدام هذا الخيار ، فإن الخيارات - الداخلية و - الخارجية و - المصرفية
يتم تجاهلها بالإضافة إلى أي وسيطات URL. - الأساسي فقط و - تجنب - الخارجي
يجب أن تكون الخيارات مماثلة للتشغيل السابق.
لاحظ أن هذا الخيار تجريبي وقد تتغير دلالاته بمرور الوقت
الإصدارات (خاصة فيما يتعلق بالخيارات الأخرى). لاحظ أيضًا أن ملف
لا يمكن ضمان توافق الملفات بين الإصدارات.

-F، --فرض
الكتابة فوق الملفات دون أن تطلب. هذا الخيار مطلوب لتشغيل webcheck بدون-
بشكل تفاعلي.

-r ، --إعادة التوجيه =N
عمق إعادة التوجيه. عدد عمليات إعادة التوجيه التي يجب أن يتبعها فحص الويب عند اتباع ملف
وصلة. 0 يعني اتباع جميع عمليات إعادة التوجيه.

-u ، --userpass =URL
حدد عنوان URL به معلومات اسم المستخدم وكلمة المرور لاستخدامها في الأساسيات
المصادقة عند زيارة الموقع.
على سبيل المثال http://test:Secret@example.com/
قد يتم تحديد هذا الخيار عدة مرات.

-w ، - انتظر =SECONDS
SECONDS بين عمليات استرجاع المستندات. عادةً ما يقوم Webcheck بمعالجة عنوان url و
انتقل على الفور إلى التالي. لكن في بعض الأنظمة المحملة قد يكون من المرغوب فيه
لجعل فحص الويب وقفة بين الطلبات. يمكن تعيين هذا الخيار على أي غير-
عدد السلبي.

-الخامس، --الإصدار
عرض نسخة البرنامج.

-ح ، --مساعدة
إظهار ملخص قصير للخيارات.

URL الطبقات


تنقسم عناوين URL إلى فئتين:

داخلي يتم استرداد عناوين URL ويتم فحص العنصر المسترد بحثًا عن بناء الجملة. أيضا ،
يتم البحث عن العنصر المسترد عن ارتباطات لعناصر أخرى (من أي فئة) وهذه الروابط هي
يتبع.

خارجي يتم استرداد عناوين URL فقط لاختبار ما إذا كانت صالحة ولجمع بعض الأساسيات
المعلومات منهم (العنوان ، الحجم ، نوع المحتوى ، إلخ). العناصر المسترجعة ليست كذلك
تفقد روابط لعناصر أخرى.

بصرف النظر عن فئتها ، يمكن أيضًا اعتبار عناوين URL انتزع (كما هو محدد مع --yank
أو - تجنب الخيارات الخارجية). يمكن أن تكون عناوين URL داخلية أو خارجية ولن تكون كذلك
استرجاعها أو فحصها على الإطلاق. يتم أيضًا اعتبار عناوين URL الخاصة بالأنظمة غير المدعومة مخالفة.

أمثلة


تحقق من الموقع www.example.com ولكن ضع في اعتبارك أي مسار يحتوي على "/ webcheck" بداخله
خارجي.
webcheck http://www.example.com/ -x / webcheck

الملاحظات


عند التحقق من عناوين URL الداخلية ، يحترم webcheck ملف robots.txt ، معرّفًا نفسه كـ
فحص وكيل المستخدم على الويب. لن يتم التحقق من الروابط غير المسموح بها على الإطلاق كما لو كان الخيار -y كذلك
المحدد لعنوان URL هذا. للسماح لفحص الويب بالزحف إلى أجزاء من موقع مثل برامج الروبوت الأخرى
غير مسموح به ، استخدم شيئًا مثل:
وكيل المستخدم: *
عدم السماح: / foo

وكيل المستخدم: webcheck
السماح: / foo

البيئة


_الوكيل
عنوان URL للوكيل لـ .

التبليغ بق


يتم إرسال تقارير الأخطاء إلى القائمة البريديةwebcheck-users@lists.arthurdejong.org>.
يمكن العثور على مزيد من المعلومات حول الإبلاغ عن الأخطاء على الصفحة الرئيسية للتحقق من الويب:
http://arthurdejong.org/webcheck/

حقوق الطبع والنشر


حقوق النشر © 1998، 1999 Albert Hopkins (marduk)
حقوق النشر © 2002 Mike W. Meyer
حقوق النشر © 2005 ، 2006 ، 2007 ، 2008 ، 2009 ، 2010 آرثر دي يونج
webcheck هو برنامج مجاني ؛ انظر المصدر لنسخ الشروط. لا يوجد ضمان.
ولا حتى لقابلية التسويق أو الملاءمة لغرض معين.
لا تندرج الملفات التي تم إنتاجها كمخرجات من البرنامج تلقائيًا ضمن نطاق
حقوق الطبع والنشر للبرنامج ، ما لم ينص صراحة على خلاف ذلك.

استخدم webcheck عبر الإنترنت باستخدام خدمات onworks.net



أحدث برامج Linux و Windows عبر الإنترنت