انگلیسیفرانسویاسپانیایی

اجرای سرورها | Ubuntu > | Fedora > |


فاویکون OnWorks

linkchecker - آنلاین در ابر

لینک چکر را در ارائه دهنده هاست رایگان OnWorks از طریق Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا کنید.

این کنترل کننده پیوند فرمان است که می تواند در ارائه دهنده میزبانی رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


linkchecker - سرویس گیرنده خط فرمان برای بررسی اسناد HTML و وب سایت ها برای پیوندهای شکسته

خلاصه


بررسی کننده پیوند [گزینه های] [فایل یا آدرس اینترنتی] ...

شرح


ویژگی های LinkChecker

· بررسی بازگشتی و چند رشته ای،

خروجی در متن رنگی یا معمولی، HTML، SQL، CSV، XML یا نمودار نقشه سایت در
فرمت های مختلف،

· پشتیبانی از HTTP/1.1، HTTPS، FTP، mailto:، news:، nntp:، Telnet و فایل محلی
پیوندها،

· محدودیت بررسی پیوند با فیلترهای URL،

· پشتیبانی از پروکسی،

· مجوز نام کاربری/رمز عبور برای HTTP، FTP و Telnet،

· پشتیبانی از پروتکل حذف robots.txt،

· پشتیبانی از کوکی ها

· پشتیبانی از HTML5

· بررسی نحو HTML و CSS

· بررسی آنتی ویروس

یک خط فرمان، رابط کاربری گرافیکی و رابط وب

مثال ها


رایج ترین استفاده، دامنه داده شده را به صورت بازگشتی بررسی می کند:
بررسی کننده پیوند http://www.example.com/
مراقب باشید که این کل سایت را که می تواند هزاران URL داشته باشد بررسی می کند. استفاده کنید -r
گزینه ای برای محدود کردن عمق بازگشت.
URL ها را با آن بررسی نکنید /راز به نام آن همه پیوندهای دیگر طبق معمول بررسی می شوند:
بررسی کننده پیوند --ignore-url=/secret mysite.example.com
بررسی یک فایل HTML محلی در یونیکس:
بررسی کننده پیوند ../bla.html
بررسی یک فایل HTML محلی در ویندوز:
بررسی کننده پیوند c:\temp\test.html
می توانید از آن بگذرید http:// قسمت url اگر دامنه با آن شروع شود WWW.:
بررسی کننده پیوند www.example.com
می توانید از آن بگذرید ftp: // قسمت url اگر دامنه با آن شروع شود ftp:
بررسی کننده پیوند -r0 ftp.example.com
یک نمودار نقشه سایت ایجاد کنید و آن را با ابزار graphviz dot تبدیل کنید:
بررسی کننده پیوند -odot -v www.example.com | نقطه -Tps > sitemap.ps

OPTIONS


عمومی (General) گزینه های
-fنام فایل, --config=نام فایل
استفاده کنید نام فایل به عنوان فایل پیکربندی به عنوان پیش فرض LinkChecker استفاده می کند
~/.linkchecker/linkcheckerrc.

-h, --کمک
کمکم کنید! اطلاعات استفاده از این برنامه را چاپ کنید.

--stdin
لیست URL های جدا شده با فاصله سفید را برای بررسی از stdin بخوانید.

-tعدد, -- نخ ها =عدد
بیش از تعداد رشته های داده شده تولید نکنید. تعداد پیش فرض رشته ها است
100. برای غیرفعال کردن threading یک عدد غیر مثبت را مشخص کنید.

-V, - نسخه
نسخه را چاپ کنید و خارج شوید.

--list-plugins
پلاگین های موجود را چک کنید و از آن خارج شوید.

تولید گزینه های
-DSTRING, --debug=STRING
خروجی اشکال زدایی را برای لاگر داده شده چاپ کنید. لاگرهای موجود هستند cmdline,
بررسی, نهانگاه, گي, دی ان اس و تمام. مشخص کردن تمام نام مستعار برای مشخص کردن همه است
لاگرهای موجود این گزینه را می توان چندین بار برای اشکال زدایی با بیش از
یک چوب گیر برای نتایج دقیق، threading در طول اجرای اشکال‌زدایی غیرفعال می‌شود.

-FTYPE[/رمزگذاری][/نام فایل], --file-output=TYPE[/رمزگذاری][/نام فایل]
خروجی به یک فایل بررسی لینکTYPE, $HOME/.linkchecker/list سیاه برای صورت اشخاص بدحساب
خروجی یا نام فایل در صورت مشخص شدن در رمزگذاری کدگذاری خروجی را مشخص می کند
پیش فرض محلی شما است. رمزگذاری های معتبر در فهرست شده اند
http://docs.python.org/library/codecs.html#رمزگذاری های استاندارد.
La نام فایل و رمزگذاری بخشی از هیچ نوع خروجی نادیده گرفته می شود، در غیر این صورت
فایل از قبل وجود دارد، بازنویسی خواهد شد. می توانید این گزینه را بیشتر مشخص کنید
بیش از یک بار انواع خروجی فایل معتبر هستند متن, اچ تی ام ال, SQL, CSV, gml, نقطه, XML,
نقشه سایت, هیچ or صورت اشخاص بدحساب. پیش فرض خروجی فایل نیست. انواع مختلف خروجی
در زیر مستند شده است. توجه داشته باشید که با این گزینه می توانید تمام خروجی های کنسول را سرکوب کنید
-o هیچ.

--هیچ وضعیت
پیام های وضعیت چک را چاپ نکنید.

-- بدون هشدار
هشدارها را ثبت نکنید پیش‌فرض ثبت هشدارها است.

-oTYPE[/رمزگذاری], --خروجی=TYPE[/رمزگذاری]
نوع خروجی را به عنوان مشخص کنید متن, اچ تی ام ال, SQL, CSV, gml, نقطه, XML, نقشه سایت, هیچ or
صورت اشخاص بدحساب. نوع پیش فرض است متن. انواع مختلف خروجی در زیر مستند شده است.
La رمزگذاری کدگذاری خروجی را مشخص می کند، پیش فرض محلی شماست.
رمزگذاری های معتبر در فهرست شده اند http://docs.python.org/library/codecs.html#استاندارد-
رمزگذاری ها.

-q, --ساکت
عملیات آرام، نام مستعار برای -o هیچ. این فقط مفید است با -F.

-v, -- پرحرف
همه URL های بررسی شده را ثبت کنید. پیش فرض این است که فقط خطاها و هشدارها را ثبت کنید.

-WREGEX, --warning-regex=REGEX
یک عبارت معمولی را تعریف کنید که در صورت مطابقت با هر محتوایی هشداری را چاپ می کند
لینک بررسی شده این فقط برای صفحات معتبر اعمال می شود، بنابراین ما می توانیم محتوای آنها را دریافت کنیم.
از این برای بررسی صفحاتی که حاوی نوعی خطا هستند استفاده کنید، به عنوان مثال "This page
منتقل شده است" یا "خطای برنامه Oracle".
توجه داشته باشید که برای مثال می توان چندین مقدار را در عبارت منظم ترکیب کرد
"(این صفحه منتقل شده است|خطای برنامه Oracle)".
بخش را ببینید منظم اصطلاحات برای اطلاعات بیشتر.

بررسی گزینه های
--cookiefile=نام فایل
خواندن یک فایل با داده های اولیه کوکی. قالب داده های کوکی در زیر توضیح داده شده است.

--بررسی-خارجی
URL های خارجی را بررسی کنید.

--ignore-url=REGEX
URL های مطابق با عبارت منظم داده شده نادیده گرفته می شوند و بررسی نمی شوند.
این گزینه را می توان چندین بار داد.
بخش را ببینید منظم اصطلاحات برای اطلاعات بیشتر.

-NSTRING, --nntp-server=STRING
یک سرور NNTP برای آن مشخص کنید اخبار: پیوندها پیش فرض متغیر محیطی است
NNTP_SERVER. اگر میزبانی داده نشود، فقط نحو پیوند بررسی می شود.

--no-follow-url=REGEX
بررسی کنید اما به آدرس‌های اینترنتی منطبق با عبارت منظم داده شده مراجعه نکنید.
این گزینه را می توان چندین بار داد.
بخش را ببینید منظم اصطلاحات برای اطلاعات بیشتر.

-p, --کلمه عبور
رمز عبور را از کنسول بخوانید و از آن برای مجوز HTTP و FTP استفاده کنید. برای FTP
رمز عبور پیش فرض است ناشناس@. برای HTTP رمز عبور پیش فرض وجود ندارد. همچنین ببینید
-u.

-rعدد, --recursion-level=عدد
تمام پیوندها را تا عمق مشخص به صورت بازگشتی بررسی کنید. عمق منفی را فعال خواهد کرد
بازگشت بی نهایت عمق پیش فرض بی نهایت است.

--تایم اوت=عدد
مدت زمان تلاش برای اتصال را در چند ثانیه تنظیم کنید. تایم اوت پیش فرض 60 است
ثانیه صورت گرفت.

-uSTRING, --user=STRING
نام کاربری داده شده را برای مجوز HTTP و FTP امتحان کنید. برای FTP پیش فرض
نام کاربری است بی نام. برای HTTP هیچ نام کاربری پیش فرض وجود ندارد. همچنین ببینید -p.

--user-agent=STRING
برای مثال، رشته User-Agent را برای ارسال به سرور HTTP مشخص کنید
"Mozilla/4.0". پیش فرض "LinkChecker/XY" است که XY نسخه فعلی آن است
لینک چکر.

پیکربندی فایل ها


فایل های پیکربندی می توانند تمام گزینه های بالا را مشخص کنند. آنها همچنین می توانند برخی از گزینه ها را مشخص کنند که
نمی توان در خط فرمان تنظیم کرد. دیدن linkcheckerrc(5) برای اطلاعات بیشتر

OUTPUT انواع


توجه داشته باشید که به طور پیش فرض فقط خطاها و هشدارها ثبت می شوند. شما باید استفاده کنید -- پرحرف
گزینه ای برای دریافت لیست URL کامل، به خصوص هنگام خروجی فرمت نمودار نقشه سایت.

متن لاگر متن استاندارد، ورود به سیستم URL در کلمه کلیدی: مد استدلال.

اچ تی ام ال URL های ورود به سیستم در کلمه کلیدی: مد استدلال، قالب بندی شده به عنوان HTML. علاوه بر این دارای پیوندهایی است
به صفحات ارجاع داده شده URL های نامعتبر دارای پیوندهای بررسی نحوی HTML و CSS هستند
ضمیمه شد

CSV نتیجه بررسی را در قالب CSV با یک URL در هر خط ثبت کنید.

gml روابط والد-فرزند بین URL های پیوند شده را به عنوان نمودار نقشه سایت GML ثبت کنید.

نقطه روابط والد-فرزند بین URL های پیوند شده را به عنوان نمودار نقشه سایت DOT ثبت کنید.

gxml نتیجه بررسی را به عنوان نمودار نقشه سایت GraphXML ثبت کنید.

XML نتیجه بررسی را به عنوان XML قابل خواندن توسط ماشین ثبت کنید.

نقشه سایت
نتیجه بررسی را به عنوان یک نقشه سایت XML که پروتکل آن در مستند شده است، ثبت کنید
http://www.sitemaps.org/protocol.html.

SQL نتیجه بررسی را به عنوان اسکریپت SQL با دستورات INSERT ثبت کنید. یک نمونه اسکریپت برای ایجاد
جدول SQL اولیه به عنوان create.sql گنجانده شده است.

صورت اشخاص بدحساب
مناسب برای مشاغل کرون نتیجه بررسی را در یک فایل ثبت می کند ~/.linkchecker/list سیاه
که فقط شامل ورودی هایی با URL های نامعتبر و تعداد دفعاتی است که دارند
ناموفق.

هیچ گزارش هیچ چیز. مناسب برای اشکال زدایی یا بررسی کد خروج.

منظم اصطلاحات


LinkChecker عبارات منظم پایتون را می پذیرد. دیدن http://docs.python.org/
howto/regex.html برای معرفی

علاوه بر این، علامت تعجب پیشرو، عبارت منظم را نفی می کند.

کوکی ها فایل ها


یک فایل کوکی حاوی داده های استاندارد HTTP (RFC 2616) با موارد زیر است
نام ها:

میزبان (ضروری)
دامنه ای را تنظیم می کند که کوکی ها برای آن معتبر هستند.

راه (اختیاری)
مسیری را می دهد که کوکی ها برای آن ارزش دارند. مسیر پیش فرض است /.

مجموعه کوکی (ضروری)
نام/مقدار کوکی را تنظیم کنید. می توان بیش از یک بار داد.

چندین ورودی با یک خط خالی از هم جدا می شوند. مثال زیر دو کوکی ارسال می کند
به همه URL هایی که با شروع می شوند http://example.com/hello/ و یک به همه URL ها که با شروع می شود
https://example.org/:

میزبان: example.com
مسیر: / سلام
مجموعه کوکی: ID = "smee"
مجموعه کوکی: هرزنامه = "تخم مرغ"

میزبان: example.org
Set-cookie: baggage="elitist"; نظر "هولوگرام"

پروکسی پشتیبانی


برای استفاده از یک پروکسی در یونیکس یا ویندوز، $http_proxy، $https_proxy یا $ftp_proxy را تنظیم کنید.
متغیرهای محیطی به URL پروکسی. URL باید به شکل باشد
http://[کاربر:عبور@]میزبان[:بندر]. LinkChecker همچنین تنظیمات دستی پروکسی را شناسایی می کند
اینترنت اکسپلورر تحت سیستم های ویندوز و gconf یا KDE در سیستم های لینوکس. در مک استفاده کنید
پیکربندی اینترنت برای انتخاب یک پروکسی. همچنین می توانید یک لیست دامنه جدا شده با کاما را در آن تنظیم کنید
متغیرهای محیط $no_proxy برای نادیده گرفتن تنظیمات پروکسی برای این دامنه ها.
برای مثال تنظیم یک پروکسی HTTP در یونیکس به شکل زیر است:

صادرات http_proxy="http://proxy.example.com: 8080 "

احراز هویت پروکسی نیز پشتیبانی می شود:

صادرات http_proxy="http://user1:mypass@proxy.example.org: 8081 "

تنظیم یک پروکسی در خط فرمان ویندوز:

تنظیم http_proxy=http://proxy.example.com: 8080

انجام چک


همه URL ها باید یک آزمایش نحوی مقدماتی را پشت سر بگذارند. اشتباهات جزئی نقل قول الف را صادر خواهد کرد
هشدار، سایر مسائل نحوی نامعتبر خطا هستند. پس از بررسی نحوی،
URL برای بررسی اتصال در صف است. همه انواع بررسی اتصال در زیر توضیح داده شده است.

پیوندهای HTTP (HTTP:, HTTPS:)
پس از اتصال به سرور HTTP داده شده، مسیر یا کوئری داده شده درخواست می شود. همه
تغییر مسیرها دنبال می شوند، و اگر کاربر/رمز عبور داده شود، به عنوان استفاده می شود
مجوز در صورت لزوم همه کدهای وضعیت نهایی HTTP به غیر از 2xx هستند
خطاها محتوای صفحه HTML برای بازگشت بررسی می شود.

فایل های محلی (فایل:)
یک فایل معمولی و قابل خواندن که می تواند باز شود معتبر است. دایرکتوری قابل خواندن نیز هست
معتبر. همه فایل‌های دیگر، برای مثال فایل‌های دستگاه، فایل‌های غیرقابل خواندن یا موجود نیستند
خطا هستند. HTML یا سایر محتویات فایل قابل تجزیه برای بازگشت بررسی می شوند.

لینک های ایمیل (لازمه: mailto)
یک mailto: پیوند در نهایت به لیستی از آدرس های ایمیل حل می شود. اگر یک آدرس
شکست می خورد، کل لیست شکست خواهد خورد. برای هر آدرس ایمیل موارد زیر را بررسی می کنیم
چیزها:
1) نحو آدرس، هر دو قسمت قبل و بعد را بررسی کنید
علامت.
2) رکوردهای MX DNS را جستجو کنید. اگر هیچ رکورد MX پیدا نکردیم،
یک خطا چاپ کنید
3) بررسی کنید که آیا یکی از میزبان های ایمیل اتصال SMTP را می پذیرد یا خیر.
ابتدا هاست های دارای اولویت بالاتر را بررسی کنید.
اگر هیچ میزبانی SMTP را نپذیرد، یک هشدار چاپ می کنیم.
4) سعی کنید آدرس را با دستور VRFY تأیید کنید. اگر گرفتیم
یک پاسخ، آدرس تایید شده را به عنوان یک اطلاعات چاپ کنید.

لینک های FTP (ftp:)

برای پیوندهای FTP انجام می دهیم:

1) به هاست مشخص شده متصل شوید
2) سعی کنید با کاربر و رمز عبور وارد شوید. پیشفرض
کاربر "ناشناس" است، رمز عبور پیش فرض "ناشناس@" است.
3) سعی کنید به دایرکتوری داده شده تغییر دهید
4) فایل را با دستور NLST لیست کنید

پیوندهای تل نت (``تلنت:``)

سعی می کنیم وصل شویم و اگر کاربر/رمز عبور داده شد، وارد شوید
سرور تلنت داده شده

پیوندهای NNTP («اخبار:»، «اخبار:»، «nntp»»

ما سعی می کنیم به سرور NNTP داده شده متصل شویم. اگر یک گروه خبری یا
مقاله مشخص شده است، سعی کنید آن را از سرور درخواست کنید.

پیوندهای پشتیبانی نشده (``javascript:`` و غیره)

پیوند پشتیبانی نشده فقط یک هشدار چاپ می کند. بدون بررسی بیشتر
ساخته خواهد شد.

لیست کامل پیوندهای شناخته شده، اما پشتیبانی نشده را می توان یافت
در linkcheck/checker/unknownurl.py منبع فایل.
برجسته ترین آنها باید پیوندهای جاوا اسکریپت باشد.

پلاگین


دو نوع پلاگین وجود دارد: پلاگین اتصال و محتوا. پلاگین های اتصال اجرا می شوند
پس از اتصال موفقیت آمیز به میزبان URL. پلاگین های محتوا در صورت نوع URL اجرا می شوند
دارای محتوا (mailto: URL ها برای مثال محتوایی ندارند) و اگر چک ممنوع نیست
(یعنی توسط HTTP robots.txt). دیدن بررسی کننده پیوند --list-plugins برای لیستی از افزونه ها و آنها
مستندات. همه پلاگین ها از طریق فعال می شوند linkcheckerrc(5) فایل پیکربندی.

بازگشت


قبل از نزول بازگشتی به یک URL، باید چندین شرط را برآورده کند. آن ها هستند
به این ترتیب بررسی شد:

1. URL باید معتبر باشد.

2. URL باید قابل تجزیه باشد. این در حال حاضر شامل فایل های HTML است،
اپرا فایل ها و فهرست ها را نشانک می کند. اگر یک نوع فایل نمی تواند
تعیین شود (مثلاً یک فایل HTML مشترک ندارد
پسوند، و محتوا شبیه HTML نیست)، فرض می شود
غیر قابل تجزیه بودن

3. محتوای URL باید قابل بازیابی باشد. معمولاً اینطور است
به جز برای مثال mailto: یا انواع URL ناشناخته.

4. از حداکثر سطح بازگشت نباید تجاوز شود. پیکربندی شده است
با -سطح بازگشتی گزینه و به صورت پیش فرض نامحدود است.

5. نباید با لیست URL نادیده گرفته شده مطابقت داشته باشد. این با کنترل می شود
la --نادیده گرفتن-url گزینه.

6. پروتکل حذف ربات ها باید به پیوندهای موجود در URL اجازه دهد
به صورت بازگشتی دنبال می شود. این با جستجوی a بررسی می شود
دستورالعمل "nofollow" در داده های هدر HTML.

توجه داشته باشید که فهرست بازگشتی همه فایل‌های موجود در آن دایرکتوری را می‌خواند، نه فقط یک زیر مجموعه
پسندیدن index.htm*.

NOTES


آدرس‌های اینترنتی در خط فرمان که با شروع می‌شوند ftp مانند رفتار می شوند ftp://ftp.، URL هایی که با شروع می شوند
WWW. مانند رفتار می شوند http://www.. شما همچنین می توانید فایل های محلی را به عنوان آرگومان ارائه دهید.

اگر سیستم خود را طوری پیکربندی کرده اید که به طور خودکار به اینترنت متصل شود
(به عنوان مثال با شماره گیری)، هنگامی که پیوندهایی را که به هاست محلی شما اشاره نمی کنند، بررسی می کند.
استفاده از --نادیده گرفتن-url گزینه ای برای جلوگیری از این

پیوندهای جاوا اسکریپت پشتیبانی نمی شوند.

اگر پلتفرم شما از threading پشتیبانی نمی کند، LinkChecker آن را به طور خودکار غیرفعال می کند.

می توانید چندین جفت کاربر/رمز عبور را در یک فایل پیکربندی ارائه کنید.

هنگام بررسی اخبار: پیوندها نیازی نیست که میزبان NNTP داده شده با میزبان آن یکی باشد
کاربر در حال مرور صفحات شما

محیط زیست


NNTP_SERVER - سرور NNTP پیش فرض را مشخص می کند
http_proxy - سرور پروکسی HTTP پیش فرض را مشخص می کند
ftp_proxy - سرور پروکسی FTP پیش فرض را مشخص می کند
no_proxy - فهرست دامنه‌هایی که با کاما از هم جدا شده‌اند تا از طریق سرور پروکسی با آنها تماس نگیرید
LC_MESSAGES, زبان, زبان - زبان خروجی را مشخص کنید

برگشت ارزش


مقدار بازگشتی 2 است وقتی

· یک خطای برنامه رخ داده است.

مقدار بازگشتی 1 است وقتی

· پیوندهای نامعتبر پیدا شد یا

· هشدارهای پیوند پیدا شد و هشدارها فعال شدند

در غیر این صورت مقدار بازگشتی صفر است.

محدودیت ها


LinkChecker برای بررسی هر URL در صف حافظه مصرف می کند. با هزاران URL در صف
مقدار حافظه مصرفی می تواند بسیار زیاد شود. این ممکن است برنامه را کند کند یا
حتی کل سیستم

با استفاده از خدمات onworks.net از Linkchecker آنلاین استفاده کنید


Ad


Ad