İngilizceFransızcaİspanyolca

Sunucuları çalıştırın | Ubuntu > | Fedora > |


OnWorks favicon'u

linkchecker - Bulutta Çevrimiçi

Ubuntu Online, Fedora Online, Windows çevrimiçi emülatörü veya MAC OS çevrimiçi emülatörü üzerinden OnWorks ücretsiz barındırma sağlayıcısında linkchecker çalıştırın

Bu, Ubuntu Online, Fedora Online, Windows çevrimiçi öykünücüsü veya MAC OS çevrimiçi öykünücüsü gibi birden fazla ücretsiz çevrimiçi iş istasyonumuzdan birini kullanarak OnWorks ücretsiz barındırma sağlayıcısında çalıştırılabilen komut bağlantı denetleyicisidir.

PROGRAM:

ADI


linkchecker - HTML belgelerini ve web sitelerini bozuk bağlantılar için kontrol etmek için komut satırı istemcisi

SİNOPSİS


bağlantı denetleyicisi [seçenekleri] [dosya veya url] ...

TANIM


LinkChecker özellikleri

· özyinelemeli ve çok iş parçacıklı kontrol,

· renkli veya normal metin, HTML, SQL, CSV, XML veya site haritası grafiğinde çıktı
farklı formatlar,

· HTTP/1.1, HTTPS, FTP, mailto:, news:, nntp:, Telnet ve yerel dosya desteği
linkler,

· URL filtreleri ile bağlantı kontrolünün kısıtlanması,

· proxy desteği,

· HTTP, FTP ve Telnet için kullanıcı adı/şifre yetkilendirmesi,

· robots.txt dışlama protokolü desteği,

· Çerezler için destek

· HTML5 desteği

· HTML ve CSS sözdizimi kontrolü

· Antivirüs kontrolü

· bir komut satırı, GUI ve web arayüzü

ÖRNEKLER


En yaygın kullanım, verilen etki alanını yinelemeli olarak kontrol eder:
bağlantı denetleyicisi http://www.example.com/
Bunun, binlerce URL'ye sahip olabilecek tüm siteyi kontrol ettiğini unutmayın. Kullan -r
özyineleme derinliğini kısıtlama seçeneği.
URL'leri şununla kontrol etmeyin: /gizli onun adına. Diğer tüm bağlantılar her zamanki gibi kontrol edilir:
bağlantı denetleyicisi --ignore-url=/gizli sitem.example.com
Unix'te yerel bir HTML dosyasını kontrol etme:
bağlantı denetleyicisi ../bla.html
Windows'ta yerel bir HTML dosyasını kontrol etme:
bağlantı denetleyicisi c:\temp\test.html
Sen atlayabilirsiniz http:// etki alanı ile başlıyorsa url bölümü www.:
bağlantı denetleyicisi www.example.com
Sen atlayabilirsiniz ftp: // etki alanı ile başlıyorsa url bölümü ftp.:
bağlantı denetleyicisi -r0 ftp.example.com
Bir site haritası grafiği oluşturun ve bunu graphviz nokta yardımcı programıyla dönüştürün:
bağlantı denetleyicisi -dot -v www.example.com | nokta -Tps > site haritası.ps

SEÇENEKLER


genel seçenekleri
-fDOSYA ADI, --config=DOSYA ADI
kullanım DOSYA ADI yapılandırma dosyası olarak. Varsayılan olarak LinkChecker kullanır
~/.linkchecker/linkcheckerrc.

-h, --yardım et
Bana yardım et! Bu program için kullanım bilgilerini yazdırın.

--stdin
Stdin'den kontrol etmek için boşlukla ayrılmış URL'lerin listesini okuyun.

-tNUMBER, --konular=NUMBER
Verilen iş parçacığı sayısından fazlasını oluşturmayın. Varsayılan iş parçacığı sayısı
100. Diş açmayı devre dışı bırakmak için pozitif olmayan bir sayı belirtin.

-V, --versiyon
Sürümü yazdırın ve çıkın.

--list-eklentiler
Mevcut kontrol eklentilerini yazdırın ve çıkın.

Çıktı seçenekleri
-DSTRING, --hata ayıklama=STRING
Verilen günlükçü için hata ayıklama çıktısını yazdırın. Mevcut günlükçüler komut_satırı,
denetleme, önbellek, gui, dns ve herşey. belirtme herşey hepsini belirtmek için bir takma addır
mevcut kaydediciler Seçenek, birden çok kez hata ayıklamak için verilebilir.
bir kaydedici. Doğru sonuçlar için, hata ayıklama çalıştırmaları sırasında iş parçacığı oluşturma devre dışı bırakılır.

-FTİP[/KODLAMA][/DOSYA ADI], --dosya-çıktı=TİP[/KODLAMA][/DOSYA ADI]
Bir dosyaya çıktı bağlantı denetleyicisi çıkışı.TİP, $HOME/.linkchecker/kara liste için kara listeye almak
çıktı veya DOSYA ADI belirtilmişse. NS KODLAMA çıktı kodlamasını belirtir,
varsayılan, yerel ayarınızınkidir. Geçerli kodlamalar şurada listelenmiştir:
http://docs.python.org/library/codecs.html#standart kodlamalar.
The DOSYA ADI ve KODLAMA parçaları Yok çıktı türü yoksayılır, aksi takdirde
dosya zaten var, üzerine yazılacak. Bu seçeneği daha fazla belirtebilirsiniz
bir kereden. Geçerli dosya çıktı türleri şunlardır: metin, html, sql, csv, gml, nokta, xml,
Site haritası, Yok or kara listeye almak. Varsayılan dosya çıktısı olmamasıdır. Çeşitli çıktı türleri
aşağıda belgelenmiştir. seçeneğiyle tüm konsol çıktılarını bastırabileceğinizi unutmayın.
-o Yok.

--durum yok
Kontrol durumu mesajlarını yazdırmayın.

--no-uyarılar
Uyarıları günlüğe kaydetme. Varsayılan, uyarıları günlüğe kaydetmektir.

-oTİP[/KODLAMA], --çıktı=TİP[/KODLAMA]
Çıktı türünü şu şekilde belirtin: metin, html, sql, csv, gml, nokta, xml, Site haritası, Yok or
kara listeye almak. Varsayılan tür metin. Çeşitli çıktı türleri aşağıda belgelenmiştir.
The KODLAMA çıktı kodlamasını belirtir, varsayılan yerel ayarınızdır.
Geçerli kodlamalar şurada listelenmiştir: http://docs.python.org/library/codecs.html#standart-
kodlamalar.

-q, --sessizlik
Sessiz çalışma, takma ad -o Yok. Bu sadece ile yararlıdır -F.

-v, --ayrıntılı
Kontrol edilen tüm URL'leri günlüğe kaydedin. Varsayılan, yalnızca hataları ve uyarıları günlüğe kaydetmektir.

-WREGEX, --uyarı-normal ifade=REGEX
Herhangi bir içerikle eşleşirse bir uyarı yazdıran normal bir ifade tanımlayın.
kontrol edilen bağlantı. Bu, yalnızca geçerli sayfalar için geçerlidir, böylece içeriklerini alabiliriz.
Bir tür hata içeren sayfaları kontrol etmek için bunu kullanın, örneğin "Bu sayfa
taşındı" veya "Oracle Uygulama hatası".
Normal ifadede birden çok değerin birleştirilebileceğini unutmayın, örneğin
"(Bu sayfa taşındı|Oracle Uygulama hatası)".
Bkz. Bölüm DÜZENLİ İFADE Daha fazla bilgi için.

Denetleme seçenekleri
--cookiefile=DOSYA ADI
İlk tanımlama bilgisi verilerini içeren bir dosyayı okuyun. Çerez veri formatı aşağıda açıklanmıştır.

--check-harici
Harici URL'leri kontrol edin.

--ignore-url=REGEX
Verilen normal ifadeyle eşleşen URL'ler yok sayılır ve kontrol edilmez.
Bu seçenek birden çok kez verilebilir.
Bkz. Bölüm DÜZENLİ İFADE Daha fazla bilgi için.

-NSTRING, --nntp-sunucu=STRING
için bir NNTP sunucusu belirtin haber: bağlantılar. Varsayılan, ortam değişkenidir
NNTP_SERVER. Herhangi bir ana bilgisayar verilmezse, yalnızca bağlantının sözdizimi kontrol edilir.

--no-follow-url=REGEX
Kontrol edin, ancak verilen normal ifadeyle eşleşen URL'leri tekrarlamayın.
Bu seçenek birden çok kez verilebilir.
Bkz. Bölüm DÜZENLİ İFADE Daha fazla bilgi için.

-p, --parola
Konsoldan bir parola okuyun ve onu HTTP ve FTP yetkilendirmesi için kullanın. FTP için
varsayılan şifre anonim@. HTTP için varsayılan parola yoktur. Ayrıca bakınız
-u.

-rNUMBER, --recursion-level=NUMBER
Verilen derinliğe kadar tüm bağlantıları özyinelemeli olarak kontrol edin. Negatif bir derinlik etkinleştirir
sonsuz yineleme Varsayılan derinlik sonsuzdur.

--zaman aşımı=NUMBER
Bağlantı denemeleri için zaman aşımını saniye cinsinden ayarlayın. Varsayılan zaman aşımı 60
saniye.

-uSTRING, --kullanıcı=STRING
HTTP ve FTP yetkilendirmesi için verilen kullanıcı adını deneyin. FTP için varsayılan
kullanıcı adı anonim. HTTP için varsayılan kullanıcı adı yoktur. Ayrıca bakınız -p.

--user-agent=STRING
HTTP sunucusuna gönderilecek Kullanıcı-Aracı dizesini belirtin, örneğin
"Mozilla/4.0". Varsayılan "LinkChecker/XY"dir; burada XY, şu anki sürümüdür.
Bağlantı Denetleyicisi.

YAPILANDIRMA DOSYALAR


Yapılandırma dosyaları yukarıdaki tüm seçenekleri belirtebilir. Ayrıca bazı seçenekleri belirtebilirler.
komut satırında ayarlanamaz. Görmek bağlantı denetleyicisi(5) daha fazla bilgi için.

ÇIKTI TÜRLERİ


Varsayılan olarak yalnızca hataların ve uyarıların günlüğe kaydedildiğini unutmayın. kullanmalısın --ayrıntılı
özellikle bir site haritası grafik formatının çıktısını alırken tam URL listesini alma seçeneği.

metin Standart metin kaydedici, URL'leri anahtar kelimeye kaydetme: argüman modası.

html URL'leri anahtar kelimede günlüğe kaydedin: argüman modası, HTML olarak biçimlendirilmiş. Ek olarak bağlantılar var
başvurulan sayfalara. Geçersiz URL'lerde HTML ve CSS sözdizimi kontrol bağlantıları var
eklenmiş.

csv Kontrol sonucunu her satıra bir URL ile CSV formatında günlüğe kaydedin.

gml Bağlantılı URL'ler arasındaki üst-alt ilişkileri GML site haritası grafiği olarak günlüğe kaydedin.

nokta Bağlantılı URL'ler arasındaki ebeveyn-çocuk ilişkilerini DOT site haritası grafiği olarak günlüğe kaydedin.

gxml Kontrol sonucunu bir GraphXML site haritası grafiği olarak günlüğe kaydedin.

xml Kontrol sonucunu makine tarafından okunabilir XML olarak günlüğe kaydedin.

Site haritası
Kontrol sonucunu, protokolü şu adreste belgelenen bir XML site haritası olarak günlüğe kaydet
http://www.sitemaps.org/protocol.html.

sql INSERT komutları ile SQL komut dosyası olarak kontrol sonucunu günlüğe kaydedin. Oluşturulacak örnek bir komut dosyası
ilk SQL tablosu create.sql olarak dahil edilmiştir.

kara listeye almak
cron işleri için uygundur. Kontrol sonucunu bir dosyaya kaydeder ~/.linkchecker/kara liste
yalnızca geçersiz URL'lere ve sahip oldukları sayıya sahip girişleri içeren
başarısız oldu.

Yok Hiçbir şey günlüğe kaydetmez. Hata ayıklamak veya çıkış kodunu kontrol etmek için uygundur.

DÜZENLİ İFADE


LinkChecker, Python düzenli ifadelerini kabul eder. Görmek http://docs.python.org/
nasıl yapılır/regex.html bir tanıtım için.

Bir ek, baştaki bir ünlem işaretinin normal ifadeyi reddetmesidir.

COOKIE DOSYALAR


Bir tanımlama bilgisi dosyası, aşağıdaki olası seçeneklerle standart HTTP üstbilgisi (RFC 2616) verilerini içerir:
isimleri:

Ev Sahibi (gereklidir)
Çerezlerin geçerli olduğu etki alanını ayarlar.

Yol (opsiyonel)
Çerezlerin değeri olan yolu verir; varsayılan yol /.

çerez (gereklidir)
Çerez adını/değerini ayarlayın. Birden fazla verilebilir.

Birden çok giriş boş bir satırla ayrılır. Aşağıdaki örnek iki çerez gönderecek
ile başlayan tüm URL'lere http://example.com/hello/ ve bir ile başlayan tüm URL'lere
https://example.org/:

Ev sahibi: örnek.com
Yol: /merhaba
Set-çerez: ID="smee"
Set-çerez: spam="yumurta"

Ev sahibi: örnek.org
Set-cookie: baggage="elitist"; yorum = "hologram"

PROXY DESTEK


Unix veya Windows'ta bir proxy kullanmak için $http_proxy, $https_proxy veya $ftp_proxy'yi ayarlayın
ortam değişkenlerini proxy URL'sine. URL şu şekilde olmalıdır
http://[kullanıcı:geçmek@]ev sahibi[:Liman]. LinkChecker ayrıca aşağıdakilerin manuel proxy ayarlarını da algılar:
Windows sistemlerinde Internet Explorer ve Linux sistemlerinde gconf veya KDE. Mac kullanımında
Bir proxy seçmek için İnternet Yapılandırması'nı seçin. Ayrıca virgülle ayrılmış bir alan listesi de ayarlayabilirsiniz.
$no_proxy ortam değişkenleri, bu etki alanları için herhangi bir proxy ayarını yok sayar.
Örneğin, Unix'te bir HTTP proxy ayarlamak şuna benzer:

http_proxy'yi dışa aktar="http://proxy.example.com:8080"

Proxy kimlik doğrulaması da desteklenir:

http_proxy'yi dışa aktar="http://user1:mypass@proxy.example.org:8081"

Windows komut isteminde bir proxy ayarlama:

http_proxy'yi ayarla=http://proxy.example.com: 8080

GERÇEKLEŞTİRİLDİ ÇEKLER


Tüm URL'lerin bir ön sözdizimi testinden geçmesi gerekir. Küçük alıntı hataları bir
uyarı, diğer tüm geçersiz sözdizimi sorunları hatalardır. Sözdizimi denetimi geçtikten sonra,
URL, bağlantı kontrolü için kuyruğa alındı. Tüm bağlantı kontrol türleri aşağıda açıklanmıştır.

HTTP bağlantıları (http:, https:)
Verilen HTTP sunucusuna bağlandıktan sonra verilen yol veya sorgu istenir. Tüm
yönlendirmeler takip edilir ve kullanıcı/şifre verilirse
gerektiğinde yetkilendirme. 2xx dışındaki tüm nihai HTTP durum kodları
hatalar. HTML sayfa içeriği özyineleme için kontrol edilir.

Yerel dosyalar (Dosya:)
Açılabilen normal, okunabilir bir dosya geçerlidir. Okunabilir bir dizin de
geçerli. Diğer tüm dosyalar, örneğin cihaz dosyaları, okunamayan veya var olmayan dosyalar
hatalardır. HTML veya diğer ayrıştırılabilir dosya içerikleri özyineleme için kontrol edilir.

Posta bağlantıları (mailto:)
Bir mailto: bağlantısı sonunda bir e-posta adresleri listesine çözümlenir. eğer bir adres
başarısız olursa, tüm liste başarısız olur. Her posta adresi için aşağıdakileri kontrol ederiz
şeyler:
1) Adres sözdizimini kontrol edin, hem önceki hem de sonraki kısım
işaret.
2) MX DNS kayıtlarına bakın. MX kaydı bulamazsak,
bir hata yazdırın.
3) Posta ana bilgisayarlarından birinin SMTP bağlantısını kabul edip etmediğini kontrol edin.
Önce daha yüksek önceliğe sahip ana bilgisayarları kontrol edin.
Hiçbir ana bilgisayar SMTP'yi kabul etmezse bir uyarı yazdırırız.
4) VRFY komutu ile adresi doğrulamayı deneyiniz. eğer sahipsek
bir cevap, doğrulanmış adresi bilgi olarak yazdırın.

FTP bağlantıları (ftp:)

FTP bağlantıları için şunları yapıyoruz:

1) belirtilen ana bilgisayara bağlanın
2) Verilen kullanıcı ve şifre ile giriş yapmayı deneyiniz. Varsayılan
kullanıcı ``anonim``, varsayılan şifre ``anonim@``.
3) verilen dizine geçmeyi deneyin
4) NLST komutuyla dosyayı listeleyin

Telnet bağlantıları (``telnet:``)

Bağlanmaya çalışıyoruz ve kullanıcı/şifre verilmişse giriş yap
verilen telnet sunucusu.

NNTP bağlantıları (``news:``, ``snews:``, ``nntp``)

Verilen NNTP sunucusuna bağlanmaya çalışıyoruz. Bir haber grubu veya
makale belirtildi, sunucudan istemeyi deneyin.

Desteklenmeyen bağlantılar (``javascript:`` vb.)

Desteklenmeyen bir bağlantı yalnızca bir uyarı yazdırır. Başka kontrol yok
yapılmış olacak.

Tanınan ancak desteklenmeyen bağlantıların tam listesi bulunabilir
içinde linkcheck/checker/unknownurl.py Kaynak dosyası.
Bunlardan en belirgin olanı JavaScript bağlantıları olmalıdır.

PLUGINS


İki eklenti türü vardır: bağlantı ve içerik eklentileri. Bağlantı eklentileri çalıştırılır
URL ana bilgisayarına başarılı bir bağlantıdan sonra. URL türü ise içerik eklentileri çalıştırılır
içeriği var (örneğin mailto: URL'lerin içeriği yok) ve kontrol yasak değilse
(yani, HTTP robots.txt tarafından). Görmek bağlantı denetleyicisi --list-eklentiler eklentiler ve bunların listesi için
belgeler. Tüm eklentiler aracılığıyla etkinleştirilir bağlantı denetleyicisi(5) yapılandırma dosyası.

özyineleme


Bir URL'ye özyinelemeli olarak inmeden önce, birkaç koşulu yerine getirmesi gerekir. Onlar
bu sırayla kontrol edildi:

1. Bir URL geçerli olmalıdır.

2. Bir URL ayrıştırılabilir olmalıdır. Bu, şu anda HTML dosyalarını içerir,
Opera, dosyaları ve dizinleri yer imlerine ekler. Bir dosya türü yapamıyorsa
belirlenebilir (örneğin, ortak bir HTML dosyasına sahip değildir)
uzantı ve içerik HTML'ye benzemiyor), varsayılır
ayrıştırılamaz olmak.

3. URL içeriği alınabilir olmalıdır. Bu genellikle böyledir
örneğin mailto: veya bilinmeyen URL türleri hariç.

4. Maksimum yineleme düzeyi aşılmamalıdır. yapılandırıldı
ile --özyineleme düzeyi seçenek ve varsayılan olarak sınırsızdır.

5. Yok sayılan URL listesiyle eşleşmemelidir. Bu ile kontrol edilir
the --ignore-url seçeneği.

6. Robotları Dışlama Protokolü, URL'deki bağlantıların
yinelemeli olarak takip edildi. Bu, bir arama yapılarak kontrol edilir.
HTML başlık verilerinde "nofollow" yönergesi.

Dizin özyinelemesinin yalnızca bir alt kümeyi değil, o dizindeki tüm dosyaları okuduğunu unutmayın.
sevmek index.htm*.

NOTLAR


ile başlayan komut satırındaki URL'ler ftp. gibi davranılır ftp://ftp., ile başlayan URL'ler
www. gibi davranılır http://www.. Ayrıca yerel dosyaları argüman olarak verebilirsiniz.

Sisteminizi otomatik olarak internete bağlanacak şekilde yapılandırdıysanız
(örn. çevirmeli), yerel sunucunuza işaret etmeyen bağlantıları kontrol ederken bağlanacaktır.
Kullan --ignore-url Bunu önlemek için seçenek.

Javascript bağlantıları desteklenmez.

Platformunuz iş parçacığı oluşturmayı desteklemiyorsa, LinkChecker bunu otomatik olarak devre dışı bırakır.

Bir yapılandırma dosyasında birden fazla kullanıcı/parola çifti sağlayabilirsiniz.

Kontrol ederken haber: verilen NNTP ana bilgisayarının ana bilgisayarıyla aynı olması gerekmez
sayfalarınıza göz atan kullanıcı.

ÇEVRE


NNTP_SERVER - varsayılan NNTP sunucusunu belirtir
http_proxy - varsayılan HTTP proxy sunucusunu belirtir
ftp_proxy - varsayılan FTP proxy sunucusunu belirtir
vekalet yok - bir proxy sunucusu üzerinden bağlantı kurulmaması gereken virgülle ayrılmış alan listesi
LC_MESSAGES, DİL, DİL - çıkış dilini belirtin

DÖNÜŞ DEĞER


dönüş değeri 2 olduğunda

· bir program hatası oluştu.

dönüş değeri 1 olduğunda

· geçersiz bağlantılar bulundu veya

· bağlantı uyarıları bulundu ve uyarılar etkinleştirildi

Aksi takdirde dönüş değeri sıfırdır.

KISITLAMALAR


LinkChecker, kontrol etmek için kuyruğa alınan her URL için bellek tüketir. Binlerce sıraya alınmış URL ile
tüketilen bellek miktarı oldukça büyük olabilir. Bu, programı yavaşlatabilir veya
hatta tüm sistem.

onworks.net hizmetlerini kullanarak linkchecker'ı çevrimiçi kullanın


Ad


Ad