サイトのリンク切れの検出チェックをするには?

checkbot を利用するといいだろう。 これは Perl ベースのコマンドラインツールで、実行するとリンク切れをチェックして HTML を出力する。その HTML に書き出された検出結果をブラウザから見るという使い方。 この checkbot、UTF-8 で書かれたサイトを指定してて実行すると、
Parsing of undecoded UTF-8 will give garbage when decoding entities at
/usr/lib/perl5/site_perl/5.8.7/LWP/Protocol.pm line XXX, <CURRENT> line 1.
などのエラーが出るが、気にしないでよい。実行例としては、
./checkbot --url
--internal-only" title="https://perltips.twinkle.cc/
--internal-only">https://perltips.twinkle.cc/
--internal-only
--ignore "\.js|hatena\.ne\.jp|\.ico"

※本当は全部 1行
のような感じで、上の例だと、https://perltips.twinkle.cc/ (このサイト)を対象にして、JavaScript のリンク (.js)、hatena.ne.jp、アイコンファイル (.ico) を無視し、サイト内だけリンク切れをチェックする、という設定である。
トラックバック URL: https://perltips.twinkle.cc/trackback/99
Posted on 2006-06-12 by yas |