checkbot を利用するといいだろう。
これは Perl ベースのコマンドラインツールで、実行するとリンク切れをチェックして HTML を出力する。その HTML に書き出された検出結果をブラウザから見るという使い方。
この checkbot、UTF-8 で書かれたサイトを指定してて実行すると、
Parsing of undecoded UTF-8 will give garbage when decoding entities at
/usr/lib/perl5/site_perl/5.8.7/LWP/Protocol.pm line XXX, <CURRENT> line 1.
などのエラーが出るが、気にしないでよい。実行例としては、
./checkbot --url
--internal-only" title="https://perltips.twinkle.cc/
--internal-only">https://perltips.twinkle.cc/
--internal-only --ignore "\.js|hatena\.ne\.jp|\.ico"
※本当は全部 1行
のような感じで、上の例だと、https://perltips.twinkle.cc/ (このサイト)を対象にして、JavaScript のリンク (.js)、hatena.ne.jp、アイコンファイル (.ico) を無視し、サイト内だけリンク切れをチェックする、という設定である。
トラックバック URL:
https://perltips.twinkle.cc/trackback/99