wwgetall

wwgetall

wwgetallはWWWサーバにあるHTMLファイルなどを再帰的に取得するプログラム(WEBロボット)です。ノンブロッキングモードを用いているため、プロセスで複数のコネクションを管理できます。またKeep-Aliveを用いた持続接続にも対応しています。他の同種のプログラムより比較的高速に動作すると思います。If-Modifiec-Sinceヘッダにより、更新されたページのみ取得することもできます。 動作確認は、Linux,IRIX-6.3,WindowsNT(Perl for Win32)で行っています。

Download

wgau by 竹内さん

wwgetallをWindows上のウインドウから操作できるプログラム「wgau」を 竹内さんが作ってくれました。Special Thanks!

tcl/tk(おまけ)

簡単なtcl/tkインターフェースをつけてみました(wwgetall.tcl).使う時は、、、

おきまりの注意

めったやたらとページを取ってくるとサーバに負荷がかかりますので、御注意ください。

同じようなWWWロボットプログラム

wwgetallに関するメーリングリスト(ML)(^^;


ホームページへ戻る
御意見、御感想などはどしどしこちらへ。。。
吉岡 恒夫(tsuneo@rr.iij4u.or.jp,QWF00133@nifty.ne.jp)