・インストールしたもの        : wwgetall
・インストール先              : /home-toyonaka/es-ele/1993/ke3057yt/Trial/bin/wwgetall
・バージョン(パッチレベル)  :
1.00
・インストールした人の所属氏名: 吉岡恒夫 学生
・インストールした人の E-Mail : ke3057yt@ex.ecip.osaka-u.ac.jp
・日付                        : 96.5.17
・マニュアル                  : ~ke3057yt/Trial/README/bin_wwgetall(これ)
・入手経路                    : 自作
・関連ファイル                : 
~ke3057yt/Trial/bin/wwget(1つだけファイルをとってくる)
								~ke3057yt/Trial/bin/client.pl
・インストールの際の変更点    : 
・備考                        : 

WWWサーバーに置いてあるファイルをあるディレクトリ以下すべてとってくる
プログラムです。
すべてローカルで見れる形式に変換するので、家にもって見たり、
学校でもあらかじめローカルなHDに落としておいて、すばやく見ることができます。

■インストールの方法(情教以外の場合)
情教以外で使う場合はインストールが必要です。
1.client.pl,wwget,wwgetallを適当なディレクトリに置いて下さい。
パスの通ったディレクトリに入れるといいと思います。
2.このプログラムはperl version5以降が必要なのでない場合はインストールしてください。
3.client.pl,wwget,wwgetallの最初の行をperl5パスに書き換えて下さい。
4.chmod 755 ファイル名などで、3つのファイルを実行可能にしてください。
5.client.plを以下のように書き換えます。
	$AF_INET=2;$SOCK_STREAM=1;の所を書き換えて下さい。
	sys/socket.hにのってると思います。
	Linux,nextの場合はこのままでいいです。
6.wwgetを書き換える
	push(@INC,"ディレクトリ")の行をclient.plのあるディレクトリに書き換えて下さい。
	代理サーバーを経由する必要がある場合は、
	$default_proxy="http://server:port/";
	を書き換えて下さい。
7.これでも動かない場合はメールをください。

■使い方(全般的)
/NextApps/Terminal.appから
wwgetall http://www.rd.ecip.osaka-u.ac.jp/
のようにいれます。
こうすると、ホームディレクトリの下に、html/www.rd.ecip.osaka-u.ac.jp/
というディレクトリを作りその下にindex.htmlなどのファイルを置いていきます。
もう一度取り直す場合は、一度そのファイルを消す必要があります。

■オプションなど
usage: wwgetall [-m<match_url>] [-d<write_dir>] [-t<time_limit>] [-s<size_limit] [-e<permited_extension>] <http://hostname/path>

-m<match_url>
	match_urlにマッチするURLを取ってきます。match_urlはperlの正規表現
	を使います。
	(例)wwgetall -mhttp://.*.osaka-u.ac.jp/ http://www.osaka-u.ac.jp/
	のようにすると、阪大の全ホストの全ファイルをとってこれます(おひ)
	
-d<write_dir>
	とってきたファイルの置く場所を~/html/からwrite_dirにかえます。
	(例)wwgetall -d/tmp/ http://www.osaka-u.ac.jp/
	とすると、/tmp/にとってきたファイルを起きます。ホームディレクトリの
	要領がない人はこうする方がいいでしょう。
	
-t<time_limit>
	time_limit秒以内にファイルを取ってこれなければ、そのファイルを取ってくる
	ことをあきらめます。

-s<size_limit>
	size_limit[kb]以上のファイルの場合、size_limitまででちょんぎります。
	
-e<permitted_extension>
	とってくるファイルの拡張子を正規表現で指定します。
	デフォルトでは、-eになっています。
	すべてのファイルをとってくる場合は、-eとだけします。

■使用例
wwgetall -d/tmp -e http://www.sup.ee.es.osaka-u.ac.jp/
	www.sup.ee.es.osaka-u.ac.jpのホストのファイルすべて(htmlファイル以外も)
	を/tmpに置きます。
■仕組み(?)
とりあえず、指定されたURLをスタートURLとし、そのファイルにかかれている
<a href=..>などのURLを捜し出します。見つけた場合は、相対パスに書き換え、
そのファイルをまだ取ってきてなければ、スタートURLにマッチするかしらべ、
マッチした場合は、そのURLのファイルをとってきます。
これを繰り返していきます。
なお、深さ優先探索でしらべていってます。
実行中に表示される(level??)は深さを表します。

■制限
対応タグは今のところ、
<a href=...>
<img src=...>
です。
デフォルトhtmlファイルはindex.htmlと仮定しています。

■バグ
いろいろあるでしょう(^^;
きがついたら言って下さい。

■注意
このプログラムは次々と、ファイルをとってくる、という性質上
ネットワークに負担をかける可能性があります。
ネットワークが混んでいるときは、つかわないようにしたほうがいいと思います。

■そのほか
コピー、改造、再配布、ソースの一部利用
など自由にしてください。
バグ、文句、感想などはどしどしどうぞ、

なお、このプログラム(とサポートプログラム)は、perl5で書かれていますので、
機種依存はあまりしないはずです。

■history
1996/3/?? 家でつくってちょっとつかう。
1996/5/?? 学校にもってくる
1996/5/17 このファイルを作る。画像ファイルに対応する。
1996/5/22 デフォルトですべての拡張子のファイルをとってくるようにする。
1996/7/1	インストール方法を書き加える。
1996/8/9	画像ファイルは指定された正規表現にマッチしなくても取ってくるようにする。
			ラベル(index.html#labelなど)を適切に扱うようにした。
---
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
^^^^^ 大阪大学基礎工学部電気工学科 四年 ^^^^^^
^^^^^   ke3057yt@ex.ecip.osaka-u.ac.jp  ^^^^^^
^^^^^       1975・1・18生まれ (山羊座)  ^^^^^^
^^^^^           吉岡恒夫                ^^^^^^
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^