竹内といいます。出遅れました。

On Wed, 2 Oct 2002 13:51:42 +0900
keiichi matsunaga <ma2 / lifemedia.co.jp> wrote:

> 落としていました。斉藤さんに紹介していただいた本も今日さっそくチェック
> してきます。

 Ruby Magic を書かせていただいた者です。本の中では RFC2396, RFC2616 に
基いて正規表現を定義してみました。本を買わずとも(^^) スクリプトは以下か
ら落とせますので、もし正規表現で試される場合はご参考になさってください。

http://www.ohmsha.co.jp/data/link/4-274-06488-3/index.htm

> 抜き出そうとすると「http://」が無いケースが往々にして存在します。その
> 場合のうまい抽出方法となると,何かあるんでしょうかね? 単なる英単語と
> 誤認しないように「www」とかを調べて確度をあげるのかなあ。 

 スキームが省略されたケースは難しいでしょうね。URL 「っぽい」ものを抽出
するぐらいはできそうですが…

-- 
TAKEUCHI Hitoshi
http://www.namaraii.com/