宮川です。

At Wed, 2 Oct 2002 14:08:34 +0900,
SAITO Shukaku wrote:
> >  ちょっと本筋とははずれますが,自由入力されたメッセージ中から URL を
> > 抜き出そうとすると「http://」が無いケースが往々にして存在します。その
> > 場合のうまい抽出方法となると,何かあるんでしょうかね? 単なる英単語と
> > 誤認しないように「www」とかを調べて確度をあげるのかなあ。 
> 
> どうやるんでしょうね?自分でもしばしば"www.google.com"だけを書いたりしま
> すし、"auction.yahoo.co.jp"のように"www"を伴わない場合もありますし。うー
> む、抜き出したURLの候補にnslookupとかpingでも実行しますかね?^^;

Perl の話で恐縮ですが URI::Find というモジュールがあります。
http://search.cpan.org/author/ROSCH/URI-Find-0.13/

URI::Find::Schemeless っていうので、scheme がないURIも推測しようと苦心
してるみたいです。


-- 
Tatsuhiko Miyagawa <miyagawa / edge.co.jp>