松永です。

差出人  :SAITO Shukakuさん
タイトル:[ruby-list:36073] Re: 日本語に混じった URL を抜き出したい

|どうやるんでしょうね?自分でもしばしば"www.google.com"だけを書いたりしま
|すし、"auction.yahoo.co.jp"のように"www"を伴わない場合もありますし。うー
|む、抜き出したURLの候補にnslookupとかpingでも実行しますかね?^^;

  抜き出しに失敗したあとどうするかって話もありますよね。
 "(http://hoge.jp)" みたいなカッコ入りURLなどという例もあり,これはUR
I.extractすると "http://hoge.jp)"と後ろのカッコまで抽出されてしまいま
す。これはまずいと分かったところで,リカバリはムズカシイです。そういう
場合は文字列で示して,人間の認識能力に頼るのでしょうか。

-- ------------------------------------------------
松永肇一(keiichi matsunaga)
株式会社ライフメディア 開発部
  TEL:03-5717-6491 FAX:03-5717-6492
  こんなことやってます→http://www.imi.ne.jp
  こんなもの作ってます→http://www.imi.ne.jp/abc/