From: Keiji Yoshimi <walf443 / gmail.com>
Subject: [ruby-list:42703] Re: リンクを抜き出す正規表現について
Date: Wed, 16 Aug 2006 12:58:46 +0900

> require 'hpricot'
> doc = Hpricot(%{<a class=l href="hogehoge">bar</a>baz})
> doc.search("a").map {|i| [ i['href'], i.inner_html ] }
>   #=> [["hogehoge", "bar"], ["foo", "baz"]]

おお、このインターフェース気に入りました。
しかも拡張ライブラリなので速いですね。

> ちなみにHTMLがらみの正規表現は"や/などのエスケープしなければならない
> 文字列が大量発生するので%r{ .. }などを使うと後から読みやすくて良いと
> 思います。

%rは多用しています。こういう痒いところに手が届く仕様が大好きです。
--
rubikitch
http://www.rubyist.net/~rubikitch/