木村です。
解決したというところで茶々入れるのもなんですが。

Yosuke Suzuki さんは書きました (2006/08/16 0:25):
> <a class=l href="hogehoge">bar</a>
> となっているところで
> hogehogeとbarを
> 抜き出したいのですが、
> 
> 正規表現で
> <a class=l
> href=\"(http:\/\/[-_.!~*\'()a-zA-Z0-9;\/?:\@&=+\$,%#]+)\">(.*)<\/a>
> と書くと改行になるまでにある最後の </a> でマッチして
> しまいます。

対象文字列に http:// がないのにパターンにはあるわけですが
本当にマッチしてるんでしょうか?


> 手元のエディタ(サクラエディター)では
> <a class=l
> href=\"(http:\/\/[-_.!~*\'()a-zA-Z0-9;\/?:\@&=+\$,%#]+)\">([^(</a>)]*)<\/a>
> で実現できるのですが、

[^(</a>)]* というパターンはどういう文字列にマッチさせようとして
記述しているのでしょう。

どうころんでも bar にはマッチしそうにないんですが、サクラエディタ
ってそんな特殊でしたっけ?


-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk at kt.rim.or.jp
	web  www.kt.rim.or.jp/~kbk/zakkicho/
	     homepage3.nifty.com/farstar/