青山です。

On Tue, 23 May 2000 11:07:36 +0900,
matz / netlab.co.jp (Yukihiro Matsumoto) wrote:

> これを今導入しちゃうと将来のM17N化の邪魔になりそうなんで、ちゃ
> んと「文字」の定義ができるまでは採用しません。ごめんね。

いえいえ、単に each_byte があるなら、と思っただけですから。逆に、
jcode.rb で each_char という手の方向で、ecode.rb で each_char とか、各
言語毎に対応なんていうのも面白いかも知れませんし。

> |(1文字分割に関しては split よりも scan の方が高速なんですね...
> |これ、将来的に逆転する可能性もあるのでしょうか?
> 
> どうなんでしょう。やはり配列にpushしてるのが大きいのかなあ。

私もそう思っていたので、配列を得るなら split() ブロックを利用するなら
scan() かと思っていたのですが、ブロック無しで配列を返す scan() の方が
split() よりも高速だったので、もしかすると、split() には、まだ改良の余
地があるのかも、と思ったわけです。

手抜きするなら、split(''), split(//) の場合は、内部で scan(/./m) とす
るだけで高速化できるという事ですよね。


-- 
青山 和光 Wakou Aoyama <wakou / fsinet.or.jp>