後藤です. '97年03月28日(金) 午前11時頃、前田さん: > On Fri, 28 Mar 97 09:09:54 JST, > matz / caelum.co.jp (Yukihiro Matsumoto) wrote: > | するんなら,逆でしょうけど.で,文字を扱うクラスの方はEmacs > | のバッファのような機能を持たせるのはどうでしょうね.んで,そっ > | ちの方には文字単位で操作する方法と編集する機能を満載するとい > | うことで.文字コードの変換とかも含めて.気になるのは文字列の > | 内部表現と正規表現の扱いですけど. 前に投稿した長ったらしい urllib の中で each_byte を使ったのは 日本語をバイトで扱っているというのを明示したかったからです. 原さんとかが書かれた URL.quote を見て, 正規表現は String を バイト列と見ているというのはちょっと違和感ありました. 僕は文字列は粒度でいうと大きな TextBuffer と 現行の(バイト列と しての)String があればとりあえずいいと思います. I18nは相当に 調べないと危ないという気がしているので. 誰か文字コード おたく^H^H^Hにくわしい人がおられれば仕様を決めやすいん でしょうけど. > 正規表現をrubyで実装する、っていうのはやっぱり遅いですよね。 > # 前、Javaで正規表現を実装してgrepを作ったんですけど、やっぱり > # 遅かったです。IOが遅かったのかもしれないけど。 それは大変そうですね. 以前 C++で「 == が定義された任意の集合」 上の正規表現を実装したときも相当に重かったような気がします. -- 後藤