まつもと ゆきひろです.

In message "[ruby-list:2440] Re: \W, \S, \D"
    on 97/03/27, WATANABE Hirofumi <watanabe / ase.ptg.sony.co.jp> writes:
|わたなべです.
|
|matz / caelum.co.jp (Yukihiro Matsumoto) writes:
|
|:残る問題はmultibyte対応の時の \xa4 とか [\xa4]とかで,まずど
|:ういう動作をするかというところから定義しないといけないようで
|:す.現状では iskanji(c) -- rubyではismbchar(c) -- が成立する
|:数値リテラルはエラーにしているのですが,本当はどういう挙動を
|:するべきだと思います?
|
|これって悩むとこなんですよね. jperl ではまったくなにもやって
|ないのでところどころで矛盾を生じています. jcode.pl が動かな
|いのもこれが一つの原因になってるし.

仕様から考えると

| [\x81-\x9f\xe0-\xfc][\x40-\x7e\x80-\xfc]
|なんて表記できると便利だから 1 byte とみなしたほうがいいかな
|と思いますが.

の方がよさそうなんですが,その場合途中で検索位置がずれちゃう
可能性があるので,頭痛いです.実装が簡単なのは\xa4が\xa4を含
む全角文字にマッチすることですが,それはそれで使いにくい気も
します.
                                まつもと ゆきひろ /:|)