まつもと ゆきひろです
In message "[ruby-list:2435] Re: \W, \S, \D"
on 97/03/26, WATANABE Hirofumi <watanabe / ase.ptg.sony.co.jp> writes:
|
|わたなべです.
|gawk の regex はあまりいじったことないんで, これからじっくり
|見てみます.
どうも.rubyのregexp.cはかなり手をいれていますから,むずかし
いかもしれません.それはともかく,帰りの新幹線で\W, \S, \Dに
関しては動作するようになったようです.
残る問題はmultibyte対応の時の \xa4 とか [\xa4]とかで,まずど
ういう動作をするかというところから定義しないといけないようで
す.現状では iskanji(c) -- rubyではismbchar(c) -- が成立する
数値リテラルはエラーにしているのですが,本当はどういう挙動を
するべきだと思います?
|やっぱ地道に iskanji(c) で調べて日本語の 1 バイト目だったら
|読み飛ばすって感じです.
jperl5のソースを読むべきかなあ.
まつもと ゆきひろ /:|)