まつもと ゆきひろです

In message "[ruby-dev:16593] Oniguruma and multibyte character literal"
    on 02/03/26, TAKAHASHI Masayoshi <maki / rubycolor.org> writes:

|[ruby-talk:36677] あたりを見て思ったのですが、Onigurumaでは、
|  /0x1234/u
|とか、
|  /[0x1234-0x2345]/u
|みたいな正規表現は書けるんでしょうか?
|
|# 今はscan_unsigned_hexadecimal_numberのmaxlenは2に決め打ちして
|# 呼んでいるようですが。

将来(M17N?)のRubyでは、256を越えるコードポイントを指定する方
法が欲しいとは思っています。とはいえ、\x1234を\x12, 3, 4と解
釈しないようにするのは互換性の観点から難しいとも思います。

Perlでは\u{1234}という記法がありますが(だよね)、Unicodeだけ
が256を越えるコードポイントを持つわけではないんで、これは避
けたいです。やっぱり、

  \x{1234}

ですかね。
                                まつもと ゆきひろ /:|)