まつもと ゆきひろです

In message "[ruby-list:7439] character code and bug?"
    on 98/04/13, TAKAHASHI Masayoshi <maki / inac.co.jp> writes:

|高橋です。
|
|結局ひよってXMLの簡単なチェッカを書いたのですが、xmlのサンプル文書で
|チェックしてみたところエラーの嵐。どうもUnicodeのところでひっかかって
|しまっています(;_;)  とりあえずrubyはUnicode対応は当分しないんでし
|たっけ?

ええ.rubyはunicodeに対して保守的になろうと決心してます.

だれかパワフルな人が「rubyのunicode化はかくあるべきだ」って
実装を出してくれれば,いや,実装までは行かなくても仕様の提案
が出て来れば進むでしょうけど,そうでない以上こうすれば間違い
ないっていう状態に世の中がなるまでは様子見です.

ただrubyの場合,byte stringとして扱うこともできるので,その
辺を使えばとりあえずunicodeを扱うことは出来るのではないかと
思います.その場合は`$KCODE = "NONE"'としたりする必要がある
でしょうが.

|というのはさておき、re.c に間違いがあるようなのですが。caseで
|KCODE_SJIS と判断したものを EUC として mbcinit してます。

あ,本当だ.パッチ有難うございます.

                                まつもと ゆきひろ /:|)