まつもと ゆきひろです
In message "[ruby-list:7439] character code and bug?"
on 98/04/13, TAKAHASHI Masayoshi <maki / inac.co.jp> writes:
|高橋です。
|
|結局ひよってXMLの簡単なチェッカを書いたのですが、xmlのサンプル文書で
|チェックしてみたところエラーの嵐。どうもUnicodeのところでひっかかって
|しまっています(;_;) とりあえずrubyはUnicode対応は当分しないんでし
|たっけ?
ええ.rubyはunicodeに対して保守的になろうと決心してます.
だれかパワフルな人が「rubyのunicode化はかくあるべきだ」って
実装を出してくれれば,いや,実装までは行かなくても仕様の提案
が出て来れば進むでしょうけど,そうでない以上こうすれば間違い
ないっていう状態に世の中がなるまでは様子見です.
ただrubyの場合,byte stringとして扱うこともできるので,その
辺を使えばとりあえずunicodeを扱うことは出来るのではないかと
思います.その場合は`$KCODE = "NONE"'としたりする必要がある
でしょうが.
|というのはさておき、re.c に間違いがあるようなのですが。caseで
|KCODE_SJIS と判断したものを EUC として mbcinit してます。
あ,本当だ.パッチ有難うございます.
まつもと ゆきひろ /:|)