高橋です。

まつもと ゆきひろさん:
> ええ.rubyはunicodeに対して保守的になろうと決心してます.

それも正しい態度かと思います。いや、ほんとにそうだな、と。

> だれかパワフルな人が「rubyのunicode化はかくあるべきだ」って
> 実装を出してくれれば,いや,実装までは行かなくても仕様の提案
> が出て来れば進むでしょうけど,そうでない以上こうすれば間違い
> ないっていう状態に世の中がなるまでは様子見です.

うーん……例えば、ASCIIとISO-8859-1だけで表現できる文字だけは
サポートして、それ以外はエラーを出す(このバージョンのrubyでは
unsupported、だとかなんとか表示するとか)、とかいう仕様でも
よろしいのでしょうか?  ちょっと限定的で嫌なんですが、それ以上
はよっぽどの根拠がなければ手を出したくないですし。

> ただrubyの場合,byte stringとして扱うこともできるので,その
> 辺を使えばとりあえずunicodeを扱うことは出来るのではないかと
> 思います.

いやそれがですね、UTF-8じゃなくてほんとに16bitのBMPそのまま
だったんですよ……。一文字おきに 0x00 が埋め込まれているテキ
ストファイルを見てのけぞってしまいました。そりゃパーズできない
はずよ、という気分。
# でも他にもパーズできない部分があって、まだ検討中です。

> あ,本当だ.パッチ有難うございます.

ということは、あれで良かったんですね。あんしんしました(^^;

高橋征義 (株式会社アイナック)              Email:maki / inac.co.jp