まつもと ゆきひろです

In message "[ruby-dev:14622] Re: 大小文字を無視した比較で ' 帰 ' == ' 蟻   ' ?"
    on 01/09/03, TAKAHASHI Masayoshi <maki / open-news.com> writes:

|GB18030のことでしょうか。
|
|IBM dWの「GB 18030: A mega-codepage 」
|http://www-106.ibm.com/developerworks/library/u-china.html?dwzone=unicode
|
|には、
|
|   ・ Single-byte: 00-80 (*)                                         
|   ・ Two-byte: 81-fe | 40-7e, 80-fe
|   ・ Four-byte: 81-fe | 30-39 | 81-fe | 30-39                                 
|
|とあります。4バイト文字か2バイト文字かが分かるのは2バイト目を
|読んだときのようですね。

ううう、サイテーのエンコーディングですね。既存のエンコーディ
ング(GBK?)をそのまま拡張したせいのようです。どうやって対応
するかなあ。