In article <47103C37.5040607 / airemix.com>, "NARUSE, Yui" <naruse / airemix.com> writes: > なるほど、今「ASCII-8BIT」と呼ばれているものは、今まで「US-ASCII」の名前 > に引きずられて、0x00-0x7F がメインで 8bit 部分はおまけという認識だったの > ですが、むしろ ASCII 互換バイナリと解釈するべきなのですね。 US-ASCII はそのうち別個に定義するということで。 > そうすると、「US-ASCII」との解釈で実装されたと思われる部分、[ruby-dev: > 31715] の「7bit ASCII のみからなる文字列は US-ASCII」という機能は、今と > なっては若干違和感があるのですがどうなのでしょう。 これは文字列の意味が局所的に決まるので良いことだと思っています。 ある時点まで ASCII で書いていたソースで、あるとき UTF-8 の文 字列リテラルを書いたとき、そのファイル中の他のすべての文字列 リテラルも UTF-8 になる、というのはちょっとナニだな、と思い ます。 そうなっても問題なく動くはずだ、という意見もあるのですが、陽 に encoding メソッドを呼び出した結果を使っているとそうとも限 らないので、ASCII-8BIT に決めておいたほうが困らないんじゃな いかと見込んでいます。 US-ASCII が定義されれば、(ぜんぶ 7bit のケースについては) ASCII-8BIT でもなくて US-ASCII にするという可能性も出てくる かもしれません。まぁ、そうしたとしても "\x80" みたいなのは ASCII-8BIT でしょうけど。 -- [田中 哲][たなか あきら][Tanaka Akira]