途中のコメントでごめんなさい。 US-ASCII はインターネット全般の定義から、クリーンな 7bit に した方がいいです。特に String#validate の時に是非 8ビットの ゴミが入ったら false にしないとまずいと思います。 ASCII-8BIT は ASCII で文法が決まるが、何かの 8ビットの ものが荷物 (payload) として一緒に来る時に使える。 その二つの違いがどこまで必要かどうか分かりませんが、 少なくとも validate みたいなところは二つ欲しいです。 宜しくお願いします。 Martin. At 13:02 07/10/13, Tanaka Akira wrote: >In article <47103C37.5040607 / airemix.com>, > "NARUSE, Yui" <naruse / airemix.com> writes: > >> なるほど、今「ASCII-8BIT」と呼ばれているものは、今まで「US-ASCII」の名前 >> に引きずられて、0x00-0x7F がメインで 8bit 部分はおまけという認識だったの >> ですが、むしろ ASCII 互換バイナリと解釈するべきなのですね。 > >US-ASCII はそのうち別個に定義するということで。 > >> そうすると、「US-ASCII」との解釈で実装されたと思われる部分、[ruby-dev: >> 31715] の「7bit ASCII のみからなる文字列は US-ASCII」という機能は、今と >> なっては若干違和感があるのですがどうなのでしょう。 > >これは文字列の意味が局所的に決まるので良いことだと思っています。 > >ある時点まで ASCII で書いていたソースで、あるとき UTF-8 の文 >字列リテラルを書いたとき、そのファイル中の他のすべての文字列 >リテラルも UTF-8 になる、というのはちょっとナニだな、と思い >ます。 > >そうなっても問題なく動くはずだ、という意見もあるのですが、陽 >に encoding メソッドを呼び出した結果を使っているとそうとも限 >らないので、ASCII-8BIT に決めておいたほうが困らないんじゃな >いかと見込んでいます。 > >US-ASCII が定義されれば、(ぜんぶ 7bit のケースについては) >ASCII-8BIT でもなくて US-ASCII にするという可能性も出てくる >かもしれません。まぁ、そうしたとしても "\x80" みたいなのは >ASCII-8BIT でしょうけど。 >-- >[田中 哲][たなか あきら][Tanaka Akira] #-#-# Martin J. Du"rst, Assoc. Professor, Aoyama Gakuin University #-#-# http://www.sw.it.aoyama.ac.jp mailto:duerst / it.aoyama.ac.jp