高橋征義です。

Perl/Ruby Conferenceは結構先ですし、今のうちから揉んでおいて、
スレッドが長くなってそろそろ追いきれなくなったかなというところで
Conferenceが来て、そこでこれまでの経緯をまとめ発表する、という
のが美しいんじゃないでしょうか。

matz / zetabits.com (Yukihiro Matsumoto)さん:
> |いまいち意味が取れなかったのですが(汗;、
> それは私の説明が悪いからでしょう。

どうも私の理解が浅かったようです(_o_)

> B案については後の「ひょっとして」が正解です。

なんと。ひょっとしましたか。

> 実際Rubyで文字集合が意味があるのは
> 
>   * IGNORECASEで大文字小文字の判別
>   * 正規表現での文字クラス \s \w \d etc.
> 
> だけで、かつ現状ではASCIIの範囲内でしか判別していません。つ
> まり、ASCIIのスーパーセットの文字集合という仮定をおけばEUC,
> SJIS, Unicodeともにこれを満たします)現状程度のサポートは簡単
> ということになります。Perl5.6などがやっている文字名からコー
> ドを引くという操作はテーブルが必要になりますが。

なるほど。

 * 文字列の結合 (coerce?)
 * Unicodeでのcaseの扱いとの互換性(greekとか)
 * 正規表現をどこまでサポートするか

あたりがどうなるかが気になります。

> え? そうなんですか? 私の理解ではUTF-8は31bitまでの任意の整
> 数を1から6バイトまでのマルチバイトで表現するものだと思ってま
> した。UTF-8のエンコーディング法(えーとFSS-UTFでしたっけ)は文
> 字集合と独立に使えるという私の考えが浅はかだったんでしょうか?

あああああ、単純にアルゴリズムとしてなら定義できます(_o_)
# Unicodeから完全に離れたUTF-8を想像しきれなかったらしい。

しかしそういうのはなんと言うのでしょう。ちょっと分からないです。
「FSS-UTF」にしても、「U」はUCSのUのようなので、これまた誤解を
招きそう。

高橋征義 (TAKAHASHI Masayoshi)       Email:maki / inac.co.jp