In article <E13tMYW-0002te-00 / ev.netlab.zetabits.co.jp>,
  matz / zetabits.com (Yukihiro Matsumoto) writes:

> するどい。実は複数の文字コード系を扱うプログラムを積極的に支
> 援することはあんまり考えてないです。むしろ、だれかが「理想的
> な文字コード系」を作るときに邪魔になりたくないというのが大き
> な動機です。

ここで「理想的な文字コード系なんてないのさ、状況に応じて使えるものを使っ
ていくしかないんだ」と悟ると、複数の文字コードを同時に扱いたい気分にな
るのですが... 悟っていただけませんかね?

> やっぱり処理はおおむねひとつの文字コード系で閉じているのが普
> 通だと思うの。

悟っていただくために例を出すと、

* MIME な世界ではことごとく charset がついているので、どんな charset
  が指定されても(その charset をサポートするモジュールが用意されていれ
  ば、ないしは追加すれば)処理できるようなプログラムを書きたくなる。

* HTML とかの文字参照を扱うには、(内部コードとして主に何を使っていよう
  が)UCS との変換が欲しくなる。

* なんらかの autodetect 機能を入れることになるでしょうが、autodetect
  の結果のコード自体を直接処理するモジュールがあるんなら、そのまま扱え
  て何がいけない? なぜ EUC-JP とかに normalize する必要がある?
  (もちろん(stateful なのとか)変換せざるを得ないものもあるでしょうけど
  ね。)

他にもきっとたくさんあるに違いない...
-- 
[田中 哲][たなか あきら][Tanaka Akira]
「くっだらないコト聞いちゃったねー$(C⊇ ごっめーん$(C⊇」
  (魔法使い養成専門 マジックスター学院 2, 南澤ミヅキ)