高橋征義です。PHPはまだまだ初心者です。

ちなみに、PHPのマルチバイト文字設定用ディレクティブとマルチバイト
文字列関数は4.0.6あたりからPHP本体にmergeされているようです。
cf. http://search.net-newbie.com/php/configuration.html
    http://search.net-newbie.com/php/ref.mbstring.html
    ↑しかし実質日本語にしか対応してないのにいいんかいな?

Masaaki Sakano <mas / star.le.ac.uk>さん:
> <kyoui32 / hotmail.com> wrote:
> >> 私は、昨年PHP3.0.xxを始めて覚えて文字コードという問題にぶち当たりました。
> >> PHPは文字コードに対する処理が充実していて初心者にぴったりだと思いました。
> >> 入力部
> >> 内部処理部
> >> 出力部
> >> をあらかじめ指定して置けば、厳格に処理されていきます。
(略)
> PHP のことは全然知りませんが…、入力部AUTOで厳格に処理されるなんて
> 原理的にあり得ないと思いますが?

まあ、言葉のあやというか、「AUTOかSJISかEUC-JPかは厳格に決められて
処理される」というか、ではないかと(^^;;;

> 日本語(とUSアスキーと)だけなら、
> Ruby なら、 NKF を通すことによって、上のPHPと同じようなことが
> できる…んですよね、きっと (私自身はRubyで日本語処理をしたことがない
> もので存じません _o_)。

UTF-8を使わないのであれば、そうです。
Rubyで同じようなことをやるのであれば、STDINとSTDOUTで強制的に
nkfなりiconvなりをカマさせるようにする、という感じになりますか。
……あんまりうれしくなさそう。そこだけ指定できても。

> # 短い文字列(単位)の場合は工夫が必要だったりします?

特に工夫するワザはないようですが、それなりにうまくいっているようです。
基本的にWebに特化しているからかもしれません。

高橋征義 (TAKAHASHI Masayoshi)       Email:maki / inac.co.jp