成瀬です。

こっちでも話題出ていたのですね。

U.Nakamura wrote:
> Nkf::nkfあるいはIconv::iconvなどの変換系ライブラリで、変換結
> 果として得た文字列がASCII-8BITになるために自力でforce_encoding
> しないと使い物にならないという問題があるんですが、これはどう
> なる予定でしょうか?

[ruby-dev:32450] でも書きましたが、こっちでもう少し。

端的にはライブラリ側で文字列を返す直前に force_encoding すればいいだけの
話なのですが、付随して起きてくる問題が2個あります。一つは
[ruby-dev:32451] にある UTF16 のように Ruby が・・・というか鬼車が対応し
ていないエンコーディングの場合で、もう一つが CP932 のように符号化方式と
しては鬼車が(Shift_JIS として)対応しているのだけれど、別の名前が必要な
場合。

前者も後者も、文字コード変換ライブラリ側が reg_enc_replicate で片っぱし
からエンコーディングを定義してしまえばとりあえず解決だと思っているのです
が、その方向でよいのですかね。UTF-16 のようなケースでは Ruby は文字列と
して扱えない(のでバイト列扱いである)のに、表面上普通に変換できてしまう
のは、ちょっと引っかかる気もするのですが、適切な表示方法が。


-- 
NARUSE, Yui  <naruse / airemix.com>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA