At Mon, 21 Oct 2002 01:03:47 +0900,
たむらけんいち wrote:
> http://www01.tcp-ip.or.jp/~furukawa/nkf_utf8/ にて、utf-8対応が発表され
> もともとの nkf開発者である kono さんが、betaとして取り込み、現在、
> http://sourceforge.jp/projects/nkf/ が開発の場になってるようです。

 私も先日見てみたんですが、コードの自動判定ルーチンが埋め込みに
なってて取り出せなかったりして、ライブラリとして使うには苦しい
代物ですよね。もっと素直に使えるものはないのかしら。

> で、ruby-1.7対応や、標準nkfとの同居を考慮して、unkfという名前にしてます。
> 
> 出来れば、ruby本体に入れてもらえばと思うのですが。
> 
> ただし、問題点として、
>  * 現在の文字コード判定 NKF::guess に UTFを追加するのか。

 nkf 2.x の品質が安定した段階(そろそろ?)で nkf モジュールを
置換できたら理想ですが、UTF8自動判定の正確さが高まらない限りは
苦しいと思います。UTF8 が無縁なケースで誤判定されたりすると目も
当てられない。。

>  * そもそも nkfが UTFに対応して、うれしいのか。
>   uconv/iconvもあるし。まぁサイズ的なメリットはあるかも。

 Perl の Encode モジュール群みたいにすべて提供するというのは
やりたくないですが、日本語処理については特にニーズも高いので、
EUC <-> UTF8 テーブル一つ程度ならいいと思います。

>   rubyから利用できるものたちのテストを MoonWolf氏がやってくれました。
> http://rwiki.jin.gr.jp/cgi-bin/rw-cgi.rb?cmd=view;name=MoonWolf

 取りうるエンコーディングのリストを(ヒントとして)渡すような
インターフェースも必要かもしれませんね。

-- 
                     /
                    /__  __            Akinori.org / MUSHA.org
                   / )  )  ) )  /     FreeBSD.org / Ruby-lang.org
Akinori MUSHA aka / (_ /  ( (__(  @ iDaemons.org / and.or.jp

"When I leave I don't know what I'm hoping to find
              When I leave I don't know what I'm leaving behind.."