森山です。

NARUSE, Yui wrote:
> 成瀬です。
> 
> Yukihiro Matsumoto wrote:
>> まつもと ゆきひろです
>>
>> In message "Re: [ruby-dev:29700] ruby NKF モジュールの CP932系エンコーディングパッチ"
>>     on Fri, 27 Oct 2006 19:41:54 +0900, MORIYAMA Masayuki <moriyama / miraclelinux.com> writes:
>>
>> |IPA 2005年度下期オープンソースソフトウェア活用基盤整備事業のプロジェク
>> |トとして採択された、「オープンソースソフトウェアにおける統一したレガ
>> |シーエンコーディングの変換機能の開発」で、作成した、ruby 1.8.4 の NKF
>> |モジュールの CP932, eucJP-ms, ISO-2022-JP-MS に対してユーザー定義文字
>> |を追加するパッチを公開しました。
>>
>> この情報だけからだと、このパッチをとりこんでどう嬉しいのか伝
>> わらないんですけど。nkfメンテナのなるせさんが分かってればい
>> いのかな。

説明不足で申し訳ありませんでした。

今回、公開したパッチの内容では問題があることが分かっていて、修正が必要
だと考えていますが、体調をくずしてしまい修正が出来ていない状態にあります。

> ruby 1.8.4 に対してのパッチとしては一定のメリットがあるのですが、
> 1.8.5 や nkf 側の CVS Head からの差分をまだ把握していないので、
> 取り込むのはもう少し待ってください。
> とりあえず分かってはいます。
> 
> 森山さんの側でnkf CVS HEAD からの差分を把握しているのでしたら、
> 別途 nkf の方で教えてくださると助かります。
> # CP51932 の実装がもともと nkf の行っている実装と別にしているようなので

今回作成のパッチが不完全である事もあるのですが、nkf の度重なる機能追加
により、いろいろと不都合な点が出てきているように思いますので、コードを
整理した方が良いのではないかと感じています。

次のような修正が必要なのではないかと考えています。

・Unicode 間の変換では、EUC へ変換しないようにする。
・Unicode へ変換できない文字を UTF-8 出力の場合はスキップし、UTF-16 出
  力の場合は U+0000 で出力するなど、UTF-8、UTF-16 で異なる処理をしてい
  る箇所があるので、Unicode 処理の見直し。
・--ic, --oc オプションと半角カナ処理の見直し。

--
森山 将之 moriyama / miraclelinux.com
ミラクル・リナックス株式会社