朴 芝印です。

2008/2/7, Martin Duerst <duerst / it.aoyama.ac.jp>:
> At 05:00 08/02/07, NARUSE, Yui wrote:
> >成瀬です。
> >
> >Park Ji-In wrote:
> >> 朴 芝印です。
> >>
> >> 韓国語用のEUC-KR <->UTF-8 の変換テーブルを
> >> 書いてみました。
>
> ご苦労様でした。現在すごく忙しいですが、これから韓国語用の
> 変換をどうするのかのアドバイスをお願いしたかったところでした。
>
> 見た限り、相当研究されてしまいました。
>
> EUC-KR 以外に韓国語に必要なエンコーディングなどありますでしょうか。
> そのためのデータはどこにありますでしょうか。
>
CP949(EUC-KRのwindows拡張)、ISO-2022-KR、JOHABがあります。
CP949 <-> UNICODEはhttp://unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP949.TXT

その他は
http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/KSC/
にあります。

また http://en.wikipedia.org/wiki/EUC-KR#EUC-KR もあります。
> >> KSX1001 <-> UNICODE
> >> mapping文書
> >(http://www.haible.de/bruno/charsets/conversion-tables/KSC5601.html)を見なが
> >ら作成したものです。
>
> 「見ながら」? まさか手作業で流行ってないでしょう。
> そのなかの KSX1001.TXT を使いましたでしょうが、
> そのファイルに比べて何か変更を行いましたでしょうか。
もちろん手で書いた訳ではありません。Rubyスクリプトを書いてそれで作りました。
> 現在のところ、7ビットの US-ASCII をそのままに追加した
> ことだけが分かりました。
はい、そうです。
>
> >> 幾つかの単語の変換(String#encode)をやってみたら動いてました。
>
> テストがありましたら、是非 test/ruby/test_transcode.rb の
> パッチとしてお願いします。
>
はい。二つのテストとCP949をついかしてみました。が、今度は1MBを越えました。(汗)
とりあえぜ
よろしくお願いします。