高橋征義です。

連休の前になりますか、「RubyのI18NとかM17Nについてまじめに
考えなさい」という天のお告げがあったので(嘘)、現状と問題に
ついてまとめてみました。まだ途中ですが、暫定公開します。

M17N/I18N for Ruby
http://www.inac.co.jp/~maki/ruby/ruby-i18n.html

# 「ruby-i18n.html」というファイル名ながら、実はM17N(とL10N)
# にしかほとんど触れていないのは言わない約束です。

ていうか、I18NなRegexpっていうのはどういうものなんでしょうね。
一応Unicodeではそれなりに定義されてますが、TISとかの結合文字
の文字列とか、BIDIな文字列についても、正規表現が定義されて
いる/されていたんでしょうか。

# なぜRegexpなのかというと、実質的にRubyで文字列を扱っている
# のは、現状では正規表現に負うところが大きいようなので。
# mbstringかこれ相当のものが取り込まれればまたちょっと状況も
# 変わりそうですけど、どうなるんでしょう……。

間違いがあったら(たぶんありそう……)修正しますので、ご連絡ください。
また、ここでは触れてないけど、関係のありそうなもの、というのもあれば
教えてください。

高橋征義 (TAKAHASHI Masayoshi)       Email:maki / inac.co.jp
そういえば、RDのリンク用アイコンってありましたっけ?「Powered by RD」
みたいな。