Toshです。

In message "[ruby-list:20243] (rd2) nl in Japanese chars"
    on 00/01/17, GOTO Kentaro <gotoken / math.sci.hokudai.ac.jp> writes:
>ごとけんです
>
>rd2 で日本語のHTMLを作るとき使うとき、Verbatim 以外の要素の
>/\n\s*/ を消したいのですがどういじるのが正統ですか??

正直、僕にもよくわかってません。RDtoolが、日本語と英語をちゃんと
扱い分けられるようになってないといけないのでしょうが。
# こういうのには"RD Header"が必要でしょうか?

いまのところ、HTML出力用のライブラリを別に用意してやるのがてっとりばや
いと思います。ごとけんさんのコードをまるごと使わせていただいて、とりあ
えずの日本語HTML出力用ライブラリを用意しました。

したの場所から持って行ってください。
<URL:http://www2.pos.to/~tosh/ruby/rdtool/rd2html-ja.rb>

ろくにテストしてないのでバグがありそうですが。
# とりあえずのものなので、コード汚いのは我慢してください。(^^;;

>つまり、以下のような処理を Verbatim 以外に施したいのですが、
>フィルターの書き方が分かりませんので教えて下さい。

フィルターはRDで扱わない部分の処理をする為のモノなのでこのような
用途には使えません。

># 最近はぜんぜん議論に参加してませんが rd2 にはいつもお世話
># になってますです

どうもです。(^^

ところで、

>    require "kconv"
>    class String
>      def kill_nlsp_in_jchars
>	code = Kconv.guess(self)
>	str = Kconv.toeuc(self)
>	begin
>	  modified = str.gsub!(/([、-瑤])\n\s*([、-瑤])/, "\\1\\2")

この正規表現の"[、-瑤]"の部分は「前の行の最後と次の行の最初が非ASCIIな
時だけ」というのを示している、って理解であってますでしょうか?

>	end while modified
>	Kconv.kconv(str, code)
>      end
>    end

---
Tosh
Toshiro Kuwabara