出沢@フジフイルム です

うー。まじに考えろってか?

出沢>     /(^|\s)(\w+?\e\$B.*?\e\(B)(\s|$)/ して、

gotoh> 以下はどーなります?(あまりいい例ではないですが)
gotoh> 
gotoh> 1. "漢字 や ひらがな"
gotoh> 2. "漢字 and ひらがな"
gotoh> 3. "漢字andひらがな"

3. は 全体が \w+?\e\$B.*?\e\(B に入りますよね?
あ、  "漢字andひらがなABC" がまずい。 \w*?\e\$B.*?\e\(B\w*?  だ

2. は  "漢字" が $2 -> encode になり、"and ひらがな" が right になって
再帰で処理されて、
"and" が ascii に、"ひらがな" がencodeになる。
    で、前回は「感じ」だったので省きましたが、$1,$3 にhitした \sは
     ascii,right にくっつけて処理させます。
から期待通りになる。

1.がまずいな。

/(^|\s)(\w*?\e\$B.*?(\e\(B(\s+|[^\s\e]+)\e\$B.*?)*\e\(B\w*?)(\s|$)/

でどうだ?(複雑、、、)

/(^|\s)(\w*?\e\$B.*?(\e\(B(\s+|\S+)\e\$B.*?)*\e\(B\w*?)(\s|$)/

でもいいのかな、、、

>Mewでは更に\wではなく[\t -~]としている点が違いますが


ここが、数日前に、 \s\S\w\W で表現できない部分の正規表現を
作って欲いと言ったゆえんでもあります。


>「こんな感じ」ではありますが、エンコードすべき文字列はESC$Bで始まるものばかりじゃないのもちょっと気になる。

これは "AB漢字" の事ですか? これは 頭の \w*? でカバーと
思ったのですが。
   ISO2022-jp 以外もやれってか?
   当面は日本語のBBS相手だったから気にしてなかったが、rfc w名乗ると
   なると必要か。
   
   、、、、、降りる(ボソッ)