出沢@フジフイルム です うー。まじに考えろってか? 出沢> /(^|\s)(\w+?\e\$B.*?\e\(B)(\s|$)/ して、 gotoh> 以下はどーなります?(あまりいい例ではないですが) gotoh> gotoh> 1. "漢字 や ひらがな" gotoh> 2. "漢字 and ひらがな" gotoh> 3. "漢字andひらがな" 3. は 全体が \w+?\e\$B.*?\e\(B に入りますよね? あ、 "漢字andひらがなABC" がまずい。 \w*?\e\$B.*?\e\(B\w*? だ 2. は "漢字" が $2 -> encode になり、"and ひらがな" が right になって 再帰で処理されて、 "and" が ascii に、"ひらがな" がencodeになる。 で、前回は「感じ」だったので省きましたが、$1,$3 にhitした \sは ascii,right にくっつけて処理させます。 から期待通りになる。 1.がまずいな。 /(^|\s)(\w*?\e\$B.*?(\e\(B(\s+|[^\s\e]+)\e\$B.*?)*\e\(B\w*?)(\s|$)/ でどうだ?(複雑、、、) /(^|\s)(\w*?\e\$B.*?(\e\(B(\s+|\S+)\e\$B.*?)*\e\(B\w*?)(\s|$)/ でもいいのかな、、、 >Mewでは更に\wではなく[\t -~]としている点が違いますが ここが、数日前に、 \s\S\w\W で表現できない部分の正規表現を 作って欲いと言ったゆえんでもあります。 >「こんな感じ」ではありますが、エンコードすべき文字列はESC$Bで始まるも >のばかりじゃないのもちょっと気になる。 これは "AB漢字" の事ですか? これは 頭の \w*? でカバーと 思ったのですが。 ISO2022-jp 以外もやれってか? 当面は日本語のBBS相手だったから気にしてなかったが、rfc w名乗ると なると必要か。 、、、、、降りる(ボソッ)