石橋"rubyholic"秀仁です。
原さん、リプライどうもありがとうございます。

From: Shin-ichiro Hara <sinara / blade.nagaokaut.ac.jp>
Subject: [ruby-list:23735] Re: blade らしさ? (Re:  自動翻訳プロジェクト)

> |# 噂ではすごくheuristicなコードらしい。
> 
> そうなんですよ。例えば
(省略)
> とかいう知識を
(省略)
> とかぶつぶつ言いながら(これはフィクションです ^^;)、正規表現やらアルゴ
> リズムを、辞書を鍛えるかのごとく書き加えて行く訳ですよ。まさに、スクリプ
> ト言語でこそ可能なんです。

壮絶な戦い (メンテナンス) の日々があってこそ、
われわれはあのような素晴しいサービスを亨受できるのですか。
とってもありがたいです。御苦労様です。
# でも、ある意味で、実状は「緑色の小人説」に近いのですね (^^;


いま作ってる blade clone では、メールヘッダから
ML名 (ruby-list) と、通し番号 (23735) を抽出するフィルタを、
あとからどんどん追加できるようになってます。procmail 的に。
# フィルタは Proc オブジェクトです。procmail より柔軟です。
# 手元では、fml 以外でも、それなりに判別できてます。

サマリ生成機構の拡張性/メンテナンス容易性が大事なんですね。
では、上の例と同様な「追加可能フィルタ式」にしてみます。

もう一つの難題は、メール本文から参照関係を抽出することです。
でも、みなさんの御意見だと [ruby-list:23735] くらいが
抽出できれば十分という感じですね。一時は「引用文に一致する
本文を持つメールが参照されている」などの解析まで考えてました (^^;

一番大事なのは、スレッドツリーとサマリ生成、とメモしときます。

--
Hideto "rubyholic" ISHIBASHI  http://www.rr.iij4u.or.jp/~hideto-i/
blade clone:  http://www.rr.iij4u.or.jp/~hideto-i/rb/yaiba/index.html