> >  ・メールの場合、References も In-Reply-To も付けてこない場合がある
 > >    ので、引用部を抽出して、マッチングをとる。
 > 私の所では Subject が Re: で始まると最も最近の「似ている」Subject
 > を持つものに繋げています。

スレッドを tree 状に抽出したい場合にはそうはいきませんよね…。

 > >  ・本文の下に、これに follow-up している記事の一覧を付ける。
 > 
 > これをすると2パス以上必要になって、処理に時間がかかるのですよね。

後から追加される記事を処理する際に、それが参照している記事の末尾に
それを加えるという方法を以前の perl 版ではやっていました (というか
MHonArc がそうしていた)。

 > なるべく頻繁にデータを更新したい巨大なメーリングリストだと処理時
 > 間っていうのは結構問題で気にかかる所です。
 > #私の所は3パス(^^;

100 件ごとに区切って処理しているので高速です。このとき前後100件を加え
ることで、スレッドが切れにくいようにしています。

 > スレッド分けですけど、DBM でデータを取っておいて、必要な部分を
 > 判断してそこだけ書き換えるようにしたら、70分かかっていた処理
 > 時間が40秒になってしまった。それにしても DBM は偉大だ。

おお、そういう手がありましたか。DBM ってどうやって使うのですか?
簡単に教えて頂けるとうれしいです。

高木 浩光@名古屋工業大学
http://www.center.nitech.ac.jp/~takagi/