> > ・メールの場合、References も In-Reply-To も付けてこない場合がある > > ので、引用部を抽出して、マッチングをとる。 > 私の所では Subject が Re: で始まると最も最近の「似ている」Subject > を持つものに繋げています。 スレッドを tree 状に抽出したい場合にはそうはいきませんよね…。 > > ・本文の下に、これに follow-up している記事の一覧を付ける。 > > これをすると2パス以上必要になって、処理に時間がかかるのですよね。 後から追加される記事を処理する際に、それが参照している記事の末尾に それを加えるという方法を以前の perl 版ではやっていました (というか MHonArc がそうしていた)。 > なるべく頻繁にデータを更新したい巨大なメーリングリストだと処理時 > 間っていうのは結構問題で気にかかる所です。 > #私の所は3パス(^^; 100 件ごとに区切って処理しているので高速です。このとき前後100件を加え ることで、スレッドが切れにくいようにしています。 > スレッド分けですけど、DBM でデータを取っておいて、必要な部分を > 判断してそこだけ書き換えるようにしたら、70分かかっていた処理 > 時間が40秒になってしまった。それにしても DBM は偉大だ。 おお、そういう手がありましたか。DBM ってどうやって使うのですか? 簡単に教えて頂けるとうれしいです。 高木 浩光@名古屋工業大学 http://www.center.nitech.ac.jp/~takagi/