石橋"rubyholic"秀仁です。

From: Wakou Aoyama <wakou / fsinet.or.jp>
Subject: [ruby-list:22913] Re: [Q] blade internal design
Date: Thu, 25 May 2000 16:10:21 +0900

> 青山です。
> 
> On Thu, 25 May 2000 14:54:25 +0900,
> Hideto ISHIBASHI <hideto-i / rr.iij4u.or.jp> wrote:
> 
> > メモリの節約にはならないですね。Dbm もだめかな?
> 
> DBM はメモリーの節約にはなります。検索も結構速いです。ただ、書き込みは
> それなりに(Hash に比較すれば、当然ながら、かなり、)遅いです。

なるほど。そうだったんですか。すみませんでした。
てっきり、ファイルを「まるごと」読み込むものだと・・・
# どうも C のモジュールは読む気にならないこと多し (^^;;

> > RDBMS まで使って、Namazu より遅いんではちょっと悲しい (^^;
> 
> 前後を追っていないので的を外しているかもしれませんが、普通に扱った場合、
> 検索の速度はデータベースよりも全文検索システムの方が高速です。

> そして、そういうキーワードの抽出、それに対するインデックスの作成、そこ
> からの元文章の参照等の工夫をしているのが全文検索システムですから、普通
> に使えば、全文検索システムの方が速いわけです。

あぅあぅ (^^;

話をもどすと、
  * ChaSen で「わかち書き」をする
  * キーワードからファイル名へのインデックスを DB に持つ
という状態から考えています。いわば、Namazu 形式のインデックスを、
DB のテーブルにするとどうなるか?という話です。

「C の namazu コマンドが Namazu 形式の index をアクセスするスピード」
よりは、「Ruby 経由の DB アクセスのスピード」が速いだろう、
という予測です。


雑談:
ところで、「分散茶筅」で遊んでみました。
dhasen.rb と dhasenc.rb を見て、
「こんなにカンタンにできていいの!?」
って思いました。メチャおもしろいです。
またいろいろな悪事を思いつく (^^;

--
Hideto "rubyholic" ISHIBASHI
http://www.rr.iij4u.or.jp/~hideto-i/
blade clone (yaiba) development:
http://www.rr.iij4u.or.jp/~hideto-i/rb/yaiba/index.html