星澤といいます。
Ruby、eruby、MySQLをベースに開発したフリーのサーチエンジン
「SUZAKU(朱雀)」のバージョン2を公開しました。
下記のURLから、ダウンロードすることができます。
http://hoshizawa.no-ip.com/suzaku/
1. SUZAKUとは
SUZAKU(朱雀) は、インターネット/イントラネットを対象にした、フリーの
ロボット型サーチエンジンです。
SUZAKU には、以下のような特徴があります。
・Ruby、eruby、MySQLなどのフリーソフトをベースにしたシステムです。
・SUZAKU は、以下の機能がワンセットになっています。
・ホームページのリンクを自動的に探索し、ダウンロード&インデックス化
する機能
・キーワードに該当するホームページを検索する機能
・ブラウザによるシステムの管理機能
・ホームページのリンクの探索を、指定された同一サイト内に限定する機能
があります。これにより、特定ジャンルのホームページ群を対象とした、
独自のサーチエンジンを構築することができます。
・プラットフォームには、LinuxベースのPCサーバーを想定しています。高速
検索が可能な MySQL をデータベースに使用しており、中小規模のサーチ
エンジンであれば、十分に実用的なシステムを構築することができます。
例えば、ADSL + PCサーバー(Linux) + SUZAKU を使って、独自のサーチ
エンジンを自前のサーバー上に構築し、外部に公開することができます。
・ホームページのダウンロード&インデックス化の処理を実行中でも、
キーワードによる検索を行うことができます。
・ダウンロード先のサーバーを分散し、相手のサーバーに過度の負荷をかけ
ないようにする機能や、robots.txt による探索制限に従う機能を実装して
います。
・プログラム本体は、Ruby および eruby で記述されており、ソースは公開
されています。スクリプト言語による比較的コンパクトなシステムであり、
改造も容易です。
2. バージョン2の変更点
2005/03/09 Version 2.0
* Ruby 1.8対応。
* MySQL 4.1対応。
* 検索キーワードに数字が指定された場合の処理改善。
* Version 1では名詞のみを検索対象としていたが、Version 2ではすべての
単語を検索対象とするように変更。
* 前提とする文字コードをEUCからUTF-8に変更。
* 巡回処理のログを、巡回処理が実行される毎に別ファイルとして保存する
形式に変更(管理者モードで巡回ログを表示する際のレスポンス改善)。
---
星澤 隆 / Takashi Hoshizawa
mail: t_hoshizawa / mbg.nifty.com