2010/07/19

オープンソースの全文検索エンジン Fess を導入してみた

情報システムにつきものの大きな勘違いは「システムを導入する」という事が大事なのではなくて、「システムを運用する」という本来の目的を見落としがち。
自分も多くのオープンソースの検索エンジンを試してみましたが、なんだか検索エンジンを導入することが目的みたいになってきてなんだかなぁ〜と。

そんなときに”5分で構築可能な全文検索エンジン”というのを見て、半信半疑で導入してみました。
全文検索システム: Fess - オープンソース全文検索サーバー - Fess 概要

・本当に5分かからずに導入できてビックリ!
・即座に利用出来てビックリ!
・現在も活発に開発が続けられている!

これに尽きます。

実際にUbuntu Server 10.04 に導入してみました。
実行環境としてJavaが必要なので前もってJavaを導入…なのですが、ここで手間取ってしまいました。
今回はOpenJDKの方をインストール。

$ sudo apt-get install openjdk-6-jdk

あとはチュートリアル(全文検索システム: Fess - Fess のインストール)に書かれているようにダウンロードして解凍してインストールするだけ。
実行した時点ですぐに利用可能になります。

ね、簡単なんですよ!

Webクローラも内蔵されているので検索したいURLを指定してやるとクローリング出来ますし、Web以外にもローカルファイル・Samba等のファイルサーバのファイルも検索してくれます。
設定も簡単で、ホント至れり尽くせり。
(ローカルファイルを別マシンから検索する場合はそのファイルにHTTPでアクセスできるようにしてあげる必要があります。)

試しに透明テキスト付きPDFを検索対象にした場合、問題なく検索結果に反映してくれました。
もちろん日本語ファイルも問題ありません。

すぐに使える検索エンジンということで覚えておいて損は無いはず。
ローカルでちょっとした検索エンジンが欲しい場合など威力を発揮すると思います。