トップ «前の日記(2007-04-20(金)) 最新 次の日記(2007-04-28(土))»

hΛlの使ってるアプリ関係のメモ

>>hΛlの女好き日記

2007-04-27(金)

Gnus で 全文検索システム Hyper Estraier を使う(Windows編)

MLでも流れた情報ですが、Windowsだとデフォルトの設定のままでは、上手くいかなかったので、それを修整したときの、ほんのちょっとしたメモです。

まずは、gnus-namazu.elが元になっている有志の方謹製のコードをいただいてきて、それをパスの通ったところに置きます。次は、インデックス作り。私の使ってる Hyper Estraier は

$  estcmd version
Hyper Estraier 1.4.9 on Windows (Cygwin)
Meadow の日本語環境設定は
(set-default-coding-systems 'japanese-shift-jis-dos)
ですが
find /home/hal/News -type f | egrep '(amazon|url_memo|users|yahoobooks)/[0-9]+$' |
 /usr/local/bin/estcmd gather -pc CP932 -cl -fm -cm /home/hal/casket -
こんな感じで、インデキシングしたいフォルダを指定して回して、上手くいってるみたいです(Lookup から estcmd するする際、-pc CP932 を入れたら上手くいったんで、こちらも修整)。ただ
>Windowsのパス正規化でバグってた。
>gnus-est/normalize-resultsの14行目、insert文の前あたりで
>(goto-char (point-at-bol))みたいなのを
>入れるとちゃんと動いた。
という情報があって、たしかに、その通りにしないと上手くいきませんでした。そして、インデックスができたら検索の設定なんですが、customize group gnus-est して、以下のようにすると上手くいきました。ここが、適切じゃないと、日本語だけ検索できない、特定の単語が検索できない、スペースが入ると検索できない等いろいろと不都合がでてくるようです。

hyperestraierの設定1

hyperestraierの設定2

あとは、メールの削除を繰り返すうちに、インデックスと実際のファイルの不整合が溜ってきたり、なんだかおかしくなっちゃったりしたら、管理コマンド(estcmd purge / estcmd optimize / estcmd repair)を叩いてみるとか(公式サイト参照)、インデックスを作成するシェル・スクリプトに estcmd gather(インデックス更新) してから、estcmd purge(消去したファイルのデータを削除) するように書いておくとか、Gnus でグループを出るときのフックに引っ掛けて、登録、削除の関数を呼びだすとかするといいんでしょうね。

以上、本当にメモ書き程度ですが、必要な人のお役に立てれば幸いです。現在、Gnus での検索は、インデキシングも検索そのものも体感スピードがかなり増して、非常に快適です。インデックスの更新は、約8,000件分を2分ぐらいでできてます。フィールド検索もできるしなァ。あと、utf-8なメールの中身を検索できるのが大きいかな。Plagger でとってきてるものもサクサク検索できます。うーん、快適。

yahoobooksランキングの生メール yahoobooksランキングの検索結果画面

Tags: Meadow Gnus
[]

最近の日記
最近のツッコミ
最近のtrackback
  1. エンジニアでありたい人の日記:[misc] sitema.. (2008-04-23(水) 21:56)

  

トップ «前の日記(2007-04-20(金)) 最新 次の日記(2007-04-28(土))»