xdoc2txt(2.00)によるOfficeファイルのUnicode検索

嬉しいことに、xdoc2txtのバージョンアップにより
Unicodeによるテキスト出力機能が追加されました。
※2012/12/01現在、ベータ版(2.00 beta1)が公開されています。
 試験運用中とのことですが、hnx8が動作確認したかぎりでは
 まったく問題なく動くようです。

HNXgrepのOfficeファイル検索機能も、このxdoc2txtを
利用させていただくことにより、実現しています。
Ver2.xx系のxdoc2txtを利用し、オプション設定を行うことで、
ShiftJISなどでは表現不能な(Unicodeでしか表現できない)文字を含む
キーワードでOfficeファイルを検索しても、問題なく検索できるように
なります。

設定方法を以下に記します。
※この記事は旧バージョンのHNXgrepでの設定方法です。
Ver1.2以降のHNXgrepでは、Ver2.0系のxdoc2txtを使用していれば、特に変換オプション等を指定せずともUnicodeで検索できるようになっており、また検索対象拡張子の指定やiFilter機能も利用できるようになりました。
新バージョンでのxdoc2txtの設定に関しては、こちらの記事を参照してください。

(1)xdoc2txt(Ver2.xx)を下記Webページからダウンロードする
  http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

(2)ダウンロードしたxdoc2txt(Ver2.xx)を解凍し、
  xdoc2txt.exeを、HNXgrep.exeと同じフォルダに配置する
  (もしくは、別のフォルダでもかまいません)

(3)HNXgrepの設定ダイアログで、
  xdoc2txtの「変換オプション」に、
  「-x -g=0 -u」と、オプション「-u」を指定する
  

※Ver1.xxのxdoc2txt.exeでは、オプション「-u」をつけると
 変換処理が動かなくなり、検索できなくなります。
 必ずVer2.xxのxdoc2txtを使用してください。


長らくほったらかしにしてきたHNXgrepですが、久々に
バージョンアップしようというモチベーションが湧いてきました。
(自分が使う分には、多少見た目の不備等があろうとも
 HNXgrepのVer1.0.6.0程度の機能があれば実用上不便がなくて、
 いまのままでいいか・・という気になっていました・・・)
年末あたりまでには本腰を入れたいと思います。
・・・とか書いて宣言倒れになったらどうしよう。
→無事バージョンアップし、Ver1.2.x/Ver1.3.xとしてリリースされました。
この記事を読んでHNXgrepに興味を持たれた方は、最新バージョンをお試しください。