Lookup 1.4+mediaに同梱されている、lookup-kanji.elの拡張についての説明です。
Lookupではテキストからの検索語の切り出し、読みを検索するndkksエージェント、漢字を含む検索語から読みを検索するlookup-kanji-get-readings関数において形態素解析エンジンとしてKAKASIを利用しています。 Lookup 1.4+mediaでは、これらのコードを統合し、また、ChaSen、MeCabの様な他の形態素解析エンジンを利用しやすいように変更を加えています。
Lookup 1.4+mediaに含まれています。
利用する形態素解析エンジン名のシンボルを指定します。 現在のところ、kakasi, chasen, mecabの3種類が用意されています。 デフォルトはnilで、~/.lookup等により、lookup-kanji.elの読み込み前に明示的に指定しないとこれらの機能は有効になりません。
lookup-kanji-schemeがnon-nilの場合にtとなります。
lookup-kanji-schemeの設定によりますが、相当する別の変数が存在するはずなので、そちらを設定してください。
lookup-kanji-schemeで、kakasiを指定した場合はこれらの変数が参照されます。
KAKASIのプログラム名を文字列で指定します。 パスが通っていない場合はフルパスで指定してください。 デフォルト値は"kakasi"です。
KAKASIプロセスとの通信時に使用する文字コードを指定します。
KAKASIプロセスの起動時に指定する引数を文字列のリストで設定します。 ここで設定した内容はKAKASIを起動する際には常に参照されます。 デフォルト値はnilです。
テキストからの検索語の切り出しにKAKASIプロセスを起動する際に指定する引数を文字列のリストで設定します。 実際の引数はlookup-kanji-kakasi-program-argsとこの値から決定されます。 通常は変更する必要はありません。
lookup-kanji-get-readings関数がkakasiプロセスを起動する際に指定するオプションを文字列のリストで設定します。 実際の引数はlookup-kanji-kakasi-program-argsとこの値から決定されます。 通常は変更する必要はありません。
従来のndkks-content-formatに相当する内容を設定します。
lookup-kanji-schemeで、chasenを指定した場合はこれらの変数が参照されます。
KAKASIを利用する場合に相当する変数の説明を参照してください。
lookup-kanji-schemeで、mecabを指定した場合はこれらの変数が参照されます。
KAKASIを利用する場合に相当する変数の説明を参照してください。
例えば、Windows環境で従来通りにKAKASIを使用する場合は、~/.lookupに以下のように記述してください。
(setq lookup-kanji-scheme 'kakasi
lookup-kanji-kakasi-coding-system 'sjis)
MeCabをutf-8で利用し、特定の辞書を指定する場合は以下のように記述してください。
(setq lookup-kanji-scheme 'mecab
lookup-kanji-mecab-coding-system 'utf-8
lookup-kanji-mecab-program-args
'("-d" "/path/to/your/dic"))
検索語の切り出しを利用しない場合はlookup-use-kakasiを明示的にnilにしてください。
(setq lookup-kanji-scheme 'kakasi
lookup-use-kakasi nil)
2010/04/03 公開。