2010/02/16(Tue) [長年日記]
[linux] anthyへの半角対応絵文字辞書の登録
辞書自体は、IME用の絵文字辞書のテキスト版の方を適当に持ってきてもらって、ここのperlスクリプトを使わせてもらって、辞書を変換して、loadしたら見事できた。念のため、そのスクリプトは、以下に手直しをしてコピーさせておいていただく。
#!/usr/bin/perl use strict; use warnings; my @str; while(<>){ next if(/^[!\s]/); @str = split(/\t/); print join(' ', $str[0], '#T35', $str[1]), "\n"; } exit;
これを、convert.plとして、IME用の顔文字辞書を変換。
% convert.pl ime_dic > ime_dic2
anthyの元の辞書を保存する。
% cd ~/.anthy % cp private_words_default private_words_default.org
変換したIME用のをUTF-8に変換。
% nkf -wx ../ime_dic2 > ime_dic-utf8
それを、元の辞書につなげ、ダンプ。
% cat ime_dic-utf8 >> private_words_default % anthy-dic-tool --dump > new-dic.src
ダンプしたものを、読み込ませる。
% cat new-dic.src | anthy-dic-tool --load
以上。(∩´∀`)∩ワーイ
追記:UTF-8な文字は、文字化けしてしまう様です。今開発中のUTF-8対応版に期待しましょう。
[ツッコミを入れる]