トップ «前の日記(2010/02/15(Mon)) 最新 次の日記(2010/02/20(Sat))» RSS

titletitle


2010/02/16(Tue) [長年日記]

uk-icon [linux] anthyへの半角対応絵文字辞書の登録

辞書自体は、IME用の絵文字辞書のテキスト版の方を適当に持ってきてもらって、ここのperlスクリプトを使わせてもらって、辞書を変換して、loadしたら見事できた。念のため、そのスクリプトは、以下に手直しをしてコピーさせておいていただく。

#!/usr/bin/perl
 
use strict;
use warnings;
 
my @str;
 
while(<>){
    next if(/^[!\s]/);
    @str = split(/\t/);
    print join(' ', $str[0], '#T35', $str[1]), "\n";
}
 
exit;

これを、convert.plとして、IME用の顔文字辞書を変換。

% convert.pl ime_dic > ime_dic2

anthyの元の辞書を保存する。

% cd ~/.anthy
% cp private_words_default private_words_default.org

変換したIME用のをUTF-8に変換。

% nkf -wx ../ime_dic2 > ime_dic-utf8

それを、元の辞書につなげ、ダンプ。

% cat ime_dic-utf8 >> private_words_default
% anthy-dic-tool --dump > new-dic.src

ダンプしたものを、読み込ませる。

% cat new-dic.src | anthy-dic-tool --load

以上。(∩´∀`)∩ワーイ

追記:UTF-8な文字は、文字化けしてしまう様です。今開発中のUTF-8対応版に期待しましょう。