Mecab0.97 ユーザ辞書の作成方法

適当なディレクトリに移動

cd /home/xxx/dic

辞書ファイルを設置

vi category_dic.csv

単語を追加
※活用しない単語のフォーマットは下記の通り

ビジネスシューズ,1285,1285,-800,ファッションカテゴリー,靴,ビジネスシューズ,ビジネスシューズ,2,1

辞書のコンパイル

/usr/libexec/mecab/mecab-dict-index -d/usr/lib/mecab/dic/ipadic -u /home/xxx/dic/category_dic.dic -f utf-8 -t utf-8 /home/xxx/dic/category_dic.csv

mecabrcをユーザルートにコピー

cp /usr/etc/mecabrc ~/.mecabrc

.mecabrcでユーザ辞書を指定

userdic = /home/xxx/dic/category_dic.dic

update : 2008年8月11日 03:26 PM

Categories

Apache
インストール
セキュリティ
ベーシック認証
c++
XML
文字コード
Linux
時刻
Mecab
PHP
ユーザ辞書
PHP
Mecab
Subversion
mac

latest entries

2008/08/11
PHP Mecab Extensionのインストール方法
まずはインストール # cd /usr/local/src # wget htt...

2008/08/11
Mecab0.97 ユーザ辞書の作成方法
適当なディレクトリに移動 cd /home/xxx/dic 辞書ファイルを設置 ...

2008/06/27
Apache2.2.9 インストール
ダウンロード&インストール #wget http://ftp.kddilabs....

2008/06/14
Apache HTTPヘッダ情報の隠匿
httpd.confの編集 Server: Apache/2.0.52 (Cen...

2008/06/09
Mac OSXでSubversion + SSH公開鍵認証の設定
Windowsには、TortoiseSVNという定番のGUIがあるがMacはSC...

2008/06/09
ベーシック認証(Apache編)
Apacheでのベーシック認証設定のおさらい まずは、httpd.confの設...

2008/06/01
Linux NTPで時刻合わせ
LinuxでNTPを利用した時刻合わせは「ntpdate」コマンドで行います。...

2008/05/27
C++ 文字コード関連ライブラリ icu4c
実際にはNKFをシェルスクリプトで実行する方が楽ちんだったので、「icu4c」は...

2008/05/27
C++ XMLパーサー Xerces-C++のインストール
C++でXMLをパースするにはXerces-C++が定番らしいので、早速インスト...

2008/05/24
祝 hi+da+ma+ri 開設 !!
ようやく自分のブログを始める事ができました。これから、インターネットに関するニュ...

 

Copyright © 2008 hidamari.biz All Rights Reserved.