久しぶりにPlaggerでなんかやってみた
前回書いたとおり、Text::MeCab と Algorithm::NaiveBayes を利用して Auto Tagging する Plagger のプラグインを作成してみました。もちろん、Text::MeCab と Algorithm::NaiveBayes モジュールが必要です。
Plagger::Plugin::Filter::AutoTagging.pm
Perl のコード自体書いたのは久しぶりなので、あまり自信はないです。途中単純なミスにハマりながらもなんとか作りました。なにかおかしなところがあったら、是非ご指摘いただけると幸いです。
ちなみにしばらくの間、某所のDebien サーバで
- module: Filter::AutoTagging
config:
mecab_charset: utf-8
db: <DB_PATH>
generate_tags: 3
guess_tags: 3
threshold: 0.8
training: 1
とかやってテストをまわしていましたが、精度はイマイチです。generate_tagsでのキーワードの抽出方法はもう少しきちんと考えた方がいいかもしれない?あと、MeCab辞書が utf-8 の環境でしかテストしていません。
ちなみに config 項目の詳しい説明はこちら
6 月 18th, 2008 at 15:50:05
AutoTaggingのソースをみてdiffを書いてみました。
http://subtech.g.hatena.ne.jp/otsune/20080618/AutoTagging
6 月 19th, 2008 at 15:56:38
Plagger::Plugin::Filter::AutoTaggingをアップデート
Plagger::Plugin::Filter::AutoTagging を少し改変しました。
→ AutoTagging.pm
変更内容は以下の通り。
otsune さんの diff を適用&ちょっと修正 (db省略時処理とMeCab用Encode処理のパフォーマンス改善…