MeCab

出典: フリー百科事典『ウィキペディア(Wikipedia)』

MeCab
開発元 工藤拓
最新版 0.97 / 2008年2月3日
プログラミング言語 C++C言語C#, Java, PerlPythonRuby
プラットフォーム クロスプラットフォーム
種別 形態素解析エンジン
ライセンス GPLLGPLBSD
公式サイト http://mecab.sourceforge.net/
  

MeCabオープンソース形態素解析エンジンで、奈良先端科学技術大学院大学出身、現Googleソフトウェアエンジニアの工藤拓[1]によって開発されている。名称は開発者の好物「和布蕪(めかぶ)」から取られた。

開発開始当初はChaSenを基にし、ChaSenTNGという名前で開発されていたが、現在はChaSenとは独立にスクラッチから開発されている。ChaSenに比べて解析精度は同程度で、解析速度は平均3-4倍速い。

品詞情報を利用した解析・推定を行うことができる。MeCabで利用できる辞書はいくつかあるが、ChaSenと同様にIPA品詞体系で構築されたIPADICが一般的に用いられている。

MeCabはGoogleが公開した大規模日本語n-gramデータの作成にも使用された[2]

[編集] 脚注

[編集] 外部リンク