MeCab
出典: フリー百科事典『ウィキペディア(Wikipedia)』
| MeCab | |
|---|---|
| 開発元 | 工藤拓 |
| 最新版 | 0.97 / 2008年2月3日 |
| プログラミング言語 | C++、C言語、C#, Java, Perl、Python、Ruby |
| プラットフォーム | クロスプラットフォーム |
| 種別 | 形態素解析エンジン |
| ライセンス | GPL、LGPL、BSD |
| 公式サイト | http://mecab.sourceforge.net/ |
MeCabはオープンソースの形態素解析エンジンで、奈良先端科学技術大学院大学出身、現Googleソフトウェアエンジニアの工藤拓[1]によって開発されている。名称は開発者の好物「和布蕪(めかぶ)」から取られた。
開発開始当初はChaSenを基にし、ChaSenTNGという名前で開発されていたが、現在はChaSenとは独立にスクラッチから開発されている。ChaSenに比べて解析精度は同程度で、解析速度は平均3-4倍速い。
品詞情報を利用した解析・推定を行うことができる。MeCabで利用できる辞書はいくつかあるが、ChaSenと同様にIPA品詞体系で構築されたIPADICが一般的に用いられている。
MeCabはGoogleが公開した大規模日本語n-gramデータの作成にも使用された[2]。
[編集] 脚注
- ^ "「ググる」の精度を高めるために必要なもの - @IT自分戦略研究所". ITmedia (2006-03-15). 2009-04-09 閲覧。
- ^ "Google Japan Blog: 大規模日本語 n-gram データの公開". Google (2007-11-01). 2009-04-09 閲覧。

