MeCab

MeCabはオープンソースの形態素解析エンジンで、奈良先端科学技術大学院大学出身、現GoogleソフトウェアエンジニアでGoogle 日本語入力開発者の一人である工藤拓^[1]^[2]によって開発されている。名称は開発者の好物「和布蕪（めかぶ）」から取られた。

開発開始当初はChaSenを基にし、ChaSenTNGという名前で開発されていたが、現在はChaSenとは独立にスクラッチから開発されている。ChaSenに比べて解析精度は同程度で、解析速度は平均3-4倍速い。

品詞情報を利用した解析・推定を行うことができる。MeCabで利用できる辞書はいくつかあるが、ChaSenと同様にIPA品詞体系で構築されたIPADICが一般的に用いられている。

MeCabはGoogleが公開した大規模日本語n-gramデータの作成にも使用された^[3]。

Mac OS X v10.5及びv10.6のSpotlightやiPhone OS 2.1以降とOS X Yosemite以降の日本語入力にも利用されている^[4]^[5]^[6]。

脚注[編集]

^ “「ググる」の精度を高めるために必要なもの－＠IT自分戦略研究所”. ITmedia (2006年3月15日). 2009年4月9日閲覧。
^ “思いどおりの日本語入力 - Google 日本語入力”. Google (2009年12月3日). 2009年12月3日閲覧。
^ “Google Japan Blog: 大規模日本語 n-gram データの公開”. Google (2007年11月1日). 2009年4月9日閲覧。
^ “大規模テキスト処理を支える形態素解析技術（工藤拓氏・Google）” (2009年12月3日). 2009年12月3日閲覧。
^ “iPhoneの仮名漢字変換はMeCabを利用” (2009年12月3日). 2008年9月18日時点のオリジナルよりアーカイブ。2009年12月3日閲覧。
^ “「日本語入力」の基本”. MacFan. 2020年5月30日閲覧。

ポータル FLOSS