テキストマイニング

テキストマイニング（英: text mining）は、文字列を対象としたデータマイニングのことである。通常の文章からなるデータを単語や文節で区切り、それらの出現の頻度や共出現の相関、出現傾向、時系列などを解析することで有用な情報を取り出す、テキストデータの分析方法である^[1]。

テキストデータの多くは形式が定まっておらず、また日本語は英語などと比べて単語の境界判別の必要性（→わかち書き）や文法ゆらぎが大きい点において形態素解析が困難であったが、自然言語処理の発展により実用的な水準の分析が可能となった。テキストマイニングの対象としては、顧客からのアンケートの回答やコールセンターに寄せられる質問や意見、電子掲示板やメーリングリストに蓄積されたテキストデータなどがある^[2]。

テキストマイニングの効果

テキストマイニングは、言葉的にはデータマイニングと似ているが、その効果は異なる。データマイニングが顧客個人の購買傾向を分析するなどの目的で行われるのに対し、テキストマイニングは顧客個人の特性よりも提供側の状態を把握する面において威力を発揮する。例えば商品の評価や顧客サービスの問題点などを把握することができる^[3]。

ソフトウェアの例

脚注

[脚注の使い方]

外部リンク

テキストマイニングとは【text mining】 - 意味/解説/説明/定義： IT用語辞典
テキストマイニング - @IT情報マネジメント用語事典
日本大百科全書(ニッポニカ)『テキストマイニング』 - コトバンク

この項目は、コンピュータに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（PJ:コンピュータ/P:コンピュータ）。

[-TkKyEXmWZQC-1] 林俊克 (2002). Excelで学ぶテキストマイニング入門. オーム社. p. 2. ISBN 9784274064937

[t5NDDwAAQBAJ-2] 山内長承 (2017). Pythonによるテキストマイニング入門. オーム社. p. 2. ISBN 9784274221415

[j2lyDwAAQBAJ-3] 小林雄一郎 (2018). Rによるやさしいテキストマイニング. オーム社. p. 7. ISBN 9784274222771

[1]

[2]

[3]