データ・クラスタリング
クラスタリング (英: clustering)、クラスタ解析(クラスタかいせき)、クラスター分析(クラスターぶんせき)は、データ解析手法(特に多変量解析手法)の一種。教師なしデータ分類手法、つまり与えられたデータを外的基準なしに自動的に分類する手法。また、そのアルゴリズム。
さまざまな手法が提案されているが、大きく分けるとデータの分類が階層的になされる階層型手法と、特定のクラスタ数に分類する非階層的手法とがある。それぞれの代表的な手法としてウォード法、K平均法などがある。
関連項目
- 多変量解析
- データマイニング
- 自己組織化写像
- ウォード法
- K平均法: 非階層型クラスタリング手法の1つ
- 階層型クラスタリング
- VIF(Variance Inflation Factor): クラスタが独立であるかどうかを判定する尺度[1]
- 分類 (統計学)
脚注・出典
- ^ Yoshifumi Okada, Takehiko Sahara, Satoru Ohgiya, Tomomasa Nagashima. “Detection of Cluster Boundary in Microarray Data by Reference to MIPS Functional Catalogue Database” (PDF). The 16th Int. Conf. on Genome Informatics, Japanese Society for Bioinformatics, Proc. of The 16th Int. Conf. on Genome Informatics, 2005/12, Tokyo, Japan. 2014年8月31日閲覧。