コンテンツにスキップ

データ・クラスタリング

出典: フリー百科事典『ウィキペディア（Wikipedia）』

これはこのページの過去の版です。Abionab (会話 | 投稿記録) による 2015年11月4日 (水) 17:15 （個人設定で未設定ならUTC）時点の版であり、現在の版とは大きく異なる場合があります。

(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

クラスタリング (英: clustering)、クラスタ解析（クラスタかいせき）、クラスター分析（クラスターぶんせき）は、データ解析手法（特に多変量解析手法）の一種。教師なしデータ分類手法、つまり与えられたデータを外的基準なしに自動的に分類する手法。また、そのアルゴリズム。

さまざまな手法が提案されているが、大きく分けるとデータの分類が階層的になされる階層型手法と、特定のクラスタ数に分類する非階層的手法とがある。それぞれの代表的な手法としてウォード法、K平均法などがある。

関連項目

多変量解析
データマイニング
自己組織化写像
ウォード法
K平均法: 非階層型クラスタリング手法の1つ
階層型クラスタリング
VIF（Variance Inflation Factor）: クラスタが独立であるかどうかを判定する尺度^[1]
分類 (統計学)

脚注・出典

^ Yoshifumi Okada, Takehiko Sahara, Satoru Ohgiya, Tomomasa Nagashima. “Detection of Cluster Boundary in Microarray Data by Reference to MIPS Functional Catalogue Database” (PDF). The 16th Int. Conf. on Genome Informatics, Japanese Society for Bioinformatics, Proc. of The 16th Int. Conf. on Genome Informatics, 2005/12, Tokyo, Japan. 2014年8月31日閲覧。

要約統計量

連続確率分布

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

推計統計学

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック-ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

モデル

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシン射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

線形	線形判別分析ロジスティック回帰 <! -- 名前に回帰とついていますが確率を回帰する分類手法です --> 単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法（k-means++法） DBSCAN
密度推定（英語版）	カーネル密度推定（カーネル）
その他	主成分分析独立成分分析自己組織化写像

応用

出版物

全般

その他

この項目は、数学に関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています（プロジェクト:数学／Portal:数学）。

「https://ja.wikipedia.org/w/index.php?title=データ・クラスタリング&oldid=57421659」から取得

隠しカテゴリ: