データサイエンス

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ナビゲーションに移動 検索に移動

データサイエンス(data science)とは、データに関する研究を行う学問である。

データサイエンスを、統計的 (statistical)、計算的 (computational)、人間的 (human) 視点から俯瞰することができよう。それぞれの視点がデータサイエンスを構成する本質的な側面であるが、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である(Blei and Smyth, 2017[1])。これまでのデータ解析における現場の知識 (subject-matter expert knowledge; domain knowledge) の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる(Hernan, Hsu and Healy, 2018[2])。

データサイエンスは、はっきりとした応用の文脈(context of application)をもち、超領域性(transdisciplinary) の様相を呈していて、また研究成果に対しては明確な社会的説明責任 (social accountability)が求められ、さらに、研究成果の質的保証のためには従来の座学的基準以外に質のコントロールのための追加の基準(novel quality control source)が必要とされる。データサイエンスの有効な推進のためには組織の異種混合性(heterogeneity; diversity)も重要である。これらの要件を満たす科学はギボンズらが主張するモード2科学[3]の一種として認識することが出来る。

データサイエンスで使用される手法は多岐にわたり、分野として数学統計学計算機科学情報工学パターン認識機械学習データマイニングデータベース可視化などと関係する。

データサイエンスの研究者や実践者はデータサイエンティストと呼ばれる。

データサイエンスの応用としては、生物学医学工学経済学社会学人文科学などが挙げられる。

歴史[編集]

データサイエンスという用語は古くから使われていたが、特に1960年にピーター・ナウアが使用したことで注目を集めた(注: 英語版にも1960年とあるが、出典が不明である。次に述べる1974年の書籍については、本人による公式ウェブページ[4]から確認できる)。1974年の著書"Concise Survey of Computer Methods"において、ナウアはデータ処理手法とその応用を述べる中でデータサイエンスという表現を使用した。

2010年代後半から世界的にデータサイエンティストが不足しているため、高度な知識を持たないユーザーでも解析が出来るシステムの開発が進んでいる[5]

関連項目[編集]

[編集]

[ヘルプ]

外部リンク[編集]