データサイエンス
データサイエンス(data science)とは、データに関する研究を行う学問である。
データサイエンスを、統計的 (statistical)、計算的 (computational)、人間的 (human) 視点から俯瞰することができよう。それぞれの視点がデータサイエンスを構成する本質的な側面であるが、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である(Blei and Smyth, 2017[1])。これまでのデータ解析における現場の知識 (subject-matter expert knowledge; domain knowledge) の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる(Hernan, Hsu and Healy, 2018[2])。
データサイエンスは、はっきりとした応用の文脈(context of application)をもち、超領域性(transdisciplinary) の様相を呈していて、また研究成果に対しては明確な社会的説明責任 (social accountability)が求められ、さらに、研究成果の質的保証のためには従来の座学的基準以外に質のコントロールのための追加の基準(novel quality control source)が必要とされる。データサイエンスの有効な推進のためには組織の異種混合性(heterogeneity; diversity)も重要である。これらの要件を満たす科学はギボンズらが主張するモード2科学[3]の一種として認識することが出来る。
データサイエンスで使用される手法は多岐にわたり、分野として数学、統計学、計算機科学、情報工学、パターン認識、機械学習、データマイニング、データベース、可視化などと関係する。
データサイエンスの研究者や実践者はデータサイエンティストと呼ばれる。
データサイエンスの応用としては、生物学、医学、工学、経済学、社会学、人文科学などが挙げられる。
歴史[編集]
データサイエンスという用語は古くから使われていたが、特に1960年にピーター・ナウアが使用したことで注目を集めた(注: 英語版にも1960年とあるが、出典が不明である。次に述べる1974年の書籍については、本人による公式ウェブページ[4]から確認できる)。1974年の著書"Concise Survey of Computer Methods"において、ナウアはデータ処理手法とその応用を述べる中でデータサイエンスという表現を使用した。
2010年代後半から世界的にデータサイエンティストが不足しているため、高度な知識を持たないユーザーでも解析が出来るシステムの開発が進んでいる[5]。
関連項目[編集]
注[編集]
- ^ Smyth, Padhraic; Blei, David M. (2017年8月15日). “Science and data science” (英語). Proceedings of the National Academy of Sciences 114 (33): 8689–8692. doi:10.1073/pnas.1702076114. ISSN 1091-6490. PMID 28784795.
- ^ Healy, Brian; Hsu, John; Hernán, Miguel A. (2018年4月28日) (英語). Data science is science's second chance to get causal inference right: A classification of data science tasks.
- ^ Baber, Zaheer; Gibbons, Michael; Limoges, Camille; Nowotny, Helga; Schwartzman, Simon; Scott, Peter; Trow, Martin (1995年11月). “The New Production of Knowledge: The Dynamics of Science and Research in Contemporary Societies.”. Contemporary Sociology 24 (6): 751. doi:10.2307/2076669. ISSN 0094-3061.
- ^ Peter Naur: Concise Survey of Computer Methods, 397 p. Studentlitteratur, Lund, Sweden, 1974, ISBN 91-44-07881-1
- ^ NEC、業務システムにおける大規模データ予測を自動化する「予測分析自動化技術」を開発 (2016年12月15日):プレスリリース | - NEC
外部リンク[編集]
- 新村秀一、データ解析からデータ・サイエンスへ - 情報技術(統計ソフト・WWW・AI)との共生により統計知識を国民の知的共有財に - 統計数理 第45巻 第1号 特集「統計ソフトウェアの新展開2」 p.23-40
- インクィジティブ・マインド:Data Science (データサイエンス)