データサイエンス

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ナビゲーションに移動 検索に移動

データサイエンス(英: data science、略称: DS)またはデータ科学[1][2]とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。

データサイエンスを、統計的、計算的、人間的視点から俯瞰することができよう。それぞれの視点がデータサイエンスを構成する本質的な側面であるが、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である(Blei and Smyth, 2017[3])。これまでのデータ解析における現場の知識の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる(Hernan, Hsu and Healy, 2018[4])。

データサイエンスは、はっきりとした応用の文脈をもち、超領域性の様相を呈していて、また研究成果に対しては明確な社会的説明責任が求められ、さらに、研究成果の質的保証のためには従来の座学的基準以外に質のコントロールのための追加の基準が必要とされる。データサイエンスの有効な推進のためには組織の異種混合性も重要である。これらの要件を満たす科学はギボンズらが主張するモード2科学[5]の一種として認識することが出来る。

データサイエンスで使用される手法は多岐にわたり、分野として数学統計学計算機科学情報工学パターン認識機械学習データマイニングデータベース可視化などと関係する。

データサイエンスの研究者や実践者はデータサイエンティストと呼ばれる。

データサイエンスの応用としては、生物学医学工学経済学社会学人文科学などが挙げられる。

歴史[編集]

データサイエンスという用語は古くから使われていたが、特に1960年にピーター・ナウアが使用したことで注目を集めた(注: 英語版にも1960年とあるが、出典が不明である。次に述べる1974年の書籍については、本人による公式ウェブページ[6]から確認できる)。1974年の著書"Concise Survey of Computer Methods"において、ナウアはデータ処理手法とその応用を述べる中でデータサイエンスという表現を使用した。

2010年代後半から世界的にデータサイエンティストが不足しているため、高度な知識を持たないユーザーでも解析が出来るシステムの開発が進んでいる[7]

一方、2012年、ハーバード・ビジネス・レビュー誌が「21世紀で最もカッコいい仕事」[8]と位置づけたことから「データサイエンス」という言葉はバズワードになったと見る者もいる。フォーブス誌においても、明確な定義がなく、大学院で習うビジネス分析論英語版が単に置き換えられただけだと批判された。[9]

所得の平等[編集]

先進国でも発展途上国でも、データサイエンスのスキルに優れている国々では、所得の平等が高まっている。ドメイン全体での国の平均スキル能力と、国の上位10%が保有する収入の割合との間には負の相関関係がある[10]

関連項目[編集]

[編集]

[脚注の使い方]
  1. ^ 椿広計「システム科学とデータ科学」『横幹』第14巻第1号、横断型基幹科学技術研究団体連合、2020年、 64-69頁、 doi:10.11487/trafst.14.1_64ISSN 1881-7610NAID 130007855120
  2. ^ 岡崎, 直観「データジャーナリズムとデータ科学(Data Journalism and Data Science)」『電子情報通信学会誌』第99巻第4号、2016年、 339頁、 ISSN 0913-5693NAID 40020802401
  3. ^ Smyth, Padhraic; Blei, David M. (2017-08-15). “Science and data science” (英語). Proceedings of the National Academy of Sciences 114 (33): 8689-8692. doi:10.1073/pnas.1702076114. ISSN 1091-6490. PMID 28784795. https://www.pnas.org/content/114/33/8689. 
  4. ^ Healy, Brian; Hsu, John; Hernán, Miguel A. (2018-04-28) (英語). Data science is science's second chance to get causal inference right: A classification of data science tasks. https://arxiv.org/abs/1804.10846. 
  5. ^ Baber, Zaheer; Gibbons, Michael; Limoges, Camille; Nowotny, Helga; Schwartzman, Simon; Scott, Peter; Trow, Martin (1995-11). “The New Production of Knowledge: The Dynamics of Science and Research in Contemporary Societies.”. Contemporary Sociology 24 (6): 751. doi:10.2307/2076669. ISSN 0094-3061. https://doi.org/10.2307/2076669. 
  6. ^ Peter Naur: Concise Survey of Computer Methods, 397 p. Studentlitteratur, Lund, Sweden, 1974, ISBN 91-44-07881-1
  7. ^ “NEC、業務システムにおける大規模データ予測を自動化する「予測分析自動化技術」を開発” (プレスリリース), 日本電気株式会社, (2016年12月15日), https://jpn.nec.com/press/201612/20161215_06.html 2021年7月15日閲覧。 
  8. ^ Davenport, Thomas H.; Patil, DJ (Oct 2012), Data Scientist: The Sexiest Job of the 21st Century, Harvard Business Review, https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ 
  9. ^ Data Science: What's The Half-Life Of A Buzzword?”. Forbes (2013年8月19日). 2019年6月8日閲覧。
  10. ^ Announcing the Coursera 2020 Global Skills Index” (英語). Coursera Blog (2020年7月16日). 2020年11月11日閲覧。

学習用参考図書[編集]

  •  講談社データサイエンス入門シリーズ
    • 濵田悦生:「データサイエンスの基礎」、ISBN 978-4-06-517000-7(2019年8月29日)。
    • 椎名洋、姫野哲人、保科架風:「データサイエンスのための数学」、ISBN 978-4-06-516998-8(2019年8月29日)。
    • 梅津佑太、西井龍映、上田勇祐:「スパース回帰分析とパターン認識」、ISBN 978-4-06-518620-6 (2020年2月26日)。
  • Daniela Calvetti and Erkki Somersalo: "Mathematics of Data Science: A Computational Approach to Clustering and Classification", SIAM, ISBN 978-1-611976-36-6 (2020).

外部リンク[編集]