本页使用了标题或全文手工转换

数据科学

维基百科,自由的百科全书
跳到导航 跳到搜索

数据科学英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品[1]。它结合了诸多领域中的理论和技术,包括应用数学统计模式识别机器学习数据可视化数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学社会科学人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助[2]

历史[编辑]

1960年代,Peter Naur 就首次提议要用“数据科学(data science、Datalogy)”来替代“计算机科学(computer science)”,后来在上世纪九十年代中期为国际分类社团联盟所用。

2001 年,William S. Cleveland 提议将其设立为一个新的学科,吸收“计算在数据方面获取的进展”作为统计学的延伸。《数据科学(Data Science Journal )》及《The Journal of Data Science》分别于 2002 年与 2003 年发行;2005 年,国家科学委员会发表了《数字数据收集万岁:促进二十一世纪的研究与教育》,文中将数据科学家定义为“消息与计算机科学家,数据库与软件工程师及程序员,学科专家,成功管理数字数据收集的关键人物。”

2008年Jeff Hamerbatcher与DJ Patil circa分别在FACEBOOK、Linkedin领导全球第一支数据科学团队,全球首次有“数据科学”的概念出现。至此数据科学越来越被广泛流行,并应用到公卫、市场、金融、社会等各个领域。

数据科学家[编辑]

数据科学家这个职位的头衔则是 2009 年由 Natahn Yau 首次提及的,他认为数据科学家就是能够从大型数据集中析取出数据,并提供某些可供非数据专家使用的东西的人。

2009 年 1 月,数字化数据跨机构工作组发表了一份名为《驾驭科学与社会数字化数据之力》的报告,Sadkowsky 从中了解到“数据科学家”这个词,认为该词是自己所从事工作的最好描述。

数据科学家被《哈佛商业评论》称为《二十一世纪最性感的职业》[3]后,数据科学逐渐成为一个时髦术语(英语:Buzzword)。

数据科学家在美欧的需求巨大,麦肯锡公司宣布全世界上此职业人才短缺超过二十万工人[4]。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。

参考文献[编辑]