大数据时代:生活、工作与思维的大变革.pdf

大数据时代:生活、工作与思维的大变革.pdf
 

书籍描述

编辑推荐
《大数据时代:生活、工作与思维的大变革》为迄今为止全世界最好的一本大数据专著。作者维克托•迈尔-舍恩伯格,大数据时代的预言家,《科学》《自然》等著名学术期刊最推崇的互联网研究者之一,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历。
《大数据时代:生活、工作与思维的大变革》的译者系我国最年轻有为的大数据专家,电子科技大学互联网科学中心主任、教授、博士生导师周涛教授。这位27岁的天才型教授,数年来一直带领我国学术界在大数据研究上向国际一流看齐。
宽带资本董事长田溯宁,微软全球资深副总裁、微软亚太研发集团主席张亚勤,中国互联网发展重要参与者、知名IT评论人谢文,北京云基地首席顾问、云华时代智能科技有限公司董事长郭昕,上海交通大学长江学者特聘教授、致远学院常务副院长汪小帆,中国传媒大学教授沈浩,清华大学计算机科学与技术系副主任、教授陈文光,中国社科院信息化研究中心秘书长、《互联网周刊》主编姜奇平,《财经》杂志执行主编、《哈佛商业评论》中文版主编何刚、微软亚洲研究院主管研究员谢幸等重磅推荐。
大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

名人推荐
维克托•迈尔-舍恩伯格教授这本《大数据时代》,是我看到的最好的大数据著作,不仅对于产业实践者,还是对于政府和公众机构,都是非常具有价值的。只要我们以开放的心态、创新的勇气拥抱“大数据时代”,就一定会抓住历史赋予中国创新的机会。
——田溯宁 宽带资本董事长
正如迈尔-舍恩伯格教授认为的,大数据要求人们改变对精确性的苛求,转而追求混杂性;要求人们改变对因果关系的追问,转而追求相关关系。这种思维的转变将是革命性的,如果企业不能认识到这一思维方式转变的重要性和迫切性,将会面临 “数据鸿沟”的挑战。
——张亚勤 微软全球资深副总裁,微软亚太研发集团主席
过去几年,在大数据方面我读过十几本书、上百篇论文和文章。相对而言,维克托的《大数据时代》是迄今为止我读过的最好的一本专著,中英文都算上。
——谢文 中国互联网发展的重要参与者,知名IT评论人
大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。第二,大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。第三,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。大数据不仅仅是一门技术,更是一种全新的商业模式,它与云计算共同构成了下一代经济的生态系统。一切皆信息。
——郭昕 北京云基地首席顾问,云华时代智能科技有限公司董事长
随着大数据热潮的不断升温,相信今后几年会有更多以大数据为主题的著作问世。这本先河之作用各种案例生动阐述了大数据所带来的变革。你可以不同意书中的某些观点,但是大数据所带来的变革已经开始发生并将继续深入。我们需要共同面临的挑战是:越来越大的数据如何才能让世界变得越来越美丽?
——汪小帆 上海交通大学长江学者特聘教授,致远学院常务副院长
我们生活在社会中,就不得不同数据打交道。我们也是数据的一部分,不论我们想不想与大数据牵扯到一起,数据都会找到我们,覆盖我们。大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在大数据中的模式、趋势和相关性,揭示社会现象与社会发展规律,以及可能的商业应用前景,都需要我们拥有更好的数据洞察力。
——沈浩 中国传媒大学教授
大数据无疑是当前的热门话题,对产业界、学术界和教育界都正在产生巨大的影响。然而到底什么是大数据,大数据到底和过去的数据分析技术有何联系和不同?这又是一个各执一词的问题。本书的角度非常独特而深入,提出了“不是随机样本,而是所有数据”“不是精确性,而是混杂性”“不是因果关系,而是相关关系”这样三个关于大数据的鲜明观点,并引用很多例子加以说明,非常值得仔细研读和思考。
——陈文光 清华大学计算机科学与技术系副主任、教授
维克托认为大数据将使人们从对因果关系的渴求转向关注相关关系,这是对人类关系结构变革的深刻洞察。因果关系通向金字塔的建立,相关关系通向扁平化的实现。大数据由此将带来对人的重新认识,不是在阿波罗神庙,而是在小世界网络中“认识你自己”。
——姜奇平 中国社科院信息化研究中心秘书长,《互联网周刊》主编
大数据时代已经来临,先知、先觉、先行和先试者既可能率先受益,也可能率先迷失,关键在于能否看清创新方向并找到应用模式。《大数据时代》这本书最突出的价值,就在于其对商业实践的跟踪与建议。即使作者的一些预见在未来也许会落空,其大胆探索大数据商业应用的努力,仍然值得鼓励。
——何刚 《财经》杂志执行主编,《哈佛商业评论》中文版主编
在人们还在沉浸于讨论多大规模的数据才是“大数据”的时候,《大数据时代》这本书就“大数据时代”将对人类社会带来的革命性影响进行了深刻的分析。正如书中所述,“大数据”的本质是思维、商业和管理领域前所未有的大变革。领衔翻译本书的周涛教授是国内大数据和网络科学领域的青年领军人物,相信对不同层次的读者都会裨益匪浅。
——谢幸 微软亚洲研究院主管研究员

媒体推荐
田溯宁
宽带资本董事长
《大数据时代》是我看到的最好的大数据著作,不管对于产业实践者,还是对于政府和公众机构,都是非常具有价值的。只要我们以开放的心态创新的勇气拥抱。大数据时代”,就一定会抓住历史赋予中国创新的机会。
张亚勤
微软全球资深副总裁,微软亚太研发集团主席
正如迈尔一舍恩伯格教授认为的,大数据要求人们改变对精确性的苛求,转而追求混杂性,要求人们改变对因果关系的追问,转而追求相关关系。这种思维的转变将是革命性的,如果企业不能认识到这一思维方式转变的重要性和迫切性,将会面临”数据鸿沟的挑战。
谢文
中国互联网发展的重要参与者,知名lT评论人
过去几年,在大数据方面我读过十几本书上百篇论文和文章。相对而言,维克托的(大数据时代)是迄今为止我读过的最好的一本专著,中英文都算上。此书的一大贡献就是在大数据方兴未艾众说纷纭的时刻,进一步阐述和厘清了大数据的基本概念和特点,这对许多以为大数据就是“数据大“的人来说很有帮助。
郭昕
北京云基地首席顾问云华时代智能科技有限公司董事长
大数据正把我们变成新的物种。首先,大数据改变了我们的思维方式,让我们从因果关系的串联思维变成了相关关系的并联思维。其次大数据改变了我们的生产方式,物质产品的生产退居次位,信息产品的加工将成为主要的生产活动。最后,大数据改变了我们的生活方式,我们的精神世界和物质世界都将构建在大数据之上。大数据不仅仅是一门技术,更是一种全新的商业模式,它与云计算共同构成了下一代经济的生态系统。一切皆信息。
汪小帆
上海交通大学长江学者特聘教授致远学院常务副院长
随着大数据热潮的不断升温相信今后几年会有更多以大数据为主题的著作问世。《大数据时代)这本先河之作用各种案例生动阐述了大数据所带来的变革。你可以不同意书中的某些观点,但是大数据所带来的变革已经开始发生并将继续深入。我们需要共同面临的挑战是:越来越大的数据如何才能让世界变得越来越美丽7
陈文光
清华大学计算机科学与技术系副主任、教授
大数据无疑是当前的热门话题,对产业界、学术界和教育界都正在产生巨大的影响。然而到底什么是大数据,大数据究竟和过去的数据分析技术有何联系和不同,这又是一个各执一词的问题。本书的角度非常独特而深人,提出了。不是随机样本,而是全体数据 ”不是精确性,而是混杂性”。不是因果关系,而是相关关系。这样三个关于大数据的鲜明观点并引用很多例子加以说明,非常值得仔细研读和思考。
沈浩 中国传媒大学教授
我们生活在社会中,就不得不同数据打交道。我们也是数据的一部分,不论我们想不想与大数据牵扯到 起,数据都会找到我们,覆盖我们。大数据时代已经来临,如何从海量数据中发现知识,寻找隐藏在大数据中的模式趋势和相关性,揭示社会现象与社会发展规律,以及可能的商业应用前景,都需要我们拥有更好的数据洞察力。
姜奇平
中国社科院信息化研究中心秘书长,《互联网周刊》主编
维克托认为大数据将使人们从对因果关系的渴求转向关注相关关系,这是对人类关系结构变革的深刻洞察。因果关系通向金字塔的建立,相关关系通向扁平化的实现。大数据由此将带来对人的重新认识,不是在阿波罗神庙,而是在小世界网络中“认识你自己”。
何刚
《财经》杂志执行主编,《哈佛商业评论》中文版主编
大数据时代已经来临先知 先觉先行和先试者既可能率先受益,也可能率先迷失,关键在于能否看清创新方向并找到应用模式。本书最突出的价值,就在于其对商业实践的跟踪与建议。即使作者的些预见在未来也许会落空,其大胆探索大数据商业应用的努力,仍然值得鼓励。
谢幸
微软亚洲研究院主管研究员
当人们还在沉浸于讨论多大规模的数据才是。大数据“时,本书就”大数据时代将对人类社会带来的革命性影响进行了深刻的分析。正如书中所述,“大数据的本质是思维、商业和管理领域前所未有的大变革。领衔翻译本书的周涛教授是国内大数据和网络科学领域的青年领军人物,相信对不同层次的读者都会裨益匪浅。

作者简介
作者:(英国)维克托•迈尔-舍恩伯格(Viktor Mayer-Schönberger) (英国)肯尼斯•库克耶(Kenneth Cukier) 译者:盛杨燕 周涛

维克托•迈尔-舍恩伯格(Viktor Mayer-Schönberger),被誉为“大数据时代的预言家”,也是最受人尊敬的权威发言人之一。现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,新加坡国立大学信息政策研究中心主任。一百多篇论文公开发表在《科学》《自然》等著名学术期刊上。
备受众多世界知名企业、机构和国家政府高层信赖的信息权威与智囊。他的咨询客户包括微软、惠普和IBM等全球顶级企业;他是欧盟互联网官方政策背后真正的制定者与参与者,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问;还先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。他所著的《删除》一书,获得美国政治科学协会颁发的“唐•K•普赖斯奖”,以及媒介环境学会颁发的“马歇尔•麦克卢汉奖”。
肯尼斯•库克耶(Kenneth Cukier),《经济学人》数据编辑,曾任职于《华尔街日报》(亚洲版)和《国际先驱论坛报》。他是美国外交关系协会成员,CNN、BBC和NPR的定期商业和技术评论员之一。
周涛,电子科技大学互联网科学中心主任、教授、博士生导师。发表SCI论文150余篇、领域一流期刊90余篇,SCI引用超过2600次,H指数26,Google引用超过6000次。第五届中国青少年科技创新奖和第十二届中国青年科技奖得主。

目录
推荐序一拥抱“大数据时代”
宽带资本董事长田溯宁
推荐序二实实在在大数据
中国互联网发展的重要参与者,知名IT评论人谢文
译者序在路上·晃晃悠悠
电子科技大学教授,互联网科学中心主任周涛
引言一场生活、工作与思维的大变革
大数据,变革公共卫生
大数据,变革商业
大数据,变革思维
大数据,开启重大的时代转型
预测,大数据的核心
大数据,大挑战
第一部分大数据时代的思维变革
第1章更多:不是随机样本,而是全体数据
让数据“发声”
小数据时代的随机采样,最少的数据获得最多的信息
全数据模式,样本=总体
第2章更杂:不是精确性,而是混杂性
允许不精确
大数据的简单算法比小数据的复杂算法更有效
纷繁的数据越多越好
混杂性,不是竭力避免,而是标准途径
新的数据库设计的诞生
第3章更好:不是因果关系,而是相关关系
关联物,预测的关键
“是什么”,而不是“为什么”
改变,从操作方式开始
大数据,改变人类探索世界的方法
第二部分大数据时代的商业变革
第4章数据化:一切皆可“量化”
数据,从最不可能的地方提取出来
数据化,不是数字化
量化一切,数据化的核心
当文字变成数据
当方位变成数据
当沟通成为数据
一切事物的数据化
第5章价值:“取之不尽,用之不竭”的数据创新
数据创新1:数据的再利用
数据创新2:重组数据
数据创新3:可扩展数据
数据创新4:数据的折旧值
数据创新5:数据废气
数据创新6:开放数据
给数据估值
第6章角色定位:数据、技术与思维的三足鼎立
大数据价值链的3大构成
大数据掌控公司
大数据技术公司
大数据思维公司和个人
全新的数据中间商
专家的消亡与数据科学家的崛起
大数据,决定企业的竞争力
第三部分大数据时代的管理变革
第7章风险:让数据主宰一切的隐忧
无处不在的“第三只眼”
我们的隐私被二次利用了
预测与惩罚,不是因为所做,而是因为“将做”
数据独裁
挣脱大数据的困境
第8章掌控:责任与自由并举的信息管理
管理变革1:个人隐私保护,从个人许可到让数据使用者承担责任
管理变革2:个人动因VS预测分析
管理变革3:击碎黑盒子,大数据程序员的崛起
管理变革4:反数据垄断大亨
结语正在发生的未来

序言
推荐序一
拥抱“大数据时代”
宽带资本董事长 田溯宁
从硅谷到北京,大数据的话题正在被传播。随着智能手机以及“可佩带”计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。以此为基础,“反馈经济”(feedback economy)等新经济、新商业模式也正在开始形成。维克托•迈尔-舍恩伯格教授这本《大数据时代》,是我看到的最好的大数据著作,不管对于产业实践者,还是对于政府和公众机构,都是非常具有价值的。
如今,一个大规模生产、分享和应用数据的时代正在开启。正如维克托教授所说,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。而发掘数据价值、征服数据海洋的“动力”就是云计算。互联网时代,尤其是社交网络、电子商务与移动通信把人类社会带入了一个以“PB”(1024TB)为单位的结构与非结构数据信息的新时代。在云计算出现之前,传统的计算机是无法处理如此量大、并且不规则的“非结构数据”的。
以云计算为基础的信息存储、分享和挖掘手段,可以便宜、有效地将这些大量、高速、多变化的终端数据存储下来,并随时进行分析与计算。大数据与云计算是一个问题的两面:一个是问题,一个是解决问题的方法。通过云计算对大数据进行分析、预测,会使得决策更为精准,释放出更多数据的隐藏价值。数据,这个21世纪人类探索的新边疆,正在被云计算发现、征服。
《大数据时代》列举了众多在公共卫生、商业服务领域大数据变革的例子。一旦“不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系”,“思维转变过来,数据就能被巧妙地用来激发新产品和新型服务”。数据正成为巨大的经济资产,成为新世纪的矿产与石油,将带来全新的创业方向、商业模式和投资机会。
庞大的人群和应用市场,复杂性高、充满变化,使得中国成为世界上最复杂的大数据国家。解决这种由大规模数据引发的问题,探索以大数据为基础的解决方案,是中国产业升级、效率提高的重要手段。数据挖掘不仅能够成为公司竞争力的来源,也将成为国家竞争力的一部分。联系到我国现代化所面临的种种问题以及教育、交通、医疗保健等各方面挑战,通过大数据这种创新方式来解决问题,创建新的产业群,实现“中国制造到中国创造”的改变,意义就更大。
“大数据”发展的障碍,在于数据的“流动性”和“可获取性”。美国政府创建了Data.gov网站,为大数据敞开了大门;英国、印度也有“数据公开”运动。中国要赶上这样一场大数据变革,各界应该首先开始尝试公开数据、方式与方法。如同工业革命要开放物质交易、流通一样,开放、流通的数据是时代趋势的要求。《大数据时代》一书也提到了数据拥有权、隐私性保护等问题,但相比较来看,新科技可能带来的改变要远远大于其存在的问题。
本书的译者周涛教授是我国最年轻有为的大数据专家。这位27岁的天才型教授,数年来一直带领我国学术界在大数据研究上向国际一流看齐。更可贵的是,他不仅做研究,也关注着研究成果的商业化及传播。这部译著就是他这种努力的一个成果。
现代历史上的历次技术革命,中国均是学习者。而在这次云计算与大数据的新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能。只要我们以开放的心态、创新的勇气拥抱“大数据时代”,就一定会抓住历史赋予中国创新的机会。
推荐序二
实实在在大数据
中国互联网发展的重要参与者,知名IT评论人 谢文
因为我本身十分关注大数据,也写过若干关于大数据的文章,做过若干关于大数据的演讲,所以对有关这一主题的论文和书籍非常有兴趣。过去几年,在这方面我读过十几本书、上百篇论文和文章。相对而言,维克托•迈尔-舍恩伯格教授的《大数据时代》是迄今为止我读过的最好的一本专著,中英文都算上。
此书的一大贡献就是在大数据方兴未艾、众说纷纭的时刻,进一步阐述和厘清了大数据的基本概念和特点,这对许多以为大数据就是“数据大”的人来说很有帮助。
在人类历史长河中,即使是在现代社会日新月异的发展中,人们还主要是依赖抽样数据、局部数据和片面数据,甚至在无法获得实证数据的时候纯粹依赖经验、理论、假设和价值观去发现未知领域的规律。因此,人们对世界的认识往往是表面的、肤浅的、简单的、扭曲的或者是无知的。维克托指出,大数据时代的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识,得到过去无法企及的商机。
大数据的出现,使得通过数据分析获得知识、商机和社会服务的能力从以往局限于少数象牙塔之中的学术精英圈子扩大到了普通的机构、企业和政府部门。门槛的降低直接导致了数据的容错率提高和成本的降低,但正如维克托所强调的,最重要的是人们可以在很大程度上从对于因果关系的追求中解脱出来,转而将注意力放在相关关系的发现和使用上。只要发现了两个现象之间存在的显著相关性,就可以创造巨大的经济或社会效益,而弄清二者为什么相关可以留待学者们慢慢研究。大数据之所以可能成为一个“时代”,在很大程度上是因为这是一个可以由社会各界广泛参与,八面出击,处处结果的社会运动,而不仅仅是少数专家学者的研究对象。
大数据将逐渐成为现代社会基础设施的一部分,就像公路、铁路、港口、水电和通信网络一样不可或缺。但就其价值特性而言,大数据却和这些物理化的基础设施不同,不会因为人们的使用而折旧和贬值。例如,一组DNA可能会死亡或毁灭,但数据化的DNA却会永存。所以,维克托赞同许多物理学家的看法,世界的本质就是数据。因此,大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。哲学史上争论不休的世界可知论和不可知论将会转变为实证科学中的具体问题。可知性是绝对的,无事无物不可知;不可知性是相对的,是尚未知道的意思。
对于不从事网络业、IT业以及数据分析和使用的读者,本书的一大好处就是通俗易懂,通过具体实例说明问题,有助于人们的理解和联想。在时限上,作者概括了直到2012年7月大数据方向上的最新发展,避免了许多同类作品存在的例证过于陈旧、视野相对狭窄的毛病。
作为一位生活在欧美现代社会的学者,维克托是把民主、开放和理性作为已知前提来讨论大数据革命的。这对生活在发展中国家,社会现代化程度尚且有限的读者来说,也许是个遗憾,因为书中描述的许多已经发生的事例可能更像是神话。没有市场经济制度和法治体系作为基础支撑,大数据很可能成为发达国家在下一轮全球化竞争中的利器,而发展中国家依然处于被动依附的状态之中。整个世界可能被割裂为大数据时代、小数据时代和无数据时代。
处于发展中国家前列的中国,目前正面临着一个重大的历史抉择关口。应该说,在过去的三十余年时间里,中国在快速走向工业化、信息化、网络化方面交出了一份不错的成绩单。如今适逢世界走向数据化,迈入大数据时代的时刻,无论对个人、企业还是对社会和国家,都有认真理解、严肃决策的必要性和紧迫性。哪怕仅从这一点考虑,读一读这本书也是很值得的。
译者序
在路上•晃晃悠悠
电子科技大学教授,互联网科学中心主任 周涛
接下翻译这本《大数据时代》的任务时,我的目标是做到110%的好。因为作者维克托•迈尔-舍恩伯格毕竟不像我们每天在一线与数据厮杀搏斗,其爱其恨都更深刻。特别地,我们可以为中文的读者补充很多中国的例子和参考资料。很遗憾,我们最终只做到了90%,应该补充的一些材料还没有整理好,遣词造句也多有生硬疏忽之处。如果再给我一个月的时间,就可以达到我预想的110%甚至120%。
为什么现在把这个版本呈现给诸位呢?一是因为我们的努力使得本书中译本的出版和英文原版完全同步,单从获取知识的角度讲,我们一点儿不比美国的读者慢!二是我相信作者在书中的一个重要观点,就是大数据时代,要允许一点点的错误和不完美,因为效率可能更加重要!留下一些可供提高的地方,也使得我们的每一次印刷,都能够与以前有所不同。亲,这不是建议你等到某个更好的版本才去购买,而是说,其实你应该每个版本都买一本:)。
《大数据时代》这本书是200%的好,因此90%的译本也绝对值得一读。首先,作者抛出了大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果;接着,从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后,作者冷静描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。
国内最近也出版了一些大数据方面的著作,可以和本书互为补充。郑毅的《证析》对于数据通过交叉复用体现的新价值、大数据战略在企业与政府执行层面的流程和大数据科学家这一新职位,以及围绕这个职位的能力和责任给出了最深刻、最具体的描述;子沛的《大数据》对于数据的公正性、公平性以及信息和数据管理等方面理念、政策和执行的变化,特别是美国在这方面的进展,给出了完整的介绍;苏萌、林森和我合著的《个性化:商业的未来》则对大数据时代最重要的技术、个性化技术,以及与之相关的新商业模式给出了从理念到技术细节的全景工笔。总的来说,这三本书都针对本书的某一局部给出了更深刻的介绍和洞见,也各有明显超出本书的优点,但三本之和也无法囊括本书的菁华,亦缺乏本书的宏大视野。
简单地说,这本书好在三个地方:
一是观点掷地有声,绝非主流媒体上若干讨论的简单汇总和平均,更不是一个宏大概念面前暧昧的叫好声。读者可能对其中一些观点并不认同,但是读完之后不可能一个都记不住。
二是观念高屋建瓴,作者试图从很多实例和经验,包括历史事件中萃取出普适性的观念,而不仅仅是适用于几个特定情况的案例分析。
三是例子丰富翔实,不大的篇幅包括了上百个学术和商业的实例。
三点近乎完美地结合起来,体现了作者驾驭大问题的能力和丰富的知识,以及,可能更为重要地,作者渴求立言立说的野心!所以说,这本书绝对不是一堆枯燥的纲要,更不是一本巨厚的杂志。
我在这里拼命叫好,是为了这本书卖得更多,但不代表作者的所有观点都是绝对真理。举个例子,我本人对于大数据时代“相关关系比因果关系更重要”这个观点就不认同。有了机器学习,特别是集成学习,我们解决问题的方式变成了训练所有可能的模型和拟合所有可能的参数——问题从一个端口进去,答案从另一个端口出来,中间则是一个黑匣子,因为没有人能够从成千上万的参数拟合值里面读到“科学”,我们读到的只是“计算机工程”。与其说大数据让我们重视相关胜于因果,不如说机器学习和以结果为导向的研究思路让我们变成这样。
那么,大数据是不是都这样了?其实很多时候恰恰相反。想想瑞士日内瓦的强子对撞机,我们在上面捕获了人类有史以来最大规模的单位时间数据。我们是希望找到或者验证某种相关关系吗?不是!我们试图回答的,正是人类所能问出的关于因果关系最伟大的问题:希格斯玻色子是否存在,我们的宇宙是否有可能用标准模型刻画。这个问题的最终答案,将打破人和神的界限!认为相关重于因果,是某些有代表性的大数据分析手段(譬如机器学习)里面内禀的实用主义的魅影,绝非大数据自身的诉求。从小处讲,作者试图避免的“数据的独裁”和“错误的前提导致错误的结论”,其解决之道恰在于挖掘因果逻辑而非相关性;从大处讲,放弃对因果性的追求,就是放弃了人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落。如果未来某一天机器和计算完全接管了这个世界,那么这种放弃就是末日之始。苏珊•朗格(Susan Langer)在《哲学新视野》一书中说:
“某些观念有时会以惊人的力量给知识状况带来巨大的冲击。由于这些观念能一下子解决许多问题,所以,它们似乎将有希望解决所有基本问题,澄清所有不明了的疑点。每个人都想迅速地抓住它们,作为进入某种新实证科学的法宝,作为可以用来建构一个综合分析体系的概念轴心。这种‘宏大概念’突然流行起来,一时间把几乎所有的东西都挤到了一边。”
这段话通常被认为是对当时“存在主义”和“精神分析法”这类万能概念的善意批评,而如今特别适合作为一盆冷水泼在那些没有任何深刻理解,却月月日日分分秒秒穿行于各种“大数据嘉年华”的投资人、媒体人和创业者身上。希望《大数据时代》给予各位的是一些实实在在的知识和思考,并且唤起各位安静思索相关问题的心境。大数据是一个很重要的概念,代表了很重要的趋势,但我不希望它成为一种放之四海皆准的万能概念——因为越是万能的,就越是空洞的!人类学家克利福德•吉尔兹(Clifford Geertz)在其著作《文化的解释》中曾给出了一个朴素而冷静的劝说:“努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。”我想,这应该是所有人面对一个新领域或新概念时应有的态度。
大数据的道路上没有戈多,我们已经在路上,晃晃悠悠。人类的自由意志和诸神之下的尊严,会在这条道路上异化甚至消逝吗?极目远眺,不知道世界的尽头,是否是一个冷酷的仙境!诸位为之奋斗吧,而我只想,做一个,麦田里的守望者。
以为序。

文摘
版权页:

大数据时代:生活、工作与思维的大变革

恰恰相反,清楚地分类被更混乱却更灵活的机制所取代了。这些机制才能适应改变着的世界。当我们上传照片到Flickr网站的时候,我们会给照片贴加标签。也就是说,我们会使用一组文本标签来编组和搜索这些资源。人们用自己的方式创造和使用标签,所以它是没有标准,没有预先设定的排列和分类,也没有我们必须遵守的类别的。任何人都可以输入新的标签,标签内容事实上就成为了网络资源的分类标准。标签被广泛地应用于facebook、博客等社交网络上。因为它们的存在,互联网上的资源变得更加容易找到,特别是像图片、视频和音乐这些无法用关键词搜索的非文本类资源。
当然,有时人们错标的标签会导致资源编组的不准确,这会让习惯了精确性的人们很痛苦。但是,我们用来编组照片集的混乱方法给我们带来了很多好处。比如,我们拥有了更加丰富的标签内容,同时能更深更广地获得各种照片。我们可以通过合并多个搜索标签来过滤我们需要寻找的照片,这在以前是无法完成的。标签所固有的不确定性就相当于我们接受世界的纷繁复杂。这是对更加精确系统的一种对抗。这些精确的系统试图让我们接受一个世界很贫乏而规整的惨象——假装世间万物都是整齐地排列的。而事实上现实是纷繁复杂的,天地间存在的事物也远远多于系统所设想的。

内容简介
《大数据时代:生活、工作与思维的大变革》是国外大数据系统研究的先河之作,作者维克托•迈尔•舍恩伯格被誉为“大数据时代的预言家”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。
维克托•尔耶•舍恩伯格在《大数据时代:生活、工作与思维的大变革》中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
大数据是人们获得新的认知,创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。维克托认为,大数据的核心就是预测。这个核心代表着我们分析信息时的三个转变。第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。

海报:

大数据时代:生活、工作与思维的大变革

购买书籍

当当网购书 京东购书 卓越购书

PDF电子书下载地址

相关书籍

搜索更多