爆发:大数据时代预见未来的新思维.pdf

爆发:大数据时代预见未来的新思维.pdf
 

书籍描述

编辑推荐
《爆发:大数据时代预见未来的新思维》编辑推荐:巴拉巴西,复杂性科学最富盛名的国际领军人物,藉由此书向大家传递了一整套理解人类行为时空模式的观念和理论,提出人类行为93%是可以预测的,在大数据时代我们可以预测未来。
《爆发:大数据时代预见未来的新思维》的新意在于结合科学技术发展新的事实,对特定历史观进行了重新论证。其中涉及的大数据,正是下一步互联网发展的重要方向,Facebook推出的时间轴(Timeline)与书中反复提到的Lifelinear都是当前网络前沿的时尚。
洞察数字社会重要性并将之引入中国人生活的第一人胡泳,中国社科院信息化研究中心秘书长、《互联网周刊》主编姜奇平,电子科技大学互联网科学中心教授、博士生导师周涛作序,资深媒体人罗振宇,海银资本合伙人、互联网研究者王煜全,中国科学院理论物理研究所研究员李淼联袂推荐。

名人推荐
作为一个科学家,巴拉巴西的颠覆是大胆的。巴拉巴西在书中穷根溯源,宣布自己找到了被长期认为是完全偶然的人类行为之下的有序模式,并将这一模式命名为“爆发”——我们的工作和娱乐及其他重重活动都具有间歇性,会在短期内突然爆发,然后又几乎陷入沉寂。
——北京大学新闻与传播学院副教授,东西中国社会数字化进程第一人 胡泳
美国物理学会荣誉会员巴拉巴西的《爆发》,在最新的时间、最新的领域,讨论了一个最古老的问题:到底应该用决定论的观点,还是用非决定论的观点,看待人类行为?作为复杂网络研究的权威,巴拉巴西在大数据的新北京下,认为数据、科学以及技术的合理,会舍得人类行为变得比预期中容易预测得多。
——中国社科院信息化研究中心秘书长,《互联网周刊》主编 姜奇平
千万不要以为这只是一本妙味横生又充满噱头的科普小册子,事实上,这是一本野心极大的著作。巴拉巴西,复杂性科学最负盛名的国际领军人物,借由此书向大家传递的,不是一个现象、一种观点或若干模型,而是一整套理解人类行为时空模式的观念和理论。
——电子科技大学教授,互联网科学中心主任 周涛
研究过去的目的是为了预测未来,而最难的、也最有价值的预测则是对人类行为的预测。巴拉巴西是社会网络分析领域当仁不让的领军人物,总是能站在学术的制高点上俯瞰未来。在这本引人入胜的书中,巴拉巴西借助一个个小故事,将学术界对人类行为预测方面的最新成果娓娓道来。如果你也关心自己的未来,此书不可不读。
——海银资本合伙人,社会化媒体研究者 王煜全
这是一个令人兴奋的时代,也是一个大数据的时代,网络科学让我们越来越多地从数据中观察到人类社会的复杂行为模式。以数据位基础的技术决定着人类的未来,但并非是数据本身改变了我们的世界,起决定作用的是可用知识的增加。《爆发》正是让我们思考如何从大数据中塑造未来美好世界的正能量。
——中国传媒大学教授 沈浩
谁能够想到,爱因斯坦一辈子写了14500封信?谁又能够想到这些信成了研究人类活动的样本?《爆发》向我们展示了,人类很多行为遵循一些统计规律,在这个意义上人类行为93%是可以预测的。
——中国科学院理论物理研究所研究员 李淼
经济学家提出过一个刁钻的问题:“为什么在一件事情面前,人类的意见千差万别,可是行为却大体相似?”或许答案是,言辞不必负责,而行为则必有后果。从这个角度上讲,我支持复杂网络权威巴拉巴西的判断:人类大多数行为是可以预测的。在本书中,巴拉巴西将很多人看来难以企及的预测未来的梦想,一步步变成了现实。
——资深媒体人 罗振宇
在《链接》中,巴拉巴西向大家展示了复杂网络如何覆盖空间;而在《爆发》中,巴拉巴西又深刻剖析了复杂网络如何覆盖时间。
——互联网革命最伟大的思考者,畅销书《人人时代》《认知盈余》作者 克莱•舍基
巴拉巴西是这个世界上少数几个能够洞察经验现实背后深意的人之一。
——畅销书《黑天鹅》作者 纳西姆•塔勒布
在本书中,巴拉巴西展示了,在长期的随机运动中,爆发模式是如何出现的。
——畅销书《连接:社交网络的惊人力量及对我们生活的改变》作者 尼古拉斯•克里斯塔吉斯
本书提出了对于旧问题的一种极具吸引力的新思考方法。
——畅销书《信任帝国》作者 托马斯•马登

媒体推荐
谁能够想到,爱因斯坦一辈子写了一万四千五百封信?谁又能够想到这些信成了研究人类活动的样本?《爆发》向我们展示了,人类很多行为遵循一些统计规律,在这个意义上人类90%的行为是可以预测的。
——李淼(中国科学院理论物理研究所研究员)
巴拉巴西是这个世界上少数几个能够洞察经验现实背后深意的人之一。
——纳西姆·尼古拉斯·塔勒布(畅销书《黑天鹅》作者)
在《链接》一书中,巴拉巴西展示了复杂网络如何覆盖空间;在《爆发》一书中,巴拉巴西又介绍了复杂网络如何覆盖时间。
——克莱·舍基(畅销书《未来是湿的》作者)
在本书中,巴拉巴西展示了,在长期的随机运动中,爆发模式是如何出现的。
——尼古拉斯·克里斯塔吉斯(畅销书《连接:社交网络的惊人力量及对我们生活的改变》作者)
本书提出了对于旧问题的一种极具吸引力的新思考方法。
——托马斯·马登(畅销书《信任帝国》作者)

作者简介
作者:(美国)艾伯特-拉斯洛•巴拉巴西(Albert-László Barabási)译者:马慧

艾伯特-拉斯洛•巴拉巴西(Albert-László Barabási),全球复杂网络研究权威,无尺度网络的创立者。美国物理学会院士,匈牙利科学院院士,欧洲科学院会员,美国东北大学教授,网络科学研究中心的创始人、主任,同时任职于哈佛大学媒体学院医学系,并担任丹那-法伯癌症研究所癌症系统生物学中心的研究员。
他提出无尺度网络模型,2006年因此荣获了匈牙利计算机学会颁发的冯•诺依曼金质奖章,是建立基于网络共性的统一科学理论的先行者,是复杂网络界引述最多的科学家。
世界著名科技杂志《popular science》杂志赞誉,“他可以控制世界”。

目录
推荐序一 生活抵触随机运动吗 Ⅰ
胡泳
北京大学新闻与传播学院副教授
洞察中国社会数字化进程第一人
推荐序二 在科学和历史之间 Ⅴ
姜奇平
中国社科院信息化研究中心秘书长、《互联网周刊》主编
推荐序三 不在爆发中爆发,就在沉默中沉默 Ⅸ
周涛
电子科技大学教授,互联网科学中心主任
引言 历史不会重演,却自有其韵律 001
虽然万事皆显出自发偶然之态,但实际上它远比你想象中容易预测。马克•吐温曾说过:历史不会重演,却自有其韵律。忘掉那些将生命看做掷骰子或是巧克力盒的比喻,把自己想象成处于自动驾驶状态的做着美梦的机器人,你就会更加接近真相。
【选举新教皇】 017
第一部分 人类看待自身和世界的传统思维
第1章 在无数个“显微镜”下现行 025
扩散理论
人类跟悬浮在水中的花粉微粒其实没什么不同。我们大部分时间也是运动不止。不同的是,我们不是受到微小而不可见的原子的撞击,而是被转化成一系列任务、责任以及动机的不可见的神经元的颤动所驱使。很多新工具都能追踪人类的活动,都能预见我们的下落:不是当下的,而是未来的。
【决斗在贝尔格莱德】 043
第2章 15分钟,36分钟,还是36小时 049
转化模型
安迪•沃霍尔说:“在未来,每个人都有成名15分钟的机会。”然而,一只无形的手在放慢人类行动的进程,在今天这个信息饥渴的时代,一条新闻在多长时间之内才算新?我们真的能度量转瞬即逝的成名吗?
【血腥预言】 063
第3章 接受绝望,还是追随希望 069
量子力学
如果真有透视未来的千里眼,历史真的不会重演,人类的动机和欲望也不会重复吗:我们总是想要更好、更多、更不一样的东西?正如我们以揭开次原子世界的真相为目标进行的物理研究一样,是不是说人类就会变得完全或部分可预测?
【圣战奇兵】 081
第4章 上帝从不掷骰子 087
泊松分布
只要遇到无法理解的事情,我们就会说那是偶然,似乎这种表面上的偶然行为推动了历史的演进,而事情发展之迂回曲折似乎如掷骰子一般。但这种偶然真正意味着什么?
【一场始料不及的大屠杀】 101
第二部分 爆发,大数据时代的新思维
第5章 爆发,无处不在 109
爆发的本质规律:幂律分布
长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。事实上,从人们对维基百科的编辑,到货币经纪公司的交易;从人和动物的睡眠模式,到魔术师为了保证魔杖时刻停留在空中而做的小动作,所有的一切都证明:爆发,无处不在。
【内格雷克之战】 125
第6章 请学会偶尔说“不” 133
爆发的起点1:优先级模型
时间是我们最宝贵的不可再生资源,如果我们尊重它,就必须设定优先级。一旦优先级设定了,幂律规律和爆发的出现就不可避免。优先清单会帮你剔除无关紧要的事,帮我们把烦心的日常琐事转化成永远排队的异常值,让我们的注意力集中到真正重要的事情上去。
【圣十字架从不发生意外】 147
第7章 来一次爱因斯坦式的时空穿越 151
爆发的起点2:新建模型
我们发现了前电子时代人们通信的基本模式,而实际上,不管我们的信息是在电脑上以光速传播,还是用蒸汽机船慢慢地漂洋过海,我们的通信模式都是一样的,就连伟大的爱因斯坦也不例外……
【调查】 169
第8章 在陌生的地方重新开始 177
爆发的轨迹1:信天翁模型
从人类记忆的搜寻到网络信息的查找,一切已经证明,查找某个特定目标的最佳策略不是用最明显、最系统、最规律的搜寻模式,而是用具有爆发性、间歇性,甚至是偶然性的搜寻模式。
【“恶棍!”】 189
第9章 我们不会永远漂泊 195
爆发的轨迹2:手机模型
手机数据帮我们解决了这个自相矛盾的问题:如果人类活动遵循列维模式,我们就永远找不到回家的路,但实际并非如此。事实证明,我们不会永远漂泊。我们逃脱了定律的诅咒,每次都能找到回家的路。
【革命吧!】 209
第10章 每个人都是习惯的奴隶 217
爆发的频率:熵
我们到底有多好预测?我们终于能够为这个一直困扰我们的问题给出一个定量的答案了。虽然人与人存在很多不同,但我们的可预测程度都差不多,无情的统计规律使得异类根本不存在。我们的行踪都深受规律影响,而它的影响力比我们想象中要大得多。
【特兰西瓦尼亚牵制战】 237
第三部分 谁掌控着我们的未来
第11章 爆发来到大数据时代 245
数据,是一把双刃剑
虽然我们的过去由安全防火墙和隐私法保护着,但通过精密系统的预测,我们的未来却极易被人掌握。未来比过去更具价值,那么谁掌握着我们未来行为的信息?谁又会从中获利?
【塞克勒人VS. 塞克勒人】 259
第12章 爆发的世界里没有黑天鹅 263
爆发,生命奇迹的必要因素
生命远不是流畅或随机的,而是在所有时间尺度内都具有爆发性的——从几毫秒到几小时的细胞活动;从几分钟到几周的人类活动;从几周到几年的疾病来袭;从几千年到几百万年的进化过程。爆发,是生命奇迹的必要因素,是生物为了适应和存活所进行的不懈斗争。
【决战】 279
结语 爆发,宇宙运行的科学 285
我们正处在一个聚合点上,在这里,数据、科学以及技术都联合起来共同对抗那个最大的谜题——我们的未来,既是个人的又是社会的。无处不在的爆发,是科学的台柱,而它的影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。
【血肉之躯】 303
译者后记 309

序言
推荐序一 在科学和历史之间
故事讲的是匈牙利十字军的一段历史,主人公塞克勒受主教之命,征召农民组成十字军。在出征半路上,与贵族军发生“误会”,大水冲了龙王庙,内部打了起来。这一事美国物理学会院士巴拉巴西的《爆发》,在最新的时间、最新的领域,讨论了一个最古老的问题:到底应该用决定论的观点,还是用非决定论的观点,看待人类行为?作为复杂网络研究的权威,巴拉巴西在大数据的新背景下,认为数据、科学以及技术的合力,会使得人类变得比预期中容易预测得多。
这本书写得非常富有趣味和悬念,我是像看金庸的武侠小说那样,一口气读下来的。这本书由科学和历史两部分交织组成。其中历史的部分差不多就是一部小说,它是如此吸引人,以至看到一半,我开始扔掉每章的前半部分,专看“小说”部分,一直看到主人公塞克勒被处死的大结局。这种感觉就象看电视连续剧,被“欲知后事如何”吸引着,结果顾不得按部就班一集一集地看,直接到百度去搜分集剧情简介了。
变,将塞克勒激反,走上起义之路。泰勒格迪曾准确预言事情的走向,塞克勒兵败被擒,坐上“燃烧的御座”,被带上烧红的铁制王冠。
这本书虽然可以当历史小说来看,但它的重心还是在每章的前半部分,即讨论科学的部分。历史故事只是为了证明作者的观点:人类行为93%是可以预测的,就象泰勒格迪做到的那样。在日趋精密的数字技术条件下,有了从四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。它们会在不经意时显示次序,在意想不到之处偶然出现。人类行为遵循着一套简单并可重复的模型,而这些模型受制于更加广泛的规律。
爆发,被作者视为宇宙运行的科学。作者认为,当我们将生活数字化、公式化以及模型化的时候,我们会发现其实大家都非常相似。我们都具有爆发式,而且非常规律。看上去很随意、很偶然,但却极其容易被预测。
巴拉巴西的观点虽然独特,但并没有从哲学的谱系中逃逸。作者采用的“科学-历史”叙事框架,正构成本书所涉及问题的元问题本身。当科学和历史被“主义”化为科学主义和历史主义时,二者的对立构成的是一个老问题:自然是决定论的,历史是非决定论的。
如果把社会发展当做一个自然过程,作为科学的对象,它是有规律、可预测的;
如果把社会发展当做一个历史过程,作为历史学的对象,它是无规律、不可预测的;
介于二者之间的观点认为,社会发展是一个自然历史过程。
按巴拉巴西的观点,自然与历史的比重,大约应是90%与10%的关系。这就不难理解,作者对波普尔的观点,即否定历史决定论的观点,基本是否定的。由此可以看出巴拉巴西观点在哲学上的大致定位。
作为《链接》一书的作者,巴拉巴西还是一位知名的网络问题专家。《爆发》一书的新意,并不在于提出了新的历史观,而在于结合科学技术发展新的事实,对特定历史观进行了重新论证。作为网络研究者,我对此也很感兴趣。尤其其中涉及的大数据,正是下一步互联网发展的重要方向,Facebook推出的时间轴(Timeline)与本书反复提到的Lifelinear都是当前网络前沿的时尚。因此我想就此谈谈我个人的判断。
书中说到的技术事实的部分是可信的。例如谈及手机运营商掌握着我们的实时通信信息和行踪等。目前,这种可供分析人类行为的参考信息主要有几大类:
个人的地球上的全部运动轨迹(通过LBS采集); 个人的全部支付记录(通过在线支付采集);
个人的全部交往记录(通过SNS采集);
个人的全部言行记录(通过邮件、文档、Timeline、视频监控等采集)。
商家通过这些数据,确实可以预测客户的行为,从而提供有别于他人的个性化服务。从这个意义上来说,巴拉巴西的预言是有道理的。
但是,这些事实是否足以改变“决定论-非决定论”这个水平上的哲学结论,每个人可能都会有自己的判断。人具有自由意志,这是不同于分子随机运动之处。我们有可能成功预测到一个沉默的人在某个时刻突然爆发,但要猜透这个人的斯芬克斯之谜,光有科学和技术可能还是不够的。

后记
巴拉巴西教授的这本新书让人眼前一亮。就跟他要阐明的问题“人生看似杂乱无章,其实有规可循一样”,这本书的谋篇布局看似杂乱,一会儿提到被拘留的当代艺术家,一会儿又带着大家回到了中世纪,但看到最后你会发现一切都豁然开朗,所有事情都在他的掌握之中。
巴拉巴西教授此前写过一本书,在那本书中,他用惊人的科学事实证明了我们所在的世界中,一切都是相互连接成网的。而在本书中他则立志探索人类行为和预知未来的问题。这本书看似玄妙,但处处都有严格的科学例证。作者将一个一个事例和故事娓娓道来,即使你不懂统计学、不懂物理,也能马上理解其中的意思。
过去,我们常常认为《1984》中试图控制人们一切行为的独裁者——“老大哥”仅是小说中的人物而已。但今天,我们的行为模型可能正在被一些移动电话公司、谷歌、政府情报机构仔细分析研究。为了开发下一个受欢迎的产品,抑或为了发现潜在的恐怖分子,无数的计算机和研究人员正在集中精力预测人类行为。
那么,人类行为究竟是不可预测的呢?还是说,在每一件事情背后确实存在一种隐藏的模型?巴拉巴西教授认为是后一种。要想知道其中的玄妙,相信读完这本书,你已受益匪浅。
这本书的翻译有很多难点,所以有错误之处请各位不吝指出,我自当感激不尽。最后,感谢吕刚给予我的莫大支持和帮助;感谢曾珂和郑雅宁为我提供的宝贵意见;感谢马国栓和冯朝伟的谆谆教诲和鼓励;感谢马岭的理解与激励。

文摘
第7章 来一次爱因斯坦式的时空穿越
爆发的起点2: 信件模型
艾伯特•爱因斯坦——当时已经是个知名物理学家了,但还不是几个月后变成的那种媒体名人——在1919年春天收到了一封来自名不见经传的同僚西奥多•卡鲁扎(Theodor Kaluza)的信。1908年,师从大卫•希尔伯特(David Hilbert)和赫尔曼•闵可夫斯基(Hermann Minkowski)的卡鲁扎完成了他的第一篇也是仅有的一篇论文。此后,他一直在重复研究那篇论文中的问题。十年过去了,已经34岁的卡鲁扎仍然碌碌无为,呆在学术界的最底层的他只能靠微薄的收入养家糊口。当最终完成了第二篇论文之后,他壮着胆子将论文寄给了爱因斯坦。随后,在1919年4月21日那天,他收到了一封颇具鼓励性的回信:“我也时常琢磨着电场被拦截这个问题。但从来没想到将它放在五维立体世界中研究。这个想法对我乃至全世界来讲都是全新的。”
现在,我们在物理课堂上所教的五大基本力的其中三种——引力、磁力以及电力——在1919年时已经被卡鲁兹和爱因斯坦所熟知了。长期以来,这三大作用力之间似乎难有联系。然而,詹姆斯•克拉克•麦克斯韦(James Clark Maxwell)在1864年却发现电力和磁力可以联合起来形成一种力——电磁力。他的成功激励着一代又一代怀有梦想的物理学家,一直到现在人们仍然试着研究出一种方法来使自然界的各种力保持一致,以成就一部万物论。
1919年,统一引力和电磁力仍然一个难以攻克的难题。基于此,卡鲁扎提出了一个出人意料的解决方法。他指出,假设世界不是三维而是五维的话,这两种力就能结合。这一假设自然会让人们不知所措,因为没有人能想象出那个神秘的五维世界是什么样。但卡鲁扎是那种看书学会游泳的人,所以他一直对理论知识怀有坚定的信念。这次也不例外,虽然这种想法有点违反直觉。
卡鲁扎写信给那位科学巨人并不只是出于礼貌——他想请爱因斯坦帮他发表他的论文。当时,像爱因斯坦这样的著名科学家都被誉为优秀科学杂志的守门人。如果爱因斯坦对某篇论文感兴趣,他就会在柏林科学院(Berlin Acadamy)的会议上加以推荐,之后论文就会发表在院报上。令卡鲁扎高兴的是,爱因斯坦愿意帮他。
一周后,也就是4月28日那天,爱因斯坦又给卡鲁扎写了一封信。信的开头相当鼓舞人心:“我读了你的信,而且发现它很有趣。我觉得实现这个理论没有什么不可能。”
不过,下面的内容就相对含蓄了:“但我必须承认里面的观点现在提出来还不具备什么说服力。”
对论文提出一些技术性问题和建议后,爱因斯坦接着说道:“如果你能精确地运用经验知识做出验证,我保证你的理论将是正确的。“
爱因斯坦答应卡鲁扎帮他打开学院大门,但有个条件:“如果上述有关测地线的问题解决的话,我会在学院面前呈交论文的简缩版。请不要责备我,因为在提交论文时,我会署上我自己的名字。”
想象一下几个星期来一连收到两封来自当时最具影响力的物理学家的信时,卡鲁扎会是什么样的心情吧。每封信都那么鼓舞人心,而且爱因斯坦一连写两封信更证明他是真的被这位没什么名气的物理学家的想法迷住了。但这些信也揭开了很多问题,以至于这篇论文多年都未成功发表。
先有爆发式,还是先有电子邮件
2005年,在纪念爱因斯坦奇迹年百年诞辰之际,我应以色列科学院(Israeli Academy of Science)之邀去耶路撒冷(Jerusalem)做演讲。会议日益逼近,但我的心思却没放在那上面。最近,优先级模型又出现了一些耐人寻味的新问题。你应该还记得,我们发现电子邮件通信具有间歇爆发性特征,也就是说在沉寂一段时间后人们总会疯狂地发送邮件。基于此,我开始考虑爆发模式到底是电子时代的副产品,还是显示出了人类活动的更深层次的真理?我们之前所做的所有研究——从电子邮件到网络浏览器——都或多或少跟电脑有联系。所以我们不禁要问一个逻辑性问题:爆发性和电子邮件到底谁先出现的?
我很快意识到,一些著名学者的信件都被后人完好地保存着,所以我想也许能从中找到答案。在网上搜索一番后,我将目标锁定在了艾伯特•爱因斯坦档案室(Albert Einstein Archives)上。这是耶路撒冷希伯来大学(Hebrew University of Jerusalem)的一个项目,他们的任务就是搜集所有爱因斯坦的信件并编纂入目。由于他们迟迟未给我回信,我干脆将他们的地址塞进背包,进行第二项计划:先庆贺爱因斯坦的奇迹年,然后去找爱因斯坦档案室的“老家”犹太国家图书馆(Jewish National Library)。
得来全不费工夫,几天后我受邀去参加一个耶路撒冷的招待会。我在那里结识了一些与会的著名科学史家。当我提到想研究爱因斯坦的信件时,他们指了指那个正好站在我背后的人。很快,我就被引荐给了戴安娜•科莫斯•布赫瓦尔德(Diana Kormos-Buchwald)——加州理工学院的历史系教授,爱因斯坦文件计划的负责人。她确信我找的那些资料虽然不完整,但确实存在而且已经被编纂入目。回国后,她把我介绍给了一同负责爱因斯坦文件计划的加州理工学院高级研究助理提尔曼•绍尔(Tilman Sauer)。联系了两周后,我就收到了艾伯特•爱因斯坦的全部信件,其中包括他跟西奥多•卡鲁扎的通信。
世界是多维的?
卡鲁扎在1919年5月1号给爱因斯坦的回信中打消了他的顾虑,促使爱因斯坦又在5月5号给他回了信:
亲爱的同仁:
我很乐意将你论文的部分摘录提交给学院的会刊。同时,我建议你将寄给我的手稿发表在杂志上,比如《数学杂志》(Mathematische Zeitschrift)或者《物理年鉴》(Annalen der Physi)。只要你愿意,我随时乐意以你的名义将论文提交上去,而且会配以我的简单介绍。
是什么让爱因斯坦这么快就改变了主意呢?我们可以从信中发现一些迹象:“我现在相信,根据实验证明,你的理论已经无懈可击了。”
这个结果对卡鲁扎来说再好不过了。爱因斯坦这位以无止境地追求用实践攻克所有数学问题而闻名的伟人接受了他的观点,承认了我们的世界是五维的。你和我可能都不怎么明白什么是五维世界,但意识受限绝不会阻止一位对数学理论极具洞察力的物理学家的脚步,他会坚持不懈地揭开宇宙的奥秘。如果数学证明世界是更多维的,谁又能够阻挡呢?
爱因斯坦多久回信
爱因斯坦的通信异常频繁——他一生共寄出了大约14500封信,收到了16000多封。这意味着,他成年后平均每天(算上周末)不止写一封信。虽然很惊人,但我感兴趣的不是他的通信数量。我关心的是优先级模型,我想弄清爱因斯坦会等多久才会回信。
我的研究小组里有一位聪明的葡萄牙籍物理系学生若昂•伽马•奥利维拉(João Gama Oliveira),是他最先对加州理工学院提供的数据做了研究。他的分析表明,爱因斯坦的回信模式跟我们的电子邮件模式差不多:他会立即在一两天内回复大量信件。然而,有些信要在他的桌子上呆几个月甚至是几年才会得到答复。令我们没想到的是,若昂的观察表明爱因斯坦的回信时间跟我们之前检测到的电子邮件回复时间一样都遵循幂律分布。
若昂和我首先担心的是爱因斯坦回信模式中的长期间隔是由于资料库中信件不全造成的。然而,加州理工学院的提尔曼•绍尔向我们保证,那些长期间隔绝对是因为时间耽搁了。比方说,爱因斯坦在1921年10月14日给克朗尼格(Ralph de Laer Kronig)的回信中这样写道:“我在累积成山的信件中发现了您去年9月份那封有趣的来信。”的确,记录表明克朗尼格的信被埋在爱因斯坦的桌子上一年多都没得到回复。
但是,不止是爱因斯坦的通信遵循这样的模式。通过英国剑桥大学达尔文通信项目(Darwin Correspondence Project),我们获得了查尔斯•达尔文的所有信件记录。由于认真的达尔文将所有寄出以及收到的信件都备了份,他的通信记录就相当准确了。我们的分析发现,他也是马上回复大量信件,只有极少数会耽搁不回。总的来说,达尔文的回信时间跟爱因斯坦的一样都严格遵循幂律规律。
两位不同时代(爱因斯坦在达尔文去世前3年出生)、不同国籍的学者的通信记录都遵循一样的规律这一事实,不是表明我们在窥视某人的特殊癖好,而是发现了前电子时代人们通信的基本模式。这也意味着,不管我们的信息是在电脑上以光速传播,还是用蒸汽机船慢慢地漂洋过海,我们的通信模式都是一样的。事实上,不管是过去还是现在,时间对我们来说都异常珍贵。我们必须设定优先级,就算是伟大的爱因斯坦和达尔文也不例外。如此一来,拖延、爆发点和幂律分布就会不可避免地出现。
但电子邮件和纸质信件之间还是存在一个特别的差异:两者数据集中的幂——定性幂律的关键参数——不同。 这种差异意味着,在电子通信模式中长时间被耽搁的信件要比纸信通信中少。基于电子通信的即时性,这种差异也并不令人吃惊。
然而,事实上这种差异不是发信时间造成的。数十年来的研究结果表明,定性幂律的幂不是一个任意值,而是与通信模式背后的潜在原理紧密联系的。也就是说,如果一个能够描述两种现象的幂律的幂不同的话,那么支配这两种体系的原理就有本质的不同。所以这种差异表明,如果想说明爱因斯坦和达尔文的通信模式,我们就必须建立一个新模型。
将卡鲁扎打回原点
受到爱因斯坦的鼓励后,西奥多•卡鲁扎很快按照要求做了改动,寄去了一份适合在院刊上发表的简缩版论文。他的事情已经很明朗了——不到四个星期他就收到了四封回信,这表示那位著名的物理学家已经破格将他的事放在了优先位置上。但爱因斯坦在1919年5月14日那天的回信中又显得颇为冷淡。“我最最亲爱的同仁,”他写道:“我已经收到了你为学院准备的论文。不过,在对你的问题进行仔细考虑后,我发现了另外一个难题,而且直到现在我都无法解答。”
利用四点论推导法,爱因斯坦详细说出了自己的困惑,并在最后总结道:“或许你能找到一个解决方法。无论如何,我会等到这些问题解决后才递交你的论文。”
就这样,爱因斯坦将卡鲁扎打回了原点。
到达率与回复率
在优先级模型中,我们假设一旦首要任务完成,任意一项新的优先任务就会将之代替。要想得出爱因斯坦通信的精确模式,我们需要将这个模式作一番修改,加上一些纸信通信的特点。的确,在蜗牛邮件模式下,邮递员每天都会送来一定数量的邮件,然后这些信就加入到了等待回复信件的大军中去。只要时间允许,爱因斯坦会从一大堆信件中选择他认为最重要的加以回复,然后将剩下的留待下一天处理。所以爱因斯坦的通信模式包含着两个因素:
1)我们将其中一种概率称为到达率,也就是到达爱因斯坦桌子上,开始排长队的信件。他会从其中选出一些优先信件。
2)另外一种概率我们称为回复率。他会选择优先级最高的信件加以回复。
如果爱因斯坦的回复率大于信件的到达率,那么他的桌子总体上看会干净很多,因为他在收到信后会立即回复一大部分。在这种亚临界状态下,通信模型显示爱因斯坦的回信时间符合指数分布,其中没有长时间耽搁的情况。很明显,这与我们观察到的幂律分布不同。
不过,如果爱因斯坦的回复率小于信件的到达率,那么日复一日他桌上的信件就会越堆越高。有意思的是,只有在这种超临界状态下,回信时间才符合我们之前观测到的爱因斯坦和达尔文通信模式所显示出的幂律分布。所以,爆发性的出现表明爱因斯坦已经无暇分身,以至于被忽略的信件越积越多。 但他真的那么忙吗?
虽然在奇迹之年只有7封信件留存,但我们完全可以说在1905年这位尚不知名的专利承办员肯定有时间将通信放在首位。的确,那个时候关注他的只有他的家人和朋友。十年后,也就是1905年时,他已经成为知名物理学家了。这时他有责在身,不得不隔几天就写封信。虽然那个时期只有12封信留存,但这既不能表明他特别重视通信,也不能看出其中有特别的延误。
但如果爱因斯坦能够勤于通信——正如他在1919年及时回信给卡鲁扎那样——那么他的回信时间就会符合指数分布而不是我们观测到的幂律分布。也就是说,如此一来他的通信模式中就不会有延误和爆发点出现。

内容简介
《爆发:大数据时代预见未来的新思维》是一本颠覆《黑天鹅》的惊世之作。如果说塔勒布认为人类行为是随机的,都是小概率事件,是不可以预测的;那么全球复杂网络权威巴拉巴西则认为,人类行为93%是可以预测的,在大数据时代我们可以预测未来。
巴拉巴西的研究是在人类生活数字化的大数据时代基础上进行的,移动电话、网络以及电子邮件使人类行为变得更加容易量化,将我们的社会变成了一个巨大的数据库。他认为,人类正处在一个聚合点上,在这里数据、科学以及技术都联合起来共同对抗那个最大的谜题——我们的未来。
在《爆发:大数据时代预见未来的新思维》中,巴拉巴西揭开人类行为背后隐藏的模式“爆发”,提出人类日常行为模式不是随机的,而是具有“爆发性”的。爆发揭开了人类行为中令人惊讶的深层次的秩序,使得人类变得比预期中更容易预测得多。
爆发模式的揭示,其影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。

海报:

爆发:大数据时代预见未来的新思维

购买书籍

当当网购书 京东购书 卓越购书

PDF电子书下载地址

相关书籍

搜索更多