爆发读书笔记
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
《爆发》读书笔记 似乎这是一本可以贴上“心理学”“社会学”“大数据”等标签的图书,在徜徉于理工科之余读一读此类书,顿觉眼界开阔、获益匪浅。在此我想讨论一下上述这些大分类的背后,它具体讲了什么,带给我哪些东西。 作者艾伯特•拉斯洛•巴拉巴西是美国物理学会院士,同时是无尺度网络的创立者,还精通医学领域,担任丹那-法-伯癌症研究所癌症系统生物学中心的研究员。从对作者的介绍便可猜测到此书同时立足于社会科学和自然科学。第一部分探讨人的行为是否可以预测,第二部分揭示人类行为背后的隐藏模式,第三部分用行为的爆发和统计大数据直指“我们的未来”这一重大课题。巴拉巴西的研究是在人类生活数字化的大数据时代基础上进行的,他揭开了人类行为背后隐藏的模式“爆发”,提出人类日常行为模式不是随机的,而是具有“爆发性”的,爆发揭开了人类行为中令人惊讶的深层次的秩序,使得人类变得比预期中更容易预测得多。 因为个人的行为模式是因为每个个体都排了一下优先级,所以当一个人任务越多,就越可能累积一些优先级不重要的工作,那么他会选择在一个时间段快速处理完这些工作,看起来,这种个人工作的特点就呈现了一种阶段爆发式的特点,这便是本书题目的解释。更具体的说,遵从了幂律数学法则,由此可见数学研究并不是象牙塔,可以体现在生活中的方方面面。本书中的第3页写到:时间是我们最宝贵的不可再生资源,如果我们尊重它,就必须设定优先级。当然巴拉巴西并没有向我们展示自动化的一天,在他的人类行为哲学中,更为关注和希望探索的方向是如何利用大数据论证一种历史观。正如姜奇平先生所说,《爆发》一书的新意,并不在于提出了新的历史观,而在于结合科学技术发展新的事实,对特定历史观进行了重新论证。如115页的讨论:如果战争真是随机发生的,那么大多数战争的伤亡人数应该都差不多。尽管在我看来此结论尚存争议。 这本书虽然可以当历史小说来看,但它的重心在每章的前半部分,即讨论科学的部分。历史故事只是为了证明作者的观点:人类行为93%是可以预测的.在日趋精密的数字技术条件下,有了从四处搜集来的信息,我们不会再把人类的行为视为互不相关、随意偶然的独立事件。相反,它们应该是相互依存的奇妙大网的一部分,是相互串联的故事集中的一个片段。它们会在不经意时显示次序,在意想不到之处偶然出现。人类行为遵循着一套简单并可重复的模型,而这些模型受制于更加广泛的规律。 巴拉巴西这里讲的实际是语义网络的道理。根据语义网络理论,一个词最初有许多歧义,但一旦被放在由它的上下文编织的语境网络中,它的微言大义就会被精确锁定。 如果把人类行为比喻成这个词的话,人的内心想法十分微妙,往往只可意会不可言传,说出就是错,自身都可能都搞不清楚自己想要的到底是什么。但借助大数据,可以象解梦那样,把这种潜意识层面的不可道之道,借助种种蛛丝马迹,判断出来。第218页提到:我们经常会夸大自己和别人的不同,总以为自己的生活比起周围的人来要更规律或更不规律。然而,事实上不管你是艺术家、摇滚乐手、会计,还是大公司的总裁,一旦将你的日常生活量化,你的可预测程度和你的邻居相差无几。由于人类行为遵循的上述规律,作者认为,人类是很好预测的,“无情的统计规律使得异类根本不存在,我们的行踪都深受规律影响”。也即,“每个人都是习惯的奴隶”。虽然人和人之间是有差异的,可预测的程度也不尽相同,但总体上看,你逃离你常规生活轨迹的概率不大。 爆发的规律,被作者视为宇宙运行的科学。人类行为并不象自然界那样多是随机运动,而可能在意向作用下表现出非常规的突变的行为。在这种时候,对未来的测量和计算,最重要的先决条件,就是知悉一个人的历史。作者在此用熵来表示一个人行为的可预测性,可预测性越高,熵值越低——完全可以被预测的人熵值为零。那么,对你的历史知道的越多,你的熵值就越低,发散的可能性就越小,越是依赖,隐私越少,熵值就越小。说实话,这并未将全书的理论和逻辑推向高潮,相反,它似乎令话题落回到一个人人熟悉并且认可的原则:未来是由历史决定的。但谁又能全盘否定这些假设和理论背后的意义呢,至少作者以一种繁复得近乎精巧的方式,讲述了一系列证明的可能性,它提供了一种大数据时代理解互联网和人类行为的思路。第12页写到:我们的电子邮件都保存在电邮供应商的日志文件中;我们的通话记录都被加上时间标记备份在电话公司的大容量硬盘上;我们何时何地买了什么东西,我们的喜好、品味以及支付能力都被信用卡提供商编目归档;我们所有的个人网页、空间、facebook文件,还有博客的信息都被保存在多个服务器上;我们的即时行踪完全被手机供应商掌握;我们的容貌和穿衣打扮都被安装在各大商场和街角的摄像头捕捉并记录。商家通过这些数据,确实可以预测客户的行为,从而提供有别于他人的个性化服务。从这个意义上来说,巴拉巴西的预言是有道理的。 在此之余,我对以上的内容进行了反思,本书给出了统计数据,但没有分析这背后的成因,而且统计作用并不是决定作用,每个人可能都会有自己的判断。人具有自由意志,这是不同于分子随机运动之处,我们有可能成功预测到一个沉默的人在某个时刻突然爆发,但要看透他内心深处真正的意愿,光有科学和技术可能还是不够的。举个生活中的例子,腾讯QQ空间中的亲密度即一个统计数据,它反映的仅仅是在通讯工具中的活跃程度,而非交往的深度,也许亲密度很高的两个人之间关系很一般。 预测之准确性有两个方面的内容,一个是前期大量采集样本数据的积累,一个是预测模型,而预测模型本身又是通过前期不断预测和修正逐步精确的。预测不可能100%准确,但是我们能够增加预测准确性的概率。由于混沌理论和不确定性,预测复杂度不断增加,特别是对结果造成影响的各个因子会越来越多,有些因子可知但是基于样本,有些因子其本身就还处于未知和探索阶段。人类行为产生的数据是典型的大数据,那么人类行为的可预测性首先在于数据的采集和清理上面,但是客观要能够反映主观不仅仅是数据层面的问题,更多的是对人类行为动机分析上面。我们看到预测本身又分为短期和长期,有时候是分析长期趋势容易,分析短期波动困难,如大经济预测。有时候又是预测近期容易,预测远期困难,如天气预测。人类行为之预测正是长远期困难,其一个重要原因是远期预测往往基于中期预测之多个因子,中期预测的细微偏差都直接导致了远期预测的巨大偏离。 每个人都是有自己的习惯,而好的习惯通常和“坚持”一词相关联,这很正常,因此我认为行为可被预测不仅仅有单调性这一个缺点。另一方面,人的内心不可预知,像基因突变一样稀少的7%的不可预测的行为带来或优或劣的影响。一个人的行为93%可预测并不可怕,也许让一个人一辈子都记忆深刻的事情,且不说是后悔还是幸福,也许来自那7%不可预测的行动,首先九成以上的可预测是否能给我们指出剩下不可预测的部分包括哪些?另外怎样评估那7%对一个人行为预测的权重?个人的行为模式分布特点如何成为群体行为模式预测的基础?93%的个体行为能被预测未必就能告诉我们关于未来的答案,因为很可能是那7%的无法预测的人改变了人类,比如你们都喜爱的乔布斯,或者咱们国家的毛泽东,谁能预测他们呢?但他们改变了世界。 物理学家也许希望发现历史的宿命,但人通过知识获得解放,不仅是为了排除不可能的自由,更是为了增加可能的选择。我以文学艺术方面为例,大数据能预测到苏东坡在哪个时间哪个地点灵光乍现,写出怎样的作品吗?或许今后我们将致力于将可预测的那绝大部分外包给机器和人工智能,去体验那连自己都不可预知的自由。 梁力文 201812227 本文来源:https://www.wddqw.com/doc/6ee3c51bcf2f0066f5335a8102d276a2012960f5.html