当前位置首页 > 其他范文> 正文

《爆发:大数据时代预见未来的新思维》读后感_5500字

《爆发:大数据时代预见未来的新思维》读后感5500字

本书的作者是艾伯特-拉斯洛·巴拉巴西,他是一位科学巨星,也是诺贝尔物理学人选之一,同时创办了无尺度网络公司,主要研究领域是复杂网络科学,并在物理学、生物学、计算机、社会学等领域都颇有建树。他在科技界的影响力相当大,在学术界,有一个指数叫“H指数”,H指数能够比较准确地反映一个人的学术成就。一个人的H指数越高,则表明他的论文影响力越大。我们熟悉的霍金,他的H指数约为62,而这位作者的H指数竟然高达97。所以,有人评论本书作者,说他如果愿意的话,他甚至可以控制整个世界。正是基于这样的好奇心,我们有必要去了解一下本书,这本书也是作者的精彩作品,它结合了人类行为学、大数据科学及复杂网络研究。本书其实是分为两大部分,分别是小说和非小说两部分。这里讲的内容,只要是关于非小说部分。

通过本书,我们可以了解人类行为背后的行为模式,也就是作者提到的“爆发模式”,通过深入了解爆发模式,我们可以精确地预测一个人的行为,甚至是整个人类社会。虽然不同的个体,在行为的细节方面,有很大的不同,但从数据科学家的眼里,这些差别都是可以忽略不计的。不管你的生活是朝九晚五,还是行踪不定,最大的差别,只有在10%左右。所以,这一切都是人类会遵循一些原则,决定了爆发模式产生的原因。那这些原则是什么呢?我们会在后面部分讲到。

首先,我们先了解一下,什么是人类行为的爆发模式,它产生的原因是什么?我们要先了解这些概念才能更好地理解本书的关键思想。其实,爆发模式,正是一个遵循幂律分布的一种现象。我们都知道正态分布,也叫高斯分布,它是一个相对均衡的分布,如我们的身高、体形、成绩等。虽然这些因素,每个人各有不同,但其实,他们的差别都不会太大,因为这些分布,还是基于一个正态分布的基础上。而另外一种分布,即幂律分布,就完全不同了,它的分布是极不均衡的。如比尔·盖茨一个人的财富,就可以富可敌国。这种分布是极不平均的,比如说,在一个房间里,有10个人,每个人的收入约1万元左右,那么,整个房间的平均收入就是1万元左右,但是,如果比尔·盖茨走了这个房间,他会把整个房间的平均收入极大地提升,按平均值来计算,每个人都是亿万富豪,但事实是,其余的10人,实际收入还是1万元左右。这种分布极不均匀的情况,就是幂律分布,类似于马太效应或二八原理。世界上很多的东西,如财富,人口分布,市场份额等,都存在这种效应,只有极少部分的人或事物,决定了80%的部分。也就是说,这20%是整个部分的关键部分。正如,亚马逊云服务的市场份额,是其他所有竞争对手的13倍,在互联网行业中,马太效应更加明显。因为互联网技术,会极大地推动信息的传递速度,同时可以实现跨地区服务,这些跟传统行业有很大的不同。另外,国内的滴滴出行,就是一个例子,一旦形成了垄断,所有的资源都会向一家靠拢,强者更强,而弱者几乎是没有生存空间。我们现在所见到的,只有一家独大的滴滴,就是一个例子,起码在出行这一块,无人能敌,所向披靡。所以,马太效应,在任何行业都存在,甚至连国家的人口分布,也是一样,全球200多个国家中,人口过亿的,只有13个,这也充分体现了二八原理,即少数的部分,是整个事物的关键部分。

正是因为任何方面,都或多或少地存在二八定律,而我们人类在行为模式上,总会偏向于做“高价值”的事情,我们在做一件事情的时候,会优先考虑做这件事情的价值和意义。这也符合英国经济学家大卫·李嘉图提出的“比较优势理论”,我们总会“两利相权取其重,两弊相权取其轻”的原则来做一件事情。正是这种无时无刻的判断与选择,主动地支配行为,导致了爆发模式的产生。其实这些原因是非常好理解的,因为我们的事情太多,而我们的时间有限,每天只有24小时可以支配,不管你是富人还是穷人,在时间这个问题上,人人平等。这种时间有限,任务无限的矛盾,会让人类做事情的时候,会自然而然地遵循一个“优先级原则”。所以,就有了时间管理、任务管理等这些理论。按时间管理的理论,我们会把任务分了4个不同的类型,分别是“重要不紧急”、“重要紧急”、“不重要紧急”和“不重要不紧急”,聪明的管理者,都会优先做那些“重要不紧急”的,如果我们能提前完成这种任务,就不会出现“重要紧急”的任务了。正是人类这种主动的选择,导致了爆发模式的产生,从而导致资源分布不均,从而出现幂律分布。包括互联网产品,领先者一旦形成了网络效应,所有的资源都会向它靠拢,导致其他产品用户量极少,甚至无法生存。说到这个话题,提醒一下创业者,如果自己不是有特殊的优势,最好的创业方式就是借助平台的力量,即学会站在巨人的肩膀上。比如说,如果你要做电商,一开始就自己做一个独立的门户网站是很不明智的,上面已经谈到,这些并不是能力的问题,而是时机,一旦在一个行业中,有明显的老大,后来者,要么差异化,要么细分市场,或者依靠大平台提供的机会。自己从零开始做一个网站,不符合精益创业中提到的“最小成本,快速试错”的思想。自己建立一个独立的网站,看似是好的想法,但实际是很不明智的。这里面的不确定性太多,最大的问题是,如何推广你的网站,流量从哪里来,事情并没有你想像那么简单,并不只是建立一个网站的问题,还涉及到运营、推广、品牌建设等一系列的问题。创业涉及的因素越多,失败的概率就越大。段永平说:“做企业就如同高台跳水,动作越少越安全。”是的,我们要减少动作,增加成功的概率,所以,开始的时候,能借助大平台,如淘宝,先在淘宝开个天猫店之类,成功的概率会更高,最起码,在网站建设方面,你不要去思考,你只需专注于做好产品、品牌和推广这些问题。如果见到自己的天猫店,有了起色,再自己建立独立的网站也不迟。

既然人类有这些爆发的模式,我们也知道了爆发模式产生的原因,那我们是否能预测人类的行为?答案是肯定的。作者提到虽然每个人的具体的行为方面,各有不同,但一旦把这些行为进行了数学化、公式化和模型化后,得出的结果都是很相似的。不管是朝九晚五的上班族,还是经常出差的商务人士,他们在做选择的时候,都会遵循优先级原则,考虑一件事情是否值得做前,都会思考做这件事情的意义,是否最有利于自己。一旦有了这个优先级的原则,其实,人类行为的本质,在底层都是一样的。当获取的信息足够多的时候,如大数据,在数据科学家的眼里,人类的行为预测性都相当高。并且这个可预测的程度,竟然高达80%到93%之间,也就是说,普通人跟行踪不定的人士之间的可预测性,只差13%左右,而大部分都是可以预测的。数据科学家可以预测这些人类行为的一个依据是“熵值”。什么叫“熵值”呢?熵值是热能的计量单位。当一个人每天在固定的时间起床、固定的时候上班或下班,如上班族。那么他们的行为可预测性是相当高的,你几乎可以按照这些人的行踪来设置你的时间。那么,这种人的熵值就是0,而那些行踪很不确定的人士,熵值比较高。但一个人,并不是每天都行踪不定。只有个别日子,才会出现这些不确定性,但大部分时间时,都是可预测的。不管是什么人,他总要回家,总会有几个相对固定的出没场所,如办公室、咖啡馆等等。数据足够多的时候,那些相对不确定的数据,就可以被忽略掉,而得到测试程度很高的数据分析。在美国,有一个网站,做了一个实验,叫“Wheres George”,意思是“乔治在哪?”乔治是谁?他就是美国第一任总统乔治·华盛顿,也就是一美元上的人物。这个网站的实验是这样的,在一美元里,会写上这个网站的网址,人们会出于好奇,按这张一美元所写的网址,打开网站,按照网站的要求,输入这张一美元的序列号,同时提供这张一美元的当前位置。参与者觉得很有意思,慢慢这个活动就被传播开来了,经过一段时间后,这些一美元的行踪就被完整地记录到网站中。后来的数据分析结果是,绝大部分的一美元,都是在方圆几公里内传播,只有极少数的“异类”被传播到方圆几百公里之外。数据的结果表明,即使在货币的传播过程中,同样遵循爆发模式。其实,货币传播的路径,正是人类行踪的路径,同时也表明,绝大多数人的行踪是相对固定的,他们的“熵值”很低,可预测性极高。

既然我们清楚了爆发模式产生的原因。那了解这些知识有什么用呢?通过了解这个模式,你就会发现生活中,马太效应或者二八定律,无处不在。了解这些之后,就可以解释很多现象,从此你也不用再迷茫。首先,你要了解清楚,爆发模式产生的根本原因是:人类总会按照优先级原则,对进行进行优先级选择。有些事情,会不断被强化,而有一些事情,可能会一直被忽略。正如出版的众多书籍中,也是遵循这个幂律的分布,极少数的书籍,才会成为畅销书,而大分部书籍都是很少读者,甚至是无人问津。如果你要出版一本书,希望不要期望太高,否则,你会以失望而告终。毕竟销量好的书籍,只是少数,而大部分书都是很少读者的。你出版一本书之前,计算自己的成功的概率,请不要以畅销书为准。你可以有畅销书的目标,但不要把这个当作唯一的目标,因为很可能就是不能实现。如果你了解爆发模式,你就可以清楚地知道,人类总会选择优先级更高的事情,导致这些情况,最主要的问题是时间有限。一个想学习的人,他一定思考如何才能用最少的时间,获取最多的知识,或者获取到高质量的知识。一个人选择一本书,要么看网上的书评,要么是朋友推荐等。评价越高的,你就越偏向选择这样的书来看,那些已经在榜单上的书籍,就是你的首先要考虑的。而一本刚刚上市的书籍,尽管它的质量很高,在前期,人们关注度就会很多。评价越高的书,就会越多人关注,而越多人关注的书籍,也会反过来强化它的评价。这就是一种“复利效应”,即A会导致B的发生,而B又会影响到A,周而复始地相互影响。而那些刚上市的书籍,就没有这个效应。因为要产生良好的复利效应,前提就是要有一定的关注量,很显然,刚上市的书籍是没有这个机会的,除非一个机缘巧合的机会,被某个大咖关注到,被他转发分享,从而影响到一大群人,但这些都是小概率的事情。如果你能从客观的角度来看待这些概率,你就明白,时机的重要性,很多东西,都是先进入者有优势。正如现在淘宝店皇冠很高的商家,正是一些比较早期入驻淘宝的先行者。后来者的机会会极少,在淘宝店里,绝大多数都是不赢利的。其实想想也正常,如果绝大多数都赢利,反而不正常,因为那样不符合客观的规律,这些都是人类行为主动选择的结果,人都会有从众的心态,一旦一个网店有了名气,你很自然地就会优先考虑登录这个网店去购买东西。长年累月,你的习惯就慢慢形成的,要让你做出改变而选择其他不知名的品牌,你就会犹豫了,这些都是人性,人是最怕离开自己熟悉的环境的。如果你看过《长尾理论》这本书,你就会明白这样一个现实:2011年,共有102首单曲的下载量超过100万次,销量达整体的15%。注意这可不是打印错误:在当年售出的800万首单曲中,0.001%的作品创下了1/6的总收入。可以说,头部极少数的爆款起到了关键性的作用。这一走势也表明,爆款的影响力在不断加强。这就是马太效应,强者更强,特别是互联网技术的发展,会进一步放大这样的差距。所以,我们要想办法让自己的产品成为某个领域,甚至是细分领域的头部,也就是我们常说的“宁为鸡头,不为牛后”,想办法让自己在领域中做到第一名。

正是爆发模式,会导致分布不均匀,在生活上也体现得淋漓尽致。我们也知道二八定律的由来,它是由19世纪末20世纪初意大利经济学家巴莱多发现的。巴莱多发现他后花园的土豆,80%的产量,来自20%的土豆。后来,经过他细致的观察,发现很多领域,都或多或少地存在这样一个分布,包括财富、人口等,最终,总结出二八定律。正是这种分布不均匀,如果有一天,你跟你的朋友们,一齐去摘草莓,你如何才能在最少的时间里,摘到最多的草莓呢?数据科学家告诉你,最好的方式,不是总待在一个地方摘,也不是没有目的地到处摘。最好的方式,就是利用爆发模式的原理,因为这些草莓的分布,一定是不均匀的,总有一些地方,产量特别多。如果你总是待在一个地方,很可能你找的那个地方,并不是产量多的地方。你要做的是:随便找一个地方,找到后,以这个地方为中心,到周围几米内继续搜寻,当发现有产量比较多的点,就待在那里摘草莓,如果摘完后,你要做的是,不是继续在周围搜寻,而是去到一个比较远的地方,寻找新的机会。这种既考虑了周围小范围,又考虑远距离的潜在机会,是面对分布不均匀最好的方式,也是最容易找到最多产量的方式。因为爆发模式告诉我们,这些草莓的分布,一定是幂律的,有些地方,产量就是出奇地高。

其实,我们生物学里很多东西,都是有这种爆发模式的。比如说,转录因子,它们正是利用这种原理创造生命的奇迹的!我们知道,在DNA的双螺旋结构中,有30亿对碱基,转录因子要精准地找到匹配的位置,难度相当于在3962公里的公路上,找到一个像硬币那样的一个洞,从太空中,抛进洞里,难度可想而知了。但是转录因子却可以准确地、完美地完成任务!他们是怎么做到的呢?原理也是有点类似上面提到的找草莓的方式,某个转录因子会随机找到一个点,然后再在它周围一定范围内搜寻自己的位置,如果没有找到,他们不会继续在周围找,而去再离开,去到一个很远的地方,重新尝试。这种先小范围,再远距离,再小范围,周而复始地尝试,最终完成了这个不可能完成的任务。因为这种方式是最高效的,这也是爆发模式告诉我们的启发!

在医学界,也有使用到爆发的例子,他们只要通过简单的方法,就可以判断出谁是早期抑郁患者。医生们只要给病人戴上手腕加速传感器,通过观察数据就可以很准确地分析出结果,原因也是利用到了爆发模式,正常人长时间的停顿,大约在7分钟左右,而一些早期抑郁患者,他们却比正常人有更长的停顿时间,他们是15分钟左右。只要通过这些异常值,就可以找到患者,从而给予早期治疗。这里面的原理,也是爆发模式的原理。

本文由 文言宝 整理,转载请保留链接: https://www.wenyanbao.com/html/20230112/35428.html

猜你喜欢