《为数据而生:大数据创新实践》读后感900字
#读书 《为数据而生》
part1,大数据时代,用数据说话。这一章是全书最值得看的。周涛巧妙的引入大数据概念-我们每个人都是数据主动或被动创造者。(周涛举的 摄像头记录小孩成长视频;以及自己童年观看神雕侠侣的例子,太有才了!)形象介绍了什么是大数据-结构化与非结构化(讲得非常好),以及大数据的几个类型/地点、个人等,说明大数据的意义:驱动新工业革命。
总结他对大数据定义:非结构化、跨域关联。(细说跨域关联:与人和地点相似,针对一款游戏、一家中小企业、一个网站、一种产品,等等,都能够找到来自不同源头的数据,这些数据围绕一个个体关联起来,可以产生一加一远大于二的价值。进一步地,这些不同个体之间也能够产生关联,比如我们通过手机的GPS信号和签到信息,就能够知道哪些人去过哪些地方,从而把地点和人关联起来;通过销售记录能够知道哪些人购买过哪些产品,从而又把产品和人关联起来。)
part2,分析。关联规则、预测。(2013 复杂网络大会 Linkprediction真对大规模社交网络的链路预测方法获得一等奖 )
part3,外化。两部分1.个人感觉全是例子,价值不大。外部数据对于解决问题的帮助,例子都是很新很好的成果。2.机器学习的引入:掌握了统计理论能帮助避免重大失误,机器学习能帮助得到一个还算不错的(不一定最佳)方案。 机器学习三板斧:特征、模型、融合。提取特征、建模解决问题(分类器n)、多模型融合提高精确度(boosting、随即森林等)(想起google机器翻译是融合了4.5亿个模型)
part4,集成。不知这标题什么意思,讲了数据交易;介绍了两个数据比赛:数据城堡、kaggle;大数据创业公司的难处。本章讲的东西,我现阶段(2016年)不care。
结束语:八步成为大数据公司。略
整体而言,我个人感觉他的总结没有 大数据时代 这本书“实用”,但我也推荐。《时代》这书介绍了什么是大数据,有哪些种类,采用的处理技术等,更像是教科书。这本书,写得很有新意,很幽默,很多引入都非常巧妙,part1强烈推荐数据小白看看。其余部分,更多的是举例子,优点是周涛用很清晰的例子来阐述大数据的应用,大部分都是总结最新的paper,而且一句话解释论文核心很到位,这个功夫我要学习。缺点是理论性的总结不够。还有像part4,大数据公司,写的其实蛮好,但不是我现阶段关注的。
本文由 文言宝 整理,转载请保留链接: https://www.wenyanbao.com/html/20230103/20313.html