说实话,我也没有见过大数据,我更愿意说这是大数据时代!
或许是大数据太热了,啥学科背景的人都在谈论,特别是人文学者、商界人士都在谈论,说明大数据时代到了,是他们点燃了大数据时代,这该感谢!
巴拉巴西的中文版《爆发》一书出版,俺写了推荐语:
这是一个令人兴奋的时代,也是一个大数据的时代,社交媒体让我们越来越多地从数据中观察到人类社会的复杂行为模式。以数据为基础的技术决定着人类的未来,但并非是数据本身改变了我们的世界,起决定作用的是我们对可用知识的增加。
1)数据有多大——就是用现有的软件和在可容忍的时间内处理不了的数据就是大数据,一般说来就是:G级或T级数据;但我处理过2.6亿的数据,可以用时间换空间;大数据不仅仅是大,而是边分析边生产边应用;就像微博抓取“春晚”或您的微博,但分析过程中可能又有大量数据产生。
2)大数据与传统统计分析完全不同了,不强调抽样,强调关系不关心因果,解决是什么,不问为什么!特别是:公开易获得、非结构化、可分析个人,强调关系,解决的是人的数据和关系,特别是社会科学领域的数据(传统数据都是结构化的商业数据),所以大数据更关心对社会情绪、舆情、预测电影票房等,简单说:有了FB、TW或微博才有了大数据的兴奋点
3)大数据的兴奋落地就是数据挖掘、文本挖掘和网络挖掘,挖掘是发现知识,不是传统统计的实证研究,可能没有假设!不仅有统计分析还要机器学习算法等,当然也涉及数据存储的方式,由此提到Hadoop、MapReduce、NoSQL等IT技术的变革
| 欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) | Powered by Discuz! X2.5 |