数学建模社区-数学中国

标题: 大数据——互联网时代的重大话题 [打印本页]

作者: Emma爱精算    时间: 2014-4-5 23:48
标题: 大数据——互联网时代的重大话题
大数据(big data),指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法这样的捷径,而采用所有数据的方法,即样本=总体的思想。
那么大数据与数学建模有什么关系呢?
我不久前曾写了一篇关于大数据的文章,在保险领域的重要作用,同样的,如果你有一双敏锐的眼睛,你就会发现我们遇到的建模竞赛题目这几年越来越偏向“大”数据的处理问题,这里的大数据要远远大于数学建模当中给的数据。



“大数据”[2]作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。
对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据”这个术语最早期的引用可追溯到apache org的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌MapReduce和GoogleFile System (GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。



当前用于分析大数据的工具主要有开源与商用两个生态圈。
开源大数据生态圈:
1、Hadoop HDFS、HadoopMapReduce, HBase、Hive 渐次诞生,早期Hadoop生态圈逐步形成。
2、. Hypertable是另类。它存在于Hadoop生态圈之外,但也曾经有一些用户。
3、NoSQL,membase、MongoDb
商用大数据生态圈:
1、一体机数据库/数据仓库:IBM PureData(Netezza), OracleExadata, SAP Hana等等。
2、数据仓库:TeradataAsterData, EMC GreenPlum, HPVertica 等等。
3、数据集市:QlikView、 Tableau 、 以及国内的Yonghong Data Mart

作者: 平凡之不凡    时间: 2014-5-12 12:20
赞一个
作者: 空木葬花    时间: 2014-5-14 18:44
非常感谢楼主!
作者: 空木葬花    时间: 2014-5-14 18:44
非常感谢楼主!
作者: 空木葬花    时间: 2014-5-14 18:44
非常感谢楼主!
作者: Emma爱精算    时间: 2014-5-15 19:20
空木葬花 发表于 2014-5-14 18:44
非常感谢楼主!

谢谢关注本帖
作者: Emma爱精算    时间: 2014-5-15 19:20
空木葬花 发表于 2014-5-14 18:44
非常感谢楼主!

谢谢!
作者: Emma爱精算    时间: 2014-5-15 19:21
平凡之不凡 发表于 2014-5-12 12:20
赞一个

谢谢1
作者: shuxue_jing    时间: 2014-5-17 23:07
赞!!!!




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5