QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1398|回复: 0
打印 上一主题 下一主题

大数据时代——学生读书笔记

[复制链接]
字体大小: 正常 放大

343

主题

41

听众

214748万

积分

升级  0%

  • TA的每日心情
    擦汗
    2015-7-24 10:40
  • 签到天数: 37 天

    [LV.5]常住居民I

    社区QQ达人 邮箱绑定达人 元老勋章 发帖功臣 新人进步奖 优秀斑竹奖 金点子奖 原创写作奖 最具活力勋章 助人为乐奖 风雨历程奖

    群组MATLAB的工程数学应用

    群组SAS公益讲座

    跳转到指定楼层
    1#
    发表于 2015-1-28 16:21 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta

      1、世界的本质就是数据。

      2、大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。

      3、从因果关系到相关关系的思维方式变革才是大数据的关键。

      4、建立在相关关系分析法基础上的预测才是大数据的核心。

      5、过去正像刺青一样可在我们的数字皮肤上,遗忘已经变成了例外,而记忆却变成了常态。

      6、观念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。

      7、某些观念有时会以惊人的力量给知识状况带来巨大的冲击。

      8、因为越是万能的,就越是空洞的。

      9、努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。

      10、以一种前所未有的方式,通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见。

      11、数据的奥妙只为谦逊、愿意聆听且掌握了聆听手段的人所知。

      12、大数据是人们获得新的。认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。

      13、这仅仅只是一个开始,大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说只需要知道是什么,而不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。

      14、传统数据库结构化查询语言(SQL)的要求,关系型数据库(NoSQL)不再有这些要求。

      15、事情真的在快速发展。人类存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度则比世界经济的增长速度快9倍。难怪人们会抱怨信息过量,因为每个人都受到了这种极速发展的冲击。

      16、大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度,正是主宰这场游戏的关键。

      17、大数据对个人的影响是最惊人的。在一个可能性和相关性占主导地位的世界里,专业性变得不那么重要了。直觉的判断被迫让位于精准的数据分析。

      18、我们大部分的习俗和惯例都建立在一个预设好的立场上,那就是我们用来进行决策的信息必须是少量、精确并且至关重要的。但是,当数据量变大、数据处理速度加快,而且数据变得

      不那么精确时,之前的那些预设立场就不复存在了。此外,因为数据量极为庞大,最后做出决策的将是机器而不是人类自己。(负面影响)。

      19、统计学家们证明:采样分析的精确性随着采样随机性的增加而大幅提高,但与样本数量的增加关系不大。虽然听起来很不可思议,但事实上,一个对1100人进行的关于“是否”问题的抽样调查有着很高的精确性,精确度甚至超过了对所有人进行调查时的97%[3]。这是真的,不管是调查10万人还是1亿人,20次调查里有19次都能猜对。为什么会这样?原因很复杂,但是有一个比较简单的解释就是,当样本数量达到了某个值之后,我们从新个体身上得到的信息会越来越少,就如同经济学中的边际效应递减一样。

      20、要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。

      21、相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。我们已经看到过这种很强的相关关系,比如谷歌流感趋势:在一个特定的地理位置,越多的人通过谷歌搜索特定的词条,该地区就有更多的人患了流感。相反,相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生变化。

      21、快速思维模式使人们偏向用因果联系来看待周围的一切,即使这种关系并不存在。这是我们对已有的知识和信仰的执著。在古代,这种快速思维模式是很有用的,它能帮助我们在信息

      量缺乏却必须快速做出决定的危险情况下化险为夷。但是,通常这种因果关系都是并不存在的。

      22、数据化,不是数字化。

      23、量化一切,数据化的核心。

      24、当文字变成数据,它就大显神通了——人可以用之阅读,机器也可用之分析。

      25、从而使情绪数据化得以实现。LinkedIn将我们过去漫长的经历进行了数据化处理,就像莫里转化旧航海日志那样,把信息转化为对现在和将来的预测:我们可以认识谁,或者哪里存在一份心仪的工作。

      26、数据的基本用途为信息的收集和处理提供了依据。

      27、不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。

      28、数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。

      29、第三种类型是有着大数据思维的公司和个人。他们的优势在于,他们能先人一步发现机遇,尽管本身并不拥有数据也不具备专业技能。事实上,很可能正因为他们是外行人,不具备这些特点,他们的思维才能不受限制。他们思考的只有可能,而不考虑所谓的可行。

      30、所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。

      31、同样地,人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据做出的最大贡献之一。行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。他们的判断建立在相关关系的基础上,没有受到偏见和成见的影响,这就如同莫里中校不把干瘦的船长在酒吧喝酒时所说的航道信息当真一样。他们的判断完全依赖于汇集起来的数据所显示出的实际信息,所以有着牢靠的根基。莫里所采用的方法并没有解释风向和水流为什么是这样的原因,但是对于想安全航海的航海家来说,“什么”和“哪里”比“为什么”更加重要。



    扫描下方二维码,关注数学中国微信获取更多实用信息!


    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    你看得见我打在屏幕上的字,却看不到我掉在键盘上的泪
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-6-19 19:09 , Processed in 0.332661 second(s), 54 queries .

    回顶部