《经济学人》年度商业图书:魔鬼统计学-[美]艾瑞斯
你好!我是陪你一起进阶人生的范老师!愿你成才!助你成长!大家好!我是数学中国范老师,什么是超级数据分析?它是影响现实决策的统计分析。超级数据分析公式预测通常是大小、速度和规模的某种组合。从观测值的数量和变量的数量来看,数据集合通常很大。其次,分析的速度正在加快。书中第二章是讲数据分析的随机化与最优解的,这个数学建模竞赛也是可用的。有更详细的千字介绍内容,请点击链接查看帖子下方。
注册登录后,右上角点击签到就会随机赠送10点左右的体力值!点击文件图标可以立即下载文件
新用户注册,可以联系我们的工作人员QQ南方:3242420264 乔叶:1470495151 淡妆:1917509892,帮你快速审核+修改用户组后,可以右上角签到获取体力值,一次注册,日后大量数学建模资源即刻拥有。
2024数学中国“认证杯”数学建模网络挑战赛,第二阶段开放报名中,每个阶段都有独立证书,未参加一阶段也可以直接参加二阶段。比赛的获奖证书由内蒙古数学学会颁发,二阶段赛题难度等同于国赛,适合验证参加国赛的水平,同时我们会给出免费评语,指引参赛队伍的后续提升方向。
二阶段报名官网:http://www.tzmcm.cn/shiti.html
注:已报名一阶段的无需重复报名二阶段
详细介绍:
本书的核心观点是,数据分析在葡萄酒和棒球领域的兴起不是孤立事件。实际上,葡萄酒和棒球的案例是本书核心主题的缩影。
我们正处于马车和火车相互竞争的历史性时刻,我们的直觉和经验知识正在一次又一次地输给数据分析。过去,许多决策仅仅依赖于经验和直觉的某种结合。专家凭借几十年的个人试错经历获得了神圣地位。我们相信他们知道最好的行事方式,因为他们之前做过几百次同样的事情。经验型专家的角色被保留下来,而且发展得很好。如果你想知道某件事情应该怎样做,你应该询问银发老人。
现在,一些事情正在发生变化。商业和政府专业人士正在越来越多地用数据库指导他们的决策。对冲基金的故事实际上是新一代数据分析师的故事-我称之为超级数据分析师一他们分析大型数据集,以便在看似无关的事物之间发现实证关联。想为大量购买欧元避险吗?事实上,你应该卖出由26 种其他股票和商品精心搭配而成的投资组合,其中可能包括沃尔玛股票。
什么是超级数据分析?它是影响现实决策的统计分析。超级数据分析公式预测通常是大小、速度和规模的某种组合。首先,从观测值的数量和变量的数量来看,数据集合通常很大。其次,分析的速度正在加快。我们常常可以看到与数据生成同时进行的数据分析。最后,影响的规模有时是很大的。这不是几个书呆子在制造戏谑式的期刊文章。超级数据分析有些是由决策者执行的,有些是为决策者执行的,这些决策者希望寻找更好的行事方式。
当我说超级数据分析师在使用大型数据集合时,我指的是非常大的数据集。企业和政府的数据集合正在越来越多地用太字节甚至拍字节(1,000 太字节)衡量,而不是用兆(M)字节或吉(G)字节衡量。1太字节(terabyte)相当于1,000 吉字节。前缀tera 来自希腊语,表示怪兽。一太字节的确十分庞大,像怪兽一样。整个国会图书馆大约有20太字节文本。本书的一个目标是让大家开始习惯这个前缀。例如,沃尔玛数据库存放了超过570 太字节数据。
谷歌拥有大约4拍字节存储量,它在不断对其进行分析。太字节挖掘不是巴克·罗杰斯(Buck Rogers)的幻想-一而是正在发生的事情。
在一个又一个领域,“直觉主义者”和传统专家正在对抗超级数据分析师。在医疗领域,关于“循证医学”的激烈争论可以归结为是否根据统计分析选择疗法。直觉主义者不会束手就擒。他们说,数据库永远无法体现出临床专家通过一生的经历培养出来的知识,回归永远无法和拥有20年经验的急诊室护士相比,后者可以判断一个孩子看上去是否有问题。
我们往往认为,国际象棋大师加里·卡斯帕罗夫(GarryKasparov)之所以输给深蓝计算机,是因为国际商用机器公司的软件更加聪明。那个软件实际上是一个为不同局面排序的大型数据库。
计算机的速度很重要,但是最具决定性的是计算机访问70万盘大师棋局数据库的能力。卡斯帕罗夫的直觉输给了基于数据的决策。
超级数据分析师不仅在入侵传统专家的地盘并取代他们,而且正在改变我们的生活。他们不仅在改变决策方式,而且正在改变决策本身。棒球球探之所以输给分析师,不仅仅是因为分析数据比搭乘飞机前往帕路卡维尔成本更低。最主要的原因在于,数据分析得到的预测结果更加准确。当然,超级数据分析师和专家并不总是存在冲突。数据分析有时会证实传统观点。世界不是绝对的,传统专家不会永远犯错,他们的表现至少比碰运气要好。不过,数据分析仍然可以引导决策者做出不同的决策。总体而言,这种决策比之前要好。
在一个又一个领域,统计分析在完全不同的信息之中发现了一些隐性关系。如果你是政客,希望知道谁最有可能为你投票以及哪种拉票方式最有可能成功,那么你不需要凭空猜测、遵循经验规则或者信任头发花白的传统主义者。相反,你可以从不同特性中梳理出越来越多的可测效应,从而更好地知道哪种拉票方式效果最好。
数据库搜索可以揭示出传统专家从未考虑过的内在因素。在我们周围,基于数据的决策正在变得越来越多:租车公司和保险商拒绝向信用分数不佳的人提供服务,因为数据挖掘显示,信用分数与较高的事故概率存在相关性。
●现在,当航班取消时,航空公司会跳过常旅客,首先向那些最有可能选择其他航空公司的旅客提供开放席位。当然,这些旅客是通过数据挖掘确认的。航空公司不是遵循先来后到原则,而是根据几十项与消费者有关的因素提供服务。
《不让一个孩子掉队》法案要求学校采用由严格数据分析支持的教学方法。在其帮助下,教师花费高达45%的课堂时间培训孩子们通过标准化考试的方法。超级数据分析甚至使一些教师转向了每句台词得到编排和统计审查的课堂模式。
直觉主义者要当心了。本书将会讲述一系列超级数据分析的故事,向你介绍执行这些分析的人物。数字分析革命不仅与棒球甚至整个体育界有关。它关乎我们生活中的方方面面。很多时候,这种超级数据分析革命对消费者有利,因为它可以帮助商家和政府更好地预测谁需要什么东西。不过,在另一些时候,消费者需要面对以统计为武器的对手。数据分析会使普通人处于极为不利的境地,因为商家可以更好地预测他们能从我们身上榨取多少利润。
史蒂文·D.莱维特(Steven D.Levitt)和斯蒂芬·J.都伯纳(Stephen J.Dubner)在《魔鬼经济学》中提到了几十个案例,展示了对于数据库的统计分析是如何揭示隐秘因果关系的。莱维特和约翰·多诺霍(John Donohue,他是我的合著者和朋友,你在后面还会听到他的名字)指出,1970年堕胎率和1990年犯罪率这两个看似无关的数字存在重要关联。不过,《魔鬼经济学》并没有过多地谈论定量分析对于现实决策的影响程度。与之相比,本书会谈论数据分析的影响。商业和其他领域的决策者正在以你从未想象过的方式使用统计分析,以进行各种选择。
全球各行各业都在围绕现代计算机的数据库容量进行升级。万斯·帕卡德(Vance Packard)的《隐形说客》等作品展示了人们在 20 世纪 50年代至60年代的预期(和恐惧)一由大政府和大公司实施的复杂的社会工程即将控制世界。现在,这个预期突然在这一代人心中复活了。过去,我们认为大政府可以通过指挥和控制解决人类所有问题。现在,我们看到,类似的事情正在以大规模数据网络的形式出现。
本书的要点
接下来的五章将会详述超级数据分析在社会各领域的兴起。前三章将会向你介绍两种基本统计方法一一回归和随机化试验并且展示定量预测艺术是如何改变企业和政府的。我们将在第四章探索有关“循证”医学的辩论。第五章将会介绍诸多测试,以便对基于数据的决策与基于经验和直觉的决策进行比较。
本书第二部分将会回过头来评估这种趋势的重要性。我们将会探索为什么这一趋势发生在当下,以及我们是否应该对此感到高兴。第七章将从地位和自由裁量权的角度考虑谁在吃亏。最后,第八章将会展望未来。超级数据分析的兴起既不意味着直觉的终结,也不意味着工作经验失去意义。相反,我们可能会看到一个新的时代。届时,最优秀、最聪明的人既了解统计学,又拥有专业知识。
归根结底,本书并不想将直觉和经验知识排除在决策规范之外。相反,我会展示直觉和经验是如何与数据驱动型决策相互融合的。实际上,像史蒂文·莱维特这样的新一代创新型超级数据分析师可以在直觉和数据分析之间来回切换,从而看到直觉主义者和数据分析师永远无法看到的事情。
免责声明
有关资源均来自网络收集与网友提供,任何涉及商业盈利目的的均不得使用否则产生的一切后果将由您自己承担!本平台资源仅供个人学习交流、测试使用。所有内容请在下载后24小时内删除,禁止非法恶意传播不对任何下载或转载者造成的危害负任何法律责任!
不粗哦,下来看看啊
页:
[1]