David Rothschild是微软纽约研究院一名经济学家, 2013年,他猜中了奥斯卡全部24个奖项中19个的归属;今年奥斯卡他进一步发威,猜中了21项奥斯卡奖!是不是以后就不用蹲守在电视机前忍受主持人卖关子了,提前看看David Rothschild的预测,就把奥斯卡获奖名单预见个八九不离十了?
他不止预测奥斯卡。在2012年的总统大选中,他成功猜对了51个选区中的50个区的结果,准确率高达98%,现在他在网站上主要发布体育和政治方面的预测。Rothschild很少失手,因为他有个杀手锏叫“大数据”。
预测有多神?
精确到百分比,一眼看出谁输谁赢
Rothschild用百分比表达预测成真的可能性。来看看之前他对今年几个奥斯卡重要奖项的预测吧,得票最高的分别为:
最佳影片:《为奴十二年》,88.7%
最佳导演:阿方索·卡隆(《地心引力》), 97.6%
最佳男主角:马修·麦康纳(《达拉斯买家俱乐部》), 90.9%
最佳女主角:凯特·布兰切特 (《蓝色茉莉》), 99.2%
最佳男配角:杰瑞德·莱托 (《达拉斯买家俱乐部》),97.9%
最佳女配角:露皮塔·尼永奥 (《为奴十二年》),60.1%
从他的统计结果来看,阿方索·卡隆拿下最佳导演奖是板上钉钉;但有些奖也有不定因素,比如《她》和《美国骗局》获最佳原创剧本奖的概率分别是56.3%和41.8%,咬得相当紧,不过这一项他还是猜对了。
怎么办到的?
收集大数据,不断更新模型
在网络时代,每个人都会在互联网上留下痕迹,几何级的数据正在构建出一个新的世界。高明的政客、风投者、互联网大佬,无不动用大数据为自己指明前进方向。Rothschild的通用预测方法是关注四个领域的数据:投票数据、预测市场数据、基本数据和用户产生的数据,对于奥斯卡,则主要关注投票数据和用户数据。这些数据来自哪?博彩网站、好莱坞证券交易所、各个前哨奖项、公开的用户数据等等,然后建立极其复杂的数据模型,并且不断更新数据、校正误差、升级模型。
所以,Rothschild的预测跟明星、影迷们的预测都不同,他不掺杂任何私人趣味,纯粹以数据说话。
他还跟微软团队联合开发了一款Excel应用——Oscars Ballot Predictor(奥斯卡投票预测器),用户可以实时记录和查看奥斯卡奖预测。这也帮助团队实现了动态挖掘。今年是Rothschild第二次预测奥斯卡,相比2013年的预测,他修正了许多技术和方法,所以结果更加精准了。
想不到吧?看似主观的奥斯卡评选其实也可以“算”出来!
|