QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 1003|回复: 0
打印 上一主题 下一主题

评析触不到的大数据 从预测未来到规避错误

[复制链接]
字体大小: 正常 放大
迷途        

551

主题

7

听众

651

积分

  • TA的每日心情
    开心
    2014-6-7 09:00
  • 签到天数: 7 天

    [LV.3]偶尔看看II

    网络挑战赛参赛者

    自我介绍
    数学中国
    跳转到指定楼层
    1#
    发表于 2014-5-10 14:13 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta

    最近这几年,我们可以听到很多关于大数据在影视方面的案例,Netflix 这个词估计大家都快听到耳朵起茧了,另外英国的一家做剧本语义分析的公司Epagogix也成为一个小热词,频繁被提及。神秘的大数据与神秘的影视行业,结合在一起之后,便有了玄学一般的色彩,似乎你今天在社交媒体上打了一个喷嚏,正在担心自己是不是感冒了,我明天就能做出一部关于禽流感的恐怖片,并且让你有不得不去看的冲动。


    事实上所谓《纸牌屋》式的成功,在视频行业的人都知道,与其当做一个技术发展案例来分析,不如将它作为一个公关案例来学习。原本在华纳工作的CMO Kelly Bennett 和来自迪斯尼的CCO Jonathan Friedland 通过《纸牌屋》这一事件让Netflix 变得更像一个电视台,而不是互联网企业,这其实是让Netflix 的想象空间变大了,因为互联网已经有了一家Youtube,但是还没有一家HBO 或者Showtime 。


    至于将大卫·芬奇、凯文·史派西,以及1990年的《纸牌屋》组合在一起,可以产生奇妙的化学反应,这种充满诱惑的想法一看便知是好莱坞经纪公司的手段,而不是属于大数据的语言体系。


    在《纸牌屋》的背后,大卫·芬奇和凯文·史派西同属一家经纪公司,这部电视剧的主要推手,是好莱坞的影子幕僚之一CAA 以及制作方MRC ,Netflix能够加入只是因为他们比有线电视台出钱更多。大数据在整部剧集中的作用,不会比在2008年将英剧《纸牌屋》推荐给MRC 联席董事长Modi Wiczyk 的那个实习生,所产生的价值更大。


    至于Epagogix ,所提供的服务也并不新鲜,好莱坞有上千名剧本医生,又便宜又好用。80年代之后,好莱坞的观众结构和观影偏好逐渐趋于稳定,对观众喜好的判断并不是个难题,目前在北美普遍采用的焦点访谈形式,所能获得的反馈也要更为具体和实用。


    从某个角度来说,好莱坞并不缺少好创意和好剧本,将文字转换成影像的过程,所存在的不可控要比一些娱乐报道中的公开信息复杂的多。如果单纯基于剧本和演职员搭配的角度,就可以预测未来高枕无忧,就好比我们是通过分析母鸡的体格,然后去判断一盘西红柿炒鸡蛋的受欢迎程度,它们二者之间必然互有相关,但是这种相关性不足以用来证明一名以泡面为生的宅男,为何会顿时爱上为他炒鸡蛋的MM。


    大数据为何近几年大热?


    人类进入大数据时代,类似于生物学迎来了显微镜,天文学发现了望远镜,因为网络传输和计算机存储运算能力的提高,交给了我们一把信息放大镜,从此我们对现象的观察进入一个新的领域。


    在网络与终端的支撑下,虽然我们身处的时空没有任何变化,但是通过更加碎片化的信息,我们可以将时间与空间的分割从以往的单位中进一步细分,这就相当于原本一个9寸蛋糕切四块,现在可以切成六百四十块。所能够建立的观察维度,更加接近于无穷大,观察的基准点,更加趋向于无限小。这有点像是搭积木的游戏,当积木的数量足够多时,你最终所能搭出的形状也足够复杂,如果随便交给你一个图形,拥有更多的积木当然更有可能组合出结果。



    关于多维度数据的挖掘,自古就有,历法的制定过程或许可以作为一个很好的例证,江湖上现在偶尔也会有关于林元帅诸葛军师的传说,自从计算机技术诞生之后,对数据的利用和处理一直在同步发展中,无论是分布处理还是并行处理,并不是一天就蹦跶到今日的技术高度,我们很多科学发现都是在近三十年之间才完成,正是得益于此。



    但为何在这几年“大数据”忽然大热,甚至你一个做火烧做煎饼做包子的,如果不说两句大数据,大家看你的眼神就和看一个死人没啥区别。原因其实很简单,全球智能手机的普及。



    随着移动终端信息处理能力的提升,与用户的交互界面不仅更加具备黏性,并且实现了全方位全时段互动,此时每个人的移动终端实际上就变成了一个数据记录仪。它比PC所能获取到的信息更加个人化,不仅暴露这个人的生活细节,位置动向,同时也记录着它的消费习惯,人类第一次拥有了这么多数据的生产者。每一个元数据都可以直接挂钩一份具体的支出额度,每一个数字都可以被货币量化,大数据的商业价值与各个企业的营收几乎都可以直接挂钩。所以,围绕“大数据”来说故事迅速成为当下的主流。


    但是揭开媒体的那些噱头背后,你会发现,国内对复杂系统的研究,仍然是处于概念大于应用的阶段,大部分行业对线性、封闭系统内的数据关系都没办法掌握,更不用说将大数据转化成有价值的信息。而在影视行业,工业化体系处于刚刚起步的阶段,很多从业人士连财务报表这种基础数据都看不明白,去理解大数据的价值更是有些不可想象了。


    大数据于国内影视行业的意义:


    大数据技术作为一种工具,其应用方向,无非三个方面,一是对过于和曾经的理解,二是对以后和将来的认知,三是对当下进行判断并进行实时处理,影视行业大数据技术的应用如果想要有长足的发展,那么在这三个方面都会面临着一些需要解决的问题。


    1、对过去和曾经的理解


    既然是对已发生的进行判断,就会涉及到数据采集,这个部分往往会引发争论,中心议题是到底多大才叫大,GB还是TB,PB还是EB?


    如果我想要知道《致我们终将逝去的青春》这部差一点就可以归类到文艺片的电影,为什么能在2013年上半年收获仅次于《西游降魔篇》的票房,我是应该仅以社交媒体的传播效率来进行数据的挖掘,还是要追溯到原著小说里的青春,以及被电影宣传所唤起的记忆?


    将数据挖掘的范围放在社交媒体的范畴,那么通过对一部电影推广过程的梳理,其实我们很容易就可以通过数据制定出一张细化到分钟的参考,以及观众会被什么样的宣传内容所吸引,但是它仍然只是在描述现象。


    用脚趾头想一想也知道,将观察只停留在眼前,无法找到最终的因果,必须对推动现象发生的机制进行论证,那么我们该用什么样的体量来储存和分析观众们的记忆,从而找到个人经历和集体共鸣之间的关系?


    在这个方面,如果只用社交媒体的数据进行相关性的分析,其实和我们日常所做的感性推导没有太大区别,甚至还不如感性推导灵活,很容易因为数据的不够全面犯下“黑天鹅”式的错误(在发现澳大利亚之前,西方认为只有白天鹅)。必须要追溯到成因阶段更庞大的外部数据,比如主要观众群十年间的消费偏好及社会经历,以及对他们观影之前的心理活动进行统计分析。会不会太复杂?但是从数据挖掘的角度来说,只有在这个方向上进行努力才可能会提供实质性的价值。
    或者说,我们也可以简单粗犷一些,如麦特的负责人陈砺志所言,《致青春》的成功最主要的因素是因为赵薇的敬业与投入,以及她个人在行业的积累。
    大家可以继续用脚趾头想一想,以上三个角度,哪个会更容易接近整个事件的核心。


    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-8-2 13:29 , Processed in 0.430291 second(s), 50 queries .

    回顶部