QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 812|回复: 0
打印 上一主题 下一主题

王武彬:关于大数据的误区与迷思

[复制链接]
字体大小: 正常 放大
math3056        

446

主题

9

听众

1143

积分

升级  14.3%

  • TA的每日心情

    2014-6-21 01:29
  • 签到天数: 45 天

    [LV.5]常住居民I

    自我介绍
    没有
    跳转到指定楼层
    1#
    发表于 2014-4-16 18:10 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    大数据”无疑是2012年最红火的概念。它不仅意味着一次颠覆性的IT技术变革,由于产业融合和学科渗透的程度越来越深,也成为《自然》《哈佛商业评论》和《哥伦比亚新闻评论》同时关注的领域,IT业、互联网业、媒体业、咨询业共同讨论的话题,硅谷、华尔街、五角大楼一起瞩目的趋势,对政治、经济、商业等领域都产生了深远的影响。
    身处这个“大数据时代”下的“大数据元年”,“大数据”的价值似乎已经毋庸置疑。媒体业也在热切关注着这一浪潮,“大数据”甚至跻身传媒业的年度热词。 然而倘从现实来看,媒体业并无能在这个新领域乘风破浪的确信,“大数据”也没有许媒体业一个笃定明朗的未来。围绕“大数据”与媒体业,本文试图提出以下观点:
    (一)“大数据”概念存在误读。时下谈到的“大数据”案例大多与真正的“大数据”无关。
    (二)“大数据”对媒体的价值不宜高估。大多数媒体机构在“大数据”领域并不具备颠覆创新和业务转型的条件。
    (三)“大数据时代”核心理念对媒体至关重要,媒体应视数据为重要资产和生产资料,辅助经营和报道。
    对“大数据”的误读与迷思
    “大数据”一经提出,就迅速和“革命”“时代”等宏大概念配搭,无处不在甚至无所不包,其基本内涵反而被模糊。那么“大数据”究竟指的是什么?研究机构Gartner给出的定义是:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 咨询机构麦肯锡则提出:“大数据”是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集。 简单讲,“大数据”定义了传统模式(或流程、工具、手段)无法处理的数据集。
    “大数据”概念的提出,是因为其所定义的数据集的信息量超出了现有基础设施的承载能力,多样性超出传统流程工具的处理能力,实时性超出现有IT架构的计算能力。换言之,“大数据”的特征可以用“4V”来描述,即:(1)Volume,数据量大,计算量大,从TB级别跃升到PB级别;(2)Variety,数据来源多、数据类型多,传统方式无法轻易捕获和管理;(3)Velocity,增长速度快,数据处理的速度必须满足实时性要求;(4)Value,价值密度低,商业价值高,浪里淘金却又弥足珍贵。
    可见“大数据”并不复杂,和“新媒体”一样是个相对的概念。人们无法回答“多大的数据才能叫大数据”这样的问题,只能说随着数据量持续高速增长,发现分析处理力不能及时,这样一个术语应运而生。企业内部的经营交易信息,物联网世界中商品、物流信息,互联网世界中人与人交互信息、位置信息构成大数据的三个主要数据来源, 共同揭开了“大数据”的序幕,促使海量数据在渐变中完成了从量变到质变的飞跃。透过“大数据”,人们能够发现知识、提升智能、创造价值。而相关的技术、应用和产业,都可纳入“大数据”的范畴。
    然而诚如EMC公司首席营销官Jeremy Burton所说,“大数据”这一术语和“云计算”等一样,被炒作赋予了太多的意味。现实是,“大数据”已经成为一个充满魔力的万能语汇,在有意无意中被夸大和误读。“大数据”在修辞学上的意义被浓墨重彩地强调,各种事物冠以大数据之名,无数故事围绕大数据讲述。这样的例子并不少见。一些以“大数据”为题的文章,除去首段和末端出现过“大数据”词眼外,所谈及的内容很难说与“大数据”有何关系,即便删去“大数据”相关字句也无关宏旨;国外科技博客Mashable一篇关于金融时报借助数据优化经营策略的文章,未脱传统网络分析的范畴,但被译成中文后标题中的“Data”就被“大数据”取而代之了;世界各国记者协力挖掘维尔京群岛资料的案例,其实是精确新闻在全球化和社交化背景下的自然延伸,但随即被当做“大数据”的典型案例;媒体机构推出金融终端产品,名字前也要加上“大数据”三个字。
    上述种种表明,目前媒体行业对“大数据”的理解存在着误读和迷思,很多时候偷换了概念,谈的是 “数据”或“大数据时代”而非“大数据”。“数据”更多从普遍意义上强调数据的魅力和价值,与“大数据”并不相悖;“大数据时代”扩展了“大数据”的内涵,代表一种精神内核和核心理念,适用面自然也更广。如果用“虽不中亦不远矣”来评价,这些用法并不算错,毕竟在很多语境中“大数据不只是一个概念,实际上是对一种社会状态的描述。” 但也应该看到,这种误读遮蔽了“大数据”概念的真正内涵,可能会导致高估“大数据”对媒体的价值,甚至在实践中的偏差。
    “大数据”对媒体的价值不宜高估
    “大数据”对媒体的价值不宜高估。诚然,2011年5月,麦肯锡全球研究院发布了名为《大数据:创新、竞争和生产力的下一个前沿》的研究报告,指出数据是一种生产资料,大数据是下一个创新、竞争、生产力提高的前沿;2012年1月,瑞士达沃斯世界经济论坛发布报告《大数据,大影响》,认定大数据为新的经济资产类别,价值堪比石油,就像货币或黄金一样;2012年3月,美国政府发布《大数据研究与发展倡议》,将大数据上升至国家战略,旨在利用大量复杂数据集合获取知识和提升洞见能力,投入金额高达2亿美元——这都反映了“大数据”的潜在价值。麦肯锡全球研究所的报告称,大数据是继传统IT之后下一个提高生产率额的技术前沿,在政府公共服务、医疗服务、零售业以及涉及个人位置服务等领域都将带来可观价值。如果医疗业全面使用“大数据”,保障医疗系统安全有效运行,美国每年能多创造3000亿美元的附加价值,同时减少8%的医疗支出;如果运用到公共领域,欧洲政府每年可减少1000亿欧元的开支。
    “大数据”意味着巨大的发展机遇,然而却不是所有行业的机会,更不是所有机构的机会。典型的大数据源包括:网络日志、社会网络、互联网文本和文件、大规模的电子商务;传感器网络、通信记录、医疗记录;天文学、大气科学、生物化学等领域。显然,除了政府之外,“大数据”主要是巨头的游戏,为数不多的大公司真正拥有“大数据”,如在互联网领域与视频相关的Youtube和Netflix,与电商相关的亚马逊和阿里巴巴,与社交相关的Facebook、Twitter和新浪微博等。但目前,即便这些公司主要也只是在利用传统意义上的数据价值,“大数据”的利用尚处于初级阶段,价值并未得到释放。因此在提到“大数据”时,我们听到的更多是EMC、惠普、IBM、微软这些做基础架构的IT公司的名字。
    在“大数据”浪潮中,属于媒体业的想象空间并不多,“大数据”对媒体的价值非常有限。大多数媒体机构在大数据领域并不具备颠覆创新和业务转型的条件,原因是多层次的。
    首先是最本质的问题,媒体业掌握的数据资源有限。麦肯锡全球研究所的报告指出,不同行业的大数据强度和内容各有不同。证券、投资服务以及银行等金融服务领域拥有最高的平均数字化数据存储量,通信和媒体公司、公共事业单位以及政府等企业和组织也有规模显著的数字化数据存储。但事实上,大多数媒体机构拥有的数据资源很难算是真正的“大数据”。与SNS、微博、视频网站、电子商务网站的数据相比,与物联网、移动设备、个人位置、传感器采集的数据相比,与电信和互联网运营商的数据相比,与各种传感器和监控设备采集的图像和视频数据相比,媒体业拥有的数据量相形见绌。一个简单的例子:中国最大的电视台中央电视台据称拥有近40万小时的节目资源,年播出总量为230248小时 ;而Youtube每分钟就有100小时的视频被上传,更不用提每月10亿独立用户的行为数据 。数据量级相差悬殊。
    接下来最关键的问题是,媒体业缺乏处理“大数据”的能力。“大数据”应对的是传统流程、传统工具、传统方法无法解决的大量、多样、快速的数据。而媒体业自身生产的数据有限,对于有限内容的数字化程度也不够。以纸媒为例,传统以版面为对象的生产方式,在开展新媒体业务时难以适应,需重新转化编码。而在内容数据库的建设方面,很多媒体甚至处于“零”的状态。可以说,大多数媒体机构连传统的流程、工具和方法都没有掌握。
    再从硬件和人才来看,“大数据”对媒体业是一块难以啃下的硬骨头。数据的存储、处理、可视化呈现所需要的IT架构、基础设施和专业人员,大多数媒体机构也无一具备。如果从头做起,搭建架构,部署设施,培养团队,无异于再造一个新机构。
    由此可见,对大多数媒体机构而言,想借助“大数据”浪潮完成转型,各方面条件都不具备的情况下,只会是不可能的任务。国金证券关于大数据的报告中总结了六种商业模式:租售数据模式、租售信息模式、数字媒体模式、数据使能模式、数据空间运营模式、大数据技术提供商。 其中租售信息模式与媒体相关,主要包括以彭博为代表的金融信息服务商。恐怕也只有类似规模和形态的媒体机构才有可能借“大数据”创造巨大价值,其它媒体最好考虑更现实一些的利用途径。
    (作者系新华社新闻研究所新媒体研究中心王武彬)



    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2024-4-29 01:05 , Processed in 0.261757 second(s), 49 queries .

    回顶部