QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 991|回复: 0
打印 上一主题 下一主题

从生命周期的角度来考虑数据仓库架构

[复制链接]
字体大小: 正常 放大

937

主题

117

听众

3万

积分

升级  0%

  • TA的每日心情

    2020-10-25 11:55
  • 签到天数: 264 天

    [LV.8]以坛为家I

    自我介绍
    内蒙古大学计算机学院

    社区QQ达人 金点子奖 助人为乐奖 风雨历程奖

    群组2013年数学建模国赛备

    跳转到指定楼层
    1#
    发表于 2014-4-17 01:40 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta

    业界建设DW有20多年了,国内从开始商业尝试也有10来年了,多种实施方案讨论不绝,但是很少有从生命周期的角度来讨论的,要知道生命周期决定了一方法论的使用周期和范围、投资回报比、适用行业和客户情况等等,这也是为什么当初多家争鸣(主要是两家)没有个结论的主要原因。

    从技术上来说(不考虑客户需求和投资的纯技术角度的话),近3NF的EDW最稳固,其次是Kimball的统一维度模型存储的DW,再次是大家公认的DM。

    那么从生命周期来看呢?我们来看一个业界典型的混合架构的成功案例。该项目目前整体生命周期为9年,几乎每2-3年DM需要重组一次,以满足企业BI效率、分析个性化等变化需求。统一维度数据仓库使用7年后渐显疲惫,于是在第8年开始开展大规模的维度模型的数据仓库架构重组,原因很简单,虽然这个理论到目前来说是能满足企业信息一致、维度模型管理、维护的最佳设计方案,但由于维度模型的缺陷在于信息抽象后,随着数年的经历,变化太多,业务繁复,管理越来越难。不过至今唯一没变的是EDW。

    从生命周期来看,维度模型数据仓库结合数据集市容易建设,但生命周期相对教短,在考虑数据集市生命周期一般2年左右的情况下,维度模型数据仓库必须2年内建设成熟,最好1年内建设成熟,成为成熟架构体系,否则你还未开始企业级多维架构的时候,数据集市已经又需要重建了,那时工作量可大了。

    那么EDW呢?如果维度数据仓库建模水平不高,那还是尽快建设吧,刚才我举的例是顶级项目了,一般项目维度模型数据仓库达到5年都难,所以我建议维度数 据仓库使用2年后就有必要开始着手建设EDW,哪怕你觉得EDW用处不是很大,要知道当一个庞大的企业级多维仓库直接在业务系统或者ODS之上进行重 组,不仅仅耗费巨大,而且不容易成功。

    有朋友说多维数据仓库不行了本来就要重建,有没有EDW有什么关系呢?首先有的行业本身就需要细节数据,EDW是一个很好的存储细节数据的平台,而且是企业级集成的平台。其次,在有个架构支撑的情况下重建,和没有架构支持重建,那是完全两回事。比如刚才我说的DM重组,在有维度数据仓库在架构上对DM的支持下,庞大的DM重组只用了少量的人力,3、4个月的时间就完成,如果没有前面统一维度数据仓库架构来支撑DM重组,后果不堪设想。

    这里架构的作用,就是我上次提到的接口作用,你更上层应用的架构重组,但我底层架构的接口并没变,大大方便了应用层架构的重组的实现。


    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2025-7-15 05:14 , Processed in 0.362397 second(s), 55 queries .

    回顶部