业界建设DW有20多年了,国内从开始商业尝试也有10来年了,多种实施方案讨论不绝,但是很少有从生命周期的角度来讨论的,要知道生命周期决定了一方法论的使用周期和范围、投资回报比、适用行业和客户情况等等,这也是为什么当初多家争鸣(主要是两家)没有个结论的主要原因。 从技术上来说(不考虑客户需求和投资的纯技术角度的话),近3NF的EDW最稳固,其次是Kimball的统一维度模型存储的DW,再次是大家公认的DM。 那么从生命周期来看呢?我们来看一个业界典型的混合架构的成功案例。该项目目前整体生命周期为9年,几乎每2-3年DM需要重组一次,以满足企业BI效率、分析个性化等变化需求。统一维度数据仓库使用7年后渐显疲惫,于是在第8年开始开展大规模的维度模型的数据仓库架构重组,原因很简单,虽然这个理论到目前来说是能满足企业信息一致、维度模型管理、维护的最佳设计方案,但由于维度模型的缺陷在于信息抽象后,随着数年的经历,变化太多,业务繁复,管理越来越难。不过至今唯一没变的是EDW。 从生命周期来看,维度模型数据仓库结合数据集市容易建设,但生命周期相对教短,在考虑数据集市生命周期一般2年左右的情况下,维度模型数据仓库必须2年内建设成熟,最好1年内建设成熟,成为成熟架构体系,否则你还未开始企业级多维架构的时候,数据集市已经又需要重建了,那时工作量可大了。 那么EDW呢?如果维度数据仓库建模水平不高,那还是尽快建设吧,刚才我举的例是顶级项目了,一般项目维度模型数据仓库达到5年都难,所以我建议维度数 据仓库使用2年后就有必要开始着手建设EDW,哪怕你觉得EDW用处不是很大,要知道当一个庞大的企业级多维仓库直接在业务系统或者ODS之上进行重 组,不仅仅耗费巨大,而且不容易成功。 有朋友说多维数据仓库不行了本来就要重建,有没有EDW有什么关系呢?首先有的行业本身就需要细节数据,EDW是一个很好的存储细节数据的平台,而且是企业级集成的平台。其次,在有个架构支撑的情况下重建,和没有架构支持重建,那是完全两回事。比如刚才我说的DM重组,在有维度数据仓库在架构上对DM的支持下,庞大的DM重组只用了少量的人力,3、4个月的时间就完成,如果没有前面统一维度数据仓库架构来支撑DM重组,后果不堪设想。 这里架构的作用,就是我上次提到的接口作用,你更上层应用的架构重组,但我底层架构的接口并没变,大大方便了应用层架构的重组的实现。
|