【问题2】
在所有的情况下,开发数据仓库最好的方法是迭代式。这样说的主要原因是:
(1)业界的成功记录强烈建议这样去做。
(2)最终用户在第一遍完成以前不能够明白地提出需求。
(3)只有实际结果切实而且明确时,管理部门才能做出充分的承诺。
(4)需要很快地看到可视化的结果。
在整个开发过程中,数据仓库在每遍开发中都起着路标的作用,由于所有的开发都是数据模型驱动的,因此可以确保后一遍开发汇集了前面开发的成果。每遍后续开发都是建立在前一遍开发的基础上的,结果就是都在统一的数据模型上进行不同的开发。正是由于它们都是基于同一个数据模型,每一遍开发工作的成果将产生一个内聚的、高度和谐的整体。
也就是说,在数据仓库的增量式、演进式的开发过程中,在数据模型与达到长期集成和和谐工作的能力之间,存在一个间接的但很重要的相互关系。
用增量的、演进的方式开发数据仓库系统的过程大致如下。
首先,在一个合理的短时间内定义一个高层次的企业数据模型,在不同的主题和可能的应用之间,提供企业范围的、一致的、集成的数据视图。这个高层模型将大大减少以后的集成问题,尽管在企业数据仓库和部门数据集市的开发中,它还需要进一步提炼。其次,基于上述企业数据模型,可以并行地实现各自独立的数据集市和企业数据仓库。然后,再可以构造分布式数据集市,对不同的数据集市进行集成。最后,可以构造一个多层数据仓库。在这个多层数据仓库中,企业数据仓库是所有数据仓库数据的全权管理者,而这些数据分布在各个相关的数据集市中。
【问题3】
早期的DSS建立在传统的操作型环境之上,使用效果并不令人满意,原因主要包括:
分析型处理与OLTP所用数据不同,由于分析型处理需要使用历史数据,因此进而提出了数据仓库的概念。其中的数据要体现集成性和时间性,企业管理中所使用的数据被分别装入数据仓库和操作型DB之中。
但信息处理的多层次要求导致了一种新的数据环境,即ODS操作型数据存储的建立。ODS一方面包含细节的、当前或接近当前的数据,可进行联机操作型处理;另一方面,又是一种面向主题、集成的数据环境,且数据量较数据仓库要少,可以辅助企业完成日常决策。也就是说,ODS是介于操作环境和决策支持环境中间的一种技术,其中的数据有四个基本特点。
……
展开