摘要
以数据仓库为核心的商务智能(BD技术口益受到业界重视,许多BI系统己经投入使用,带来了巨大的效益。但是由十各大开发商采用不同的数据仓库元数据标准和管理策略,使得数据仓库之间的数据集成与共享十分困难,由此引发了人们对元数据管理和应用的研究。随着数据仓库的数据质量问题越来越引起重视,更进一步让人们认识到了元数据管理和应用的重要性。本课题在中国太平洋保险公司(CPIC)建设企业数据仓库(EDW)的项目背景下对BI系统中的元数据管理和应用作了研究。
元数据管理不是一个单纯的技术问题,因为元数据管理的很多内容需要依靠管理制度、流程、其它辅助工具以及人工参与来完成。元数据管理技术和元数据管理策略都是进行成功的元数据集成所必需要重视的研究内容。本课题研究了BI系统中的元数据管理技术和元数据管理策略,通过在CPIC建设EDW项目第二阶段中使用文档服务器实现元数据手工管理,部分实践了元数据管理技术和元数据管理策略。
元数据的用户包括技术用户和业务用户。元数据应用贯穿十BI系统从设计开发到运行维护的整个生命周期,本课题从业务用户和技术用户的角度分别研究了在BI系统开发和运行维护过程中几个重要的元数据应用场景。并通过开发一个简单的元数据驱动的数据映射工具来说明了元数据对数据集成工具开发的重要性。
由十BI系统涉及到大量业务系统的集成,因此需要一个统一的元数据标准支持才能实现各子系统元数据的有效集成。公共仓库元模型(CWM)是对象管理组织
(OMG)提出的一个通用的数据仓库元数据规范,已经得到了各大工具厂商的支持。本课题还重点研究了CWM规范的体系结构,并依据CWM规范进行了初步的元数据仓储应用开发。
论文先对元数据管理和应用作了理论研究,然后基十项目过程进行了应用实践,主体上由二部分组成:
|
|