㈠ 数据仓库怎么从业务系统中提取数据
(1) 技术元数据 技术元数据是存储关于商业智能系统技术细节的数据,是用于开发和管理商业智能系统使用的数据。它主要包括以下信息:商业智能系统结构的描述,包括对数据源、数据转换、抽取过程、数据加载策略以及对目标数据库的定义等内容:还包括数据仓库使用的模式、视图、维度、层次结构、类别和属性的定义,以及立方体的存储模式等信息。 总之,技术元数据提供给系统管理人员和数据仓库开发人员使用,管理人员需要了解操作环境到商业智能环境的映射关系(即ETL数据抽取的映射关系),数据的刷新规则,数据的安全性,数据库优化和任务调度等内容。数据仓库开发人员需要了解度量值和维度定义的算法。在实际商业智能开发过程中,业务元数据和技术元数据是相互关联的,对元数据的深刻理解是数据仓库应用和维护的基础。 (2) 业务元数据 业务元数据从业务角度描述了商业智能系统中的数据,是介于使用者和真实系统之间的语义层,使得不懂计算机技术的业务人员也能够“理解”商业智能系统中的数据。业务元数据使用业务名称、定义、描述等信息表示数据仓库中的各种属性和概念。业务元数据主要包括以下信息:用户的业务术语和它们表达的数据模型信息、对象名称及其属性,数据的来源信息和数据访问的规则信息,商业智能系统提供的各种分析方法以及报表展示的信息。业务员数据使数据仓库管理人员和用户更好地理解和使用数据仓库,用户通过查看业务元数据可以清晰地理解各指标的含义,指标的计算方法等信息。 元数据的作用包括:便于商业智能系统的集成和可重用,保证数据仓库的数据质量和可维护性,帮助业务人员更好地理解当前业务和系统数据,提高商业智能系统的管理效率。 (3) 元模型 元模型是关于模型的模型。这是特定领域的模型,定义概念并提供用于创建该领域中的模型的构建元素。 说白了就是定义如何存放技术元数据和业务元数据。比如以何种方式存储,是存到文本文件(定义怎样分隔等内容)还是存到xml(定义xml标签等内容)等等。 所以,元模型其实是一个元数据交换的标准,按照相同标准设计出来的软件之间可以有效的进行数据共享,或者系统集成。 所以,严格来讲元数据管理软件与元模型之间并不是包不包含的关系,就如同如果你现在问iphone手机里包不包括java一样,因为java是一门语言,它也类似于标准。 不知道你所说的数据仓库软件是指的什么软件,如果是元数据管理软件你可以了解下作为借鉴,看看他们都有哪些功能。如果是其他类型的软件,视情况而定,如果该软件包含你要设计的功能你就可以了解下,有助于你思路的打开,但并不用精通。 最后,如果你想了解元模型的话,推荐你看看《公共仓库元模型:数据仓库集成标准导论》、《公共仓库元模型开发指南》这两本书,一定会有帮助。