中国设备管理协会

企业管理决策的数据仓库构建

  目前,国内很多企业都已经实现了不同程度的管理信息化,但随着业务的增加,企业的发展,数据量增多,数据复杂性增大,传统的基于数据库的管理信息系统越来越无法满足企业管理决策的需要。基于现有的企业管理信息系统中的常规关系数据库,建立数据仓库,支持解决企业管理策略的相关问题,如分析不同地区的销售趋势,不同类型客户对产品的偏好,制定宣传策略,制定财政预算,制定发展规划等等,这是一种决策支持系统的新型技术。
  1 数据仓库技术
  数据仓库(Data Warehousing)是指面向主题的、集成的、非易失的、随时间变化的数据集合,用来支持管理人员的决策。数据仓库中的数据面向主题,与传统数据库面向应用相对应。主题是一个在较高层次上将数据归类的标准,每一个主题对应一个宏观的分析领域所涉及的分析对象。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻画各个分析对象所涉及的企业的各项数据,以及数据之间的联系。集成性是指源数据在进入数据仓库之前要进行一致性转化和数据综合计算。非易失性是指对数据仓库中的数据通常是批量载入和访问的,不涉及一般意义上的数据更新。随时间变化是指数据仓库中的数据是一系列对源数据的不同时刻的复杂快照。
  2 数据仓库源数据组织方法
  建立企业数据仓库是一项工程量和投资都比较大的系统工程,并且有一个比较重要的基础条件是整个企业的主要业务信息子系统已经成形,否则无法对源数据进行有效的组织管理,得到理想的决策依据。由于企业决策者关心的是具体的实际问题,所以企业化大力气建设的数据仓库要很好的服务于决策者的问题要求。针对这种情况,我们尝试用一种以决策者关心的问题为出发点和核心的数据组织方法来构建企业数据仓库。
  2.1 主题分析
  数据仓库数据组织的首要问题是根据决策者的主要问题建立主题模型。主题模型表示与此主题业务相关的所有重要信息综合。经过需求调查分析,决策者主要关心三个方面的分析问题:1)市场营销主题。不同时期(年、季度、月)销售情况变化趋势分析;不同地区分公司(国家、省份、城市、分公司)销售情况比较分析等。2)人力资源主题。不同时期(年、季度、月)职员薪资变化趋势分析;不同地区分公司(国家、省份、城市、分公司)职员薪资比较分析等。3)开支预算主题。不同时期(年、季度、月)各项财务指标(总资产、负债、销售收入、各项支出)变化趋势分析等。
  2.2 构建业务主题相关逻辑模型
  数据仓库的设计与传统数据库的设计不同,并非完全由需求驱动的,因为在用户使用之前,大多数需求是未知的,而且原数据库的数据也决定了数据仓库所能满足的需求,因此,数据仓库的设计是数据驱动和需求驱动相结合的。即按照预测的需求筛选与集成数据,根据数据设定可能满足的需求。决定采用图1所示的设计步骤。对应每个业务主题,我们都建立了一个业务主题表,用来保存每次业务中能获得的相关信息,成为数据仓库的事实表。事实表的建立是依存于企业现有的业务信息系统数据范围。
  2.3 数据仓库数据初始化和维护
  在完成前面的步骤之后,数据仓库的源数据组织结构基本成型,需要向组织中灌入初始数据以维护组织中的数据。灌入初始数据是一次性的工作,可以通过数据导入程序来完成。在导入数据过程中要维护数据的完整性和可修复性。我们提出了两种方法:数据库复制和数据库触发器。数据库复制主要针对那些不需要进行格式转换和检查的数据;数据库触发器主要针对业务主题表而言;由于业务主题表中的数据通常来源于几个数据表,而且,需要检查数据和转换数据格式,因此业务主题表的数据一般不能通过数据库复制来维护。

[字体:    ]