数据仓库是一个集成的、面向主题的数据库设计的集合,用于支持 DSS 功能,其中每个数据单元都是非易失性的,并且与某个时刻相关。
数据仓库的特点
- 以主题为导向,数据按组织进行组织。主题导向提供了组织的更全面的视图
- 集成后,DW 必须将不同来源的数据放入一致的格式。
- 随着时间的变化,仓库维护历史数据。数据不一定提供当前状态。
- 非易失性,数据进入数据仓库后,用户无法更改或更新数据。
数据集市是部门数据仓库仅存储相关数据
依赖数据集市 直接从数据仓库创建的子集 独立数据集市 为战略业务单位或部门设计的小型数据仓库 数据仓库架构 三层架构 数据采集软件(后端) 包含数据和软 科威特电话号码数据 件的数据仓库 客户端(前端)软件,允许用户访问和分析仓库中的数据 数据仓库架构 两层架构 三层架构中的前两层合并为一层。 数据仓库架构2 可能影响架构选择决策的十个因素: 组织单位之间的信息相互依赖 高层管理人员的信息需求 数据仓库需求的紧迫性 最终用户任务的性质 资源限制 实施前数据仓库的战略视图 与现有系统的兼容性 内部 IT 员工的能力感知 技术问题 社会/政治因素。
是下面讨论的三种类型的数据仓库应用程序
信息处理——数据仓库允许处理其中存储的数据。可以通过查询、基本统计分析、使用交叉表、表格、图表或图形进行报告来处理数据。 分析处理——数据仓库支 销售线索 持对其中存储的信息进行分析处理。可以通过基本的 OLAP 操作来分析数据,包括切片和切块、向下钻取、向上钻取和旋转。 数据挖掘——数据挖掘通过发现隐藏的模式和关联、构建分析模型、执行分类和预测来支持知识发现。这些挖掘结果可以使用可视化工具呈现。