3.1 OLAP技术概述
3.1 OLAP技术概述
P2大家好,本次课我们专注于联机分析处理OLAP技术,虽然前几节课提到了OLAP,但是我们知道OLAP对数据仓库及数据挖掘有重要的意义,所以我们要理清OLAP技术的几个关键问题:什么是OLAP,OLAP技术的特性,OLAP与OLTP的区别,数据仓库与OLAP的关系。
P3什么是OLAP?
OLAP是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给使用者。OLAP委员会给予OLAP的定义为,OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
P4 OLAP技术的特性
关系数据库之父E.F.Codd于1993年提出OLAP的12条准则来描述OLAP系统
准则1:OLAP模型必须提供多维概念视图。
将企业看作一个多维模型,例如,利润可以按区域,产品,时间,或方案(如实际,预算或预测)查看。多维数据模型能让用户更直接和方便的操作数据,包括“切片和切块”
准则2:透明性准则。
当OLAP以用户习惯的方式提供电子表格或图形显示时,这对用户应该是透明的。OLAP应该是系统架构的一部分,这个架构能按用户的需要嵌入到任何地方,而不会对主机工具的功能产生副作用。用户不应该接触到提供给OLAP工具的数据源,这些数据可能是同构的或是异构的
准则3:存取能力准测。
OLAP工具应该有能力利用自有的逻辑结构访问异构数据源,并且进行必要的转换以提供给用户一个连贯的展示。是OLAP工具而不是用户需要关心物理数据的来源
P5 OLAP技术的特性
准则4:稳定的报表能力。
OLAP工具的性能不应该因维度增加而受到明显的影响
准则5:客户/服务器体系结构。
OLAP工具的服务器端应该足够的智能让多客户的以最小的代价连接。服务器应该有能力映射和巩固不同数据库的数据
准则6:维的等同性准则。
每个数据维度应该具有等同的结构和操作能力
准则7:动态的稀疏矩阵处理准则。
OLAP服务器的物理结构应能处理最优稀疏矩阵
准则8:多用户支持能力准则。
OLAP应提供并发获取和更新访问,保证完整和安全的能力
P6 OLAP技术的特性
准则9:非受限的跨维操作。
计算设备必需允许跨数据维度的计算和数据操作,不能限制任何数据单元间的关系
准则10:直观的数据操纵。
数据操作应在固定的路径下,例如钻或缩小,应该通过直接在分析模型的单元上完成,而不需要目录货多次的用户交互
准则11:灵活的报表生成。
报表设备应该能以用户需要的任何方式展现信息
准则12:不受限的维与聚集层次。
数据维度数量应该是无限的,用户在每个通用维度上定义的聚集聚合层次应该是无限的
P7 OLAP和OLTP的区别
今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)
业务类系统主要供基层人员使用,进行一线业务操作,通常被称为OLTP(On-Line Transaction Processing,联机事务处理)。
数据分析的目标则是探索并挖掘数据价值,作为企业高层进行决策的参考,通常被称为OLAP(On-Line Analytical Processing,联机分析处理)。
OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
P8 OLAP和OLTP的区别
从表中我来认知OLAP与OLTP的区别,从特性上看,OLAP是信息处理,OLTP是操作处理。从用户来看,OLAP是面向决策人员的,OLTP是面向操作人员的。从功能上看,OLAP是支持管理需要的,OLTP是支持日常操作的。OLAP是面向数据分析的,OLTP是面向应用的。OLAP每一次处理的数据量是较大的,OLTP每次处理的数据量较小,实时性要求高。这些区别大家可认真对比分析。
P9 数据仓库与OLAP的关系
在数据仓库中,OLAP和数据仓库是密不可分的,但是两者具有不同的概念。数据仓库是一个包含企业历史数据的大规模数据库,这些历史数据主要用于对企业的经营决策提供分析和支持。OLAP技术则利用数据仓库中的数据进行联机分析,OLAP利用多维数据集和数据聚集技术对数据仓库中的数据进行组织和汇总,用联机分析和可视化工具对这些数据进行评价,将复杂的分析查找结果快速地返回用户。
P10数据仓库与OLAP的关系
数据仓库系统的核心是联机分析处理,但数据仓库包括更为广泛的内容。概括来说,数据仓库系统是指具有综合企业数据的能力,能够对大量企业数据进行快速和准确分析,辅助做出更好的商业决策的系统。它本身包括三部分内容:
数据层。实现对企业操作数据的抽取、转换、清洗和汇总,形成信息数据,并存储在企业级的中心信息数据库中。
应用层。通过联机分析处理,甚至是数据挖掘等应用处理,实现对信息数据的分析。
表现层。通过前台分析工具,将查询报表、统计分析、多维联机分析和数据发掘的结论展现在用户面前。
从应用角度来说,数据仓库系统除了联机分析处理外,还可以采用传统的报表,或者采用数理统计和人工智能等数据挖掘手段,涵盖的范围更广;就应用范围而言,联机分析处理往往根据用户分析的主题进行应用分割,例如:销售分析、市场推广分析、客户利润率分析等等,每一个分析的主题形成一个OLAP应用,而所有的OLAP应用实际上只是数据仓库系统的一部分。
P11总结
联机分析处理(OLAP)系统是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便他们准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案。好了,到此本次课就要结束了,我们做一个简短的回顾。本次课对OLAP技术的几个关键问题进行了梳理,明确了OLAP技术的内涵及与相关主题的关系,这对我们理解OLAP在数据仓库系统中的价值十分有益。这些内容需要大家认真理解。
好,这次课到此结束,谢谢!