初学者数据工程– OLTP和OLAP之间的区别
您每天都在获取新信息。但是只有在对其进行分析之后,您才能将其添加到您的知识中并做出更明智的决策。世界各地每个组织的故事也是如此。组织收集大量数据,然后对其进行处理以使之有意义并做出适当的业务决策。与人类不同,组织具有两种类型的数据处理功能:OLTP和OLAP。
与他们的名字相反,两者之间有明显的区别。一个管理实时流程,另一个则帮助分析大量数据以提高组织的功能。让我们在本文中更详细地了解两者之间的区别。
目录
什么是OLTP?
OLTP的示例
OLTP的特征
什么是OLAP?
OLAP示例
OLAP的特征
OLTP与OLAP
什么是OLTP?
OLTP或在线事务处理系统实时处理大量事务。但是,交易是什么?
好吧,事务是整个发生且彼此孤立的过程。它们可以插入,更新或删除数据库中的数据。成功执行后,即使系统发生故障,事务对数据库所做的更改也会保留在数据库中。
事务数据存储在关系数据库中,以确保事务的ACID属性。高速写入和查询该数据以防止处理中的任何延迟。
数据库
OLTP支配着交易,因为它们是我们日常生活中遇到的关键过程。在线交易,电子商务订购,在线酒店预订,atm交易等均由OLTP流程管理。
OLTP的示例
想象一下,您登录一个电子商务网站来预订目前正在出售的最后一对您最喜欢的耳机。考虑以下:
可能有很多人试图预订耳机,但没有人知道其他人的操作。(我这样)
仅当所有用户完成了付款的所有步骤后,该订单才被视为成功。(甲tomicity)
用户成功完成订单后,将在网站数据库中对其进行更新。耳机将在网站上不可用。(? onsistency)
现在,即使电子商务网站由于用户流量泛滥而关闭,用户仍然拥有成功购买的耳机。(d urability)
oltp表
OLTP借助ACID(原子性,一致性,隔离性,耐久性)属性(我们刚刚讨论过),确保在数据库中进行此类事务时不会出现任何不一致。
OLTP的特征
它处理实时交易。
这些系统修改数据库中的数据。
它们处理由ACID属性控制的事务。
这些系统将数据存储在关系数据库中。
OLTP事务的实现通常非常快,大约为毫秒。
什么是OLAP?
组织具有从存储在各种OLTP数据库中的事务生成的数据。但是,除非对数据进行分析以获取对组织有价值的见解,否则这些数据毫无用处。但是,由于庞大的数据量和需要编写的查询的复杂性,直接从OLTP数据库查询该数据效率不高。因此,我们将此数据存储在另一个名为OLAP数据库的数据库中。
OLAP或在线分析处理数据库以聚合形式存储来自多个OLTP数据库的数据。然后将这些数据存储在数据仓库中。但是,它提供了数据的多维视图,而不是事务级别的视图。这意味着,如果组织要查看汇总的销售数据,则可以根据多个类别和子类别(位置(区域,国家,州),时间(年,月,日),客户(性别,年龄等)。这使组织能够对其数据执行高级分析,从而加深对其产品的了解。
oltp和olap
不用说,OLAP数据库成功的关键是多维视图。但是如何存储呢?让我们举个例子来了解这一点。
OLAP示例
以我们之前的电子商务网站为例,假设该公司现在想分析过去一年的销售额。但是单看每月的销售额太简单了。查看按地区分类的每月销售额将是更好的方法。
奥拉普表
该表被称为OLAP多维数据集,具有两个维度(四分之一和区域),此处存储的聚合数据被称为度量。
数据仓库中存储的数据以类似的方式,具有分析所需的维度。
奥拉普立方体
在这里,时间,地区和类别是维度。多维数据集的阴影单元格显示“衣服”类别在北部区域中2月的数据。
OLAP的特征
它处理历史数据。
这些系统不更改数据。
它以多维形式将数据存储在数据仓库中。
它用于
数据分析目的。
数据永远不会被修改。
OLTP与OLAP
OLTP
(在线交易处理)
OLAP
(在线分析处理)
功能性管理修改数据库中数据的事务。用于分析和报告目的。
资源组织的实时交易。从各种OLTP数据库中合并数据。
储存格式关系数据库中的表格形式。OLAP多维数据集中的多维形式。
运作方式读和写只读
响应时间由于查询很简单,因此处理速度很快。比OLTP慢
用户数高管,数据科学家程序员,数据库专业人员
题库