要学习数据分析,就绕不开Excel;要用Excel做数据分析,就绕不开Excel的“Power”家族:Power Query、Power Pivot、Power View和Power BI。一看名字,就知道这是兄弟,它们之间有什么联系和区别?能在数据分析中起到哪些作用?
Power Query—数据加载、数据清洗Power Query是一种数据连接技术,可用于发现、连接、合并和优化数据源以满足分析需要。Power Query 的功能在 Excel 和 Power BI Desktop 中可用。
PQ的常用场景包括:
- 支持将导入的不同数据源的数据进行裁剪和合并生成一个新的表单。
- 操作完的步骤可以重复执行,下次再操作同样的步骤只需要刷新即可得到最新的数据。写好的操作步骤可以再次编辑和更改,还可调整操作步骤。
- 加载的数据可以突破Excel中100万行的限制,而加载数据的大小取决于你的内存上限。
Power Pivot—数据建模PowerPivot 是一种数据建模技术,用于创建数据模型,建立关系,以及创建计算。
PP使用场景包括:
- 几乎可以从任意地方导入任意数据源中的数据,包括Web服务、文本文件、关系数据库等数据源。
- 在PP中,Excel的行、列限制被取消,能方便地操作更大型的数据。
- 通过使用固有的 Excel 2010 功能(例如数据透视表、数据透视图、 切片器等) ,以交互方式浏览、分析和创建报表。
Power View、Power BI—数据可视化Power View 是一种数据可视化技术,用于创建交互式图表、图形、地图和其他视觉效果,以便直观呈现数据。 Power View 在 Excel、BI SharePoint、SQL Server 和 Power BI 中均可用。现在,Power BI Desktop是微软用于可视化数据浏览和报告的推荐工具,Power View在实际工作中已经不怎么使用了。
Power BI是一个独立的软件,提供了在线版、移动版、桌面版,而我们通常所说的PBI指的就是Power BI的桌面版(Power BI Desktop)。所以,要做数据可视化,使用Power BI Desktop即可。
最后,可能会有人提出疑问:既然Excel的“Power”家族就可以进行大量的数据分析,为什么还要学习更难的Python?当然是效率问题。
用power系列做数据分析,处于不上不下的尴尬位置,普通人嫌复杂,专业人员嫌效率低。Power系列操作繁琐,复用性差,功能相对局限单一。譬如用Power Pivot、Power Query和Power BI做数据分析,不同的数据分析步骤,需要使用不同的插件或软件,大大降低了工作效率,打断了工作流程。
但使用Python编写,每一步过程就非常方便,统一语言带来记录方法的统一。另外,Python工具库非常丰富,可谓应有尽有,满足了数据分析过程中的所有需求。