全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
658 0
2022-11-18

我们日常接触到的数据很多是excel格式的,但偶尔也会遇到PDF格式的数据文件,怎么把PDF中的数据提取出来并汇总呢?这里提供一种PowerBI的方法。

假设有一个PDF文件,128页,

打开PowerBI Desktop,点击获取数据,选择PDF格式,

点击确认后,连接本地PDF文件,

可以看到有128个表格,每页PDF就是一张表格,这里随便选择一个文件,点击编辑,进入查询编辑器,

其实到此处,数据都已经导入到PowerBI中了,剩下的就是整理的过程,把128页文件合并到一张表中,和合并128个excel文件的步骤是一样的,

↑删除"源"之后的步骤

↑Name列只筛选“Table”

↑Data列展开所有列

↑删除多于的列

↑提升标题

↑合并完成


合并后的数据可以加载,直接进行数据分析,如果就是想导入到Excel中,也十分简单,有几种方式可以把PowerBI中的数据导入到Excel中,参考这篇文章:PowerBI中的数据如何导出到Excel?

以上的步骤看起来挺多,其实只是点点鼠标的事,无需任何代码,一两分钟即可完成128页的PDF数据的转换,并合并为一个Excel文件。

其实和批量合并EXCEL文件类似。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群