全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心 数据求助
535 1
2022-10-20
需要高管股票期权数据

目前已发表论文显示数据来源是年报人工整理,想咨询爬虫能否实现

可加v联系,同手机号15116991733,感激不尽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-11-1 01:01:00
我做过相关的尝试,自己用python很难实现,可以去看看国泰安等数据库有没有收录。python有相关的pdf表格识别库,比如pdfplumber和camelot,但都不太完善,它们都依赖于对表格线条的识别,这个在技术上还是存在很大缺陷的。另外还有跨页表格的问题,如何确认下一页的表格是上一页的表格的连续,也是挺困难的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群