经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
提问 悬赏 求职 新闻 读书 功能一区
›
经管文库(原现金交易版)
利用期刊分区插件easyscholoar,爬取谷歌学术论文和分区信息的Python代码
楼主
修波
506
0
收藏
2023-10-24
利用期刊分区插件easyscholoar,爬取谷歌学术论文和分区信息的Python代码
代码运行思路:
1、Python 运行selenium,通过关键词在谷歌学术上爬取论文标题,引用量和期刊分区信息
2、利用爬取到的论文标题,再在谷歌学术上爬取
摘要、作者、年份,期刊名,出版商等信息
3、根据爬取到的期刊分区数据,根据不同期刊分区指数建立对应的列
4、将所有数据进行汇总,保存为Excel
注:
1、谷歌学术特别容易被屏蔽,所以代码没有开启多线程,而且设置了较长时间的暂停时间,建议设置好关键词和网站后,凌晨自动运行。实测晚上花四五个小时就能跑完,爬取几十页中的几百篇论文数据问题不大
2、在爬取过程中,如果程序因各种原因而停止。已经爬取的数据并不受影响。而且可以根据暂停的节点,修改一下位置后,继续运行程序,实测没问题
3、能翻墙的,可以直接使用谷歌学术,并设置一页20条数据,这样翻页数量能少点,减少被屏蔽的概率
4、不能翻墙的,使用国内谷歌学术镜像也是一样的,只是一页只有10页的区别
5、要求有easyscholoar会员账号,网上有免费获取方法,自己解决
总的软件分为四步,复制在jupyter lab中。想使用的,安装一下
jupyter lab
案例图片:
附件:
爬取谷歌学术论文信息Python代码
大小:(76 Bytes)
只需: RMB 49元
马上下载
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
Python in Easy Steps
Python 自动化测试参考资料
python 中 easygui 的安装
求问Python各种金融分析用的库
【学习笔记】Python学习
Python
python学习
【学习笔记】Python第一天~老师讲的很详细 但细碎的知识有很多 努力跟上速度 ...
亚马逊、京东电商爬虫python代码(含自建代理IP池)
爬取谷歌学术论文,并给论文添加中科院或者JCR期刊分区的Python代码
栏目导航
经管文库
学道会
经管高考
stata专版
行业分析报告
文献求助专区
热门文章
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CDA数据分析师实战:因子分析的业务应用与落 ...
Gemini准确率从21%飙到97%!谷歌只用了这一 ...
Introductory Econometrics: A Modern Appr ...
如盈财女:1.19黄金回踩顺势做多,原油高空 ...
CDA数据分析脱产就业班于2025年12月08日开班 ...
兴业研究-库存周期分析
《2025全球电子商务手册》中文简版
如何应用蔡定创的《信用价值论》理论重新设 ...
Inference and optimal censoring scheme f ...
推荐文章
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群