经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
R语言爬虫翻页爬取数据失败
楼主
deepwhite1103
2311
3
收藏
2020-05-22
新手一枚,打算练习爬取动态网页,写的命令能够成功翻页,但是爬出来的结果却只有第一页的内容,非常懊恼,请大神们赐教~
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
llb_321
2020-5-23 09:50:41
你的代码是在循环之前读取网页,所以循环中处理的都是第一页的数据
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
llb_321
2020-5-23 09:53:41
循环中翻页后,还需要重新解析网页内容,正则的对象才是新页的数据
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
deepwhite1103
2020-5-24 10:22:40
llb_321 发表于 2020-5-23 09:53
循环中翻页后,还需要重新解析网页内容,正则的对象才是新页的数据
感谢回答,但是我有点不太理解,我的想法是1到10页的内容,打开就是第一页了,第一步找到标题、地区的内容爬取下来保存,第二步翻页,翻页成功后再重复第一第二步,我的循环怎么写才是对的呢?能否再具体一点解答,新手刚入门,这是自己写的命令,搜了很多资料没解决问题
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
R语言程序包安装后重启R需再次安装的问题
R语言做门槛面板的包是什么?
R语言 3.2.2版本怎么好过包装不了啊
R语言相关问题
R语言装包失败
【悬赏】 求助 R语言 条件密度图 分析解释问题!
R语言发邮件总是出错
R语言中安装lss这个包装包安不上
R语言为什么移除和卸载的效果不一样
r语言批量读取sav文件,再分别批量保存为csv文件?谢谢大家
栏目导航
R语言论坛
经管在职研
经管文库(原现金交易版)
学道会
行业分析报告
产业经济学
热门文章
CDA 数据分析师:特征处理核心指南
投资人与创始人互坑套路
全球能源转型展望2025—全球和区域预测至20 ...
自己整理的私募股权投资实操手册。
中国金融生成式AI多模态内容鉴伪与安全防御 ...
海外资管机构赴上海投资指南(2025版)
全球企业社会责任报告数据
USPS账号又“暴雷”,合规浪潮来袭!
世界机器人2025年报告 World Robotics 2025
瓦尔拉斯框架与阿罗德布鲁 - SMD 框架的核心 ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群