经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
R语言rvest爬虫获取数据总是重复
楼主
1998ybr
1750
2
收藏
2019-04-26
rt
就是我用rvest爬取链家的数据,其中.tag部分,明明一页里面有30条数据,但是却得到60条
有意思的是后三十条和前三十条完全重复
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
nieqiang110
2019-4-27 07:48:33
先爬下来,再数据清洗不就行了
你说的有可能是网页的问题,不知道怎么搞[loveliness]
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
zhou1_20
2019-4-27 17:57:09
用这个
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
rvest抓淘宝失败
关于用rvest抓取<script>标签里数据的问题
求助,rvest在提取数据的时候报错
R语言rvest包爬取网页数据问题
安装rvest总是出错,有木有大神帮下忙!
安装rvest总是出错,有木有大神帮下忙!
R语言用rvest爬虫时,网址中有中文字导致无法爬取怎么办
R语言rvest包爬虫报错
如何用rvest包实现多网页数据的抓取?
rvest爬虫在节点名为变量的情况下批量抓取网页信息
栏目导航
R语言论坛
经管文库(原现金交易版)
学者专栏
经管高考
金融实务版
藏经阁
热门文章
CDA考试模拟题库:新增章节练习题(更新于1 ...
文本分析:从经管顶刊“加分项”到学术发表 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
CAIE人工智能工程师认证
哈耶克作品集 6本 含通往奴役之路、自由宪章 ...
博观研究院2025年中国跨境进口保健品市场分 ...
南大CSSCI(2025-2026)来源期刊目录及扩展版
货币--是如何产生成长发展的和人类的四大工 ...
【详细整理,24重磅!】1990-2024上市公司市场 ...
量子科技行业深度报告-量子革命:量子科技的 ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群