全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2500 3
2015-10-09
下面是国家专利汇编的网站,哪位能指点下怎么才能把网站的数据爬取下来放到excel表格里?最好是用R或者rapidminer来做,急急急。。。。。。哪位大神帮帮我,谢谢啦。

https://patentscope.wipo.int/search/zh/result.jsf?currentNavigationRow=1&prevCurrentNavigationRow=2&query=&office=&sortOption=%E5%85%AC%E5%B8%83%E6%97%A5%E9%99%8D%E5%BA%8F&prevFilter=&maxRec=48599234&viewOption=All

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-9 09:33:52
不知道到啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-2-10 19:46:22
https://bbs.pinggu.org/thread-7775772-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-2-11 13:58:08
可以用rvest包来做,就几个函数,另外稍微熟悉一点html和css就可以
下面的代码是获取类似"WO/2020/025997"(不知道这个叫什么)
library(rvest)
url <- "https://patentscope2.wipo.int/search/zh/result.jsf?currentNavigationRow=1&prevCurrentNavigationRow=2&query=&office=&sortOption=%E5%85%AC%E5%B8%83%E6%97%A5%E9%99%8D%E5%BA%8F&prevFilter=&maxRec=48599234&viewOption=All"
read_html(url)%>%
  html_nodes(".notranslate.ps-patent-result--title--patent-number")%>%
  html_text()
批注 2020-02-11 135654.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群