全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1020 3
2017-06-06
url<-'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2015/index.html'
web<-readLines(url,encoding='UTF-8')
name<-web[grep("<tr class='provincetr'>",web)+1]#抓取所在行
childname<- gregexpr("(?<=href=').+?(?='>)",name)

报错显示reason 'Invalid regexp',可是(?<=href=').+?(?='>)我用几个正则表达式软件都显示正确的,求好心人解答

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-6 10:07:06
不懂你的正则表达式,不过好像你的正则表达式不对,用下面这个吧
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-6 10:31:59
有转义字符单引号
\\d+.html
一样可以匹配啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-11 11:52:08
igs816 发表于 2017-6-6 10:31
有转义字符单引号
\\d+.html
一样可以匹配啊
确实用你写的表达式可以抓下来
而且逻辑上简便很多
感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群