全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
1234 2
2022-08-16
Python爬取中国土地市场网土地交易挂牌公告公示数据源代码




爬虫爬取爬取中国土地市场网-土地公告公示,使用redis数据库存储,分布式爬取列表详细信息。
使用Python开发,用到selenium




包含的代码大致如下:
.......
division = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r1_c2_ctrl").get_text()    info['行政区'] = division    # 项目名称    prjname = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r17_c2_ctrl").get_text()    info['项目名称'] = prjname    # 项目位置    location = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r16_c2_ctrl").get_text()    info['项目位置'] = location    # 面积(公顷)    square = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r2_c2_ctrl").get_text()    info['面积'] = square    # 土地用途    purpose = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r3_c2_ctrl").get_text()    info['土地用途'] = purpose    # 土地使用年限    tdsynx = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r19_c2_ctrl").get_text()    info['土地使用年限'] = tdsynx    # 土地级别    tdjb = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r20_c2_ctrl").get_text()    info['土地级别'] = tdjb    # 分期支付约定支付期号 ......        # 分期支付约定约定支付日期    ......    # 土地使用权人    .......    # 约定容积率下限    ydrjxx = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f2_r1_c2_ctrl").get_text()    info['约定容积率下限'] = ydrjxx    # 约定容积率上限    ydrjsx = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f2_r1_c4_ctrl").get_text()    info['约定容积率上限'] = ydrjsx    # 约定开工时间    kgtime = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r22_c2_ctrl").get_text()    info['约定开工时间'] = kgtime    # 实际开工时间    sjkgtime = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r10_c2_ctrl").get_text()    info['实际开工时间'] = sjkgtime    # 批准单位    pzdw = items.find(        'span', id="mainModuleContainer_1855_1856_ctl00_ctl00_p1_f1_r14_c2_ctrl").get_text()    info['批准单位'] = pzdw    # 用唯一值的电子监管号当key, 所需信息当value的字典    ........    # 土地来源   .....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-8-26 10:13:24
楼主,这个代码跑不起来,有最新的吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-8-26 12:00:24
Lebannen 发表于 2023-8-26 10:13
楼主,这个代码跑不起来,有最新的吗?
这个您下载完整的文件包了吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群