南开大学2021年9月《网络爬虫与信息提取》作业考核试题及答案参考
1.process_spider_input(response, spider)是在爬虫运行yield item或者yield scrapy.Request( )的时候调用。( )
T.对F.错参考答案:F
2.Python中以下哪个容器里的元素不能重复( )
A.列表
B.元组
C.字典
D.集合
参考答案:D
3.爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行。( )
A.正确
B.错误
参考答案:B
4.PyMongo删除操作有( )
PyMongo删除操作有( )
A.delete
B.delete_all
C.delete_one
D.delete_many
参考答案:CD
5.BS4可以用来从( )中提取数据
A.HTML
B.XML
C.数据库
D.JSON
参考答案:AB
6.下列哪项不是HTTP的请求类型( )
下列哪项不是HTTP的请求类型( )
A.GET
B.POST
C.PUT
D.SET
参考答案:D
7.HTTP常用状态码表明表明客户端是发生错误的原因所在的有( )。
A. ...
附件列表