南开大学2021年9月《网络爬虫与信息提取》作业考核试题及答案参考
1.引用中间件时后面的数字代表的是中间件的执行顺序,例如 ‘AdvanceSpider.middlewares.ProxyMiddleware’:543 中的543。( )
A.正确
B.错误
参考答案:A
2.网络爬虫的用途有( )。
A.收集数据
B.尽职调查
C.提高流量
D.攻击服务器
参考答案:ABC
3.在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的。( )
T.对F.错参考答案:F
4.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。( )
T.对F.错参考答案:F
5.Python操作CSV文件可通过( )容器的方式操作单元格。
A.列表
B.元组
C.字典
D.集合
参考答案:C
6.HTTP状态码503表示服务器内部故障。( )
T.对F.错参考答案:F
7.cookies的缺点是( )。
A.实现自动登录
B.跟踪用户状态
C.http中明文传输
D.增加http请求的流量
参考答案:CD
8.如果目 ...                                        
                                    
附件列表