全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
3545 20
2020-04-08
python爬虫好学吗?  python零基础,有R语言基础。
想学习Python,抓取写网络数据,写论文。请问,从开始学到能够爬到数据,大约多久?(主要爬网页数据,比如政府文件、文献资料等);
求好心人解答困惑,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-4-8 14:05:14
我要我的滋味sd 发表于 2020-4-8 12:52
python爬虫好学吗?  python零基础,有R语言基础。
想学习Python,抓取写网络数据,写论文。请问,从开始学 ...
很好学。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-9 09:33:19
我要我的滋味sd 发表于 2020-4-8 12:52
python爬虫好学吗?  python零基础,有R语言基础。
想学习Python,抓取写网络数据,写论文。请问,从开始学 ...
不难
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-9 09:52:21
1、不知道楼主R语言掌握到什么程度,如果你常用for, matrix,并能轻松定义function,学python2-3天,如果R语言基础不扎实,那就等于小白学python需要2-3个周。
2、爬虫的学习主要取决于网站反爬虫能力。楼主的任务好像不需要迅速抓取,建议学保险方式selenium+re,过程就是selenium打开网站、获取网页源代码、re提取关键信息、将信息保存成txt\csv\excel。楼主只需要分步解决以上步骤就行。
3、selenium,re是python的包,不需要把它们的功能都学了。selenium学一下如何打开网页,点击按扭就行。re指正则表达式提取,正则表达式里面最最常用的是.*?和(.*?),这两个解决不了再研究其他的正则。预计时间2-3周
4、楼主如果不差钱,淘宝代写是个好选择
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-9 10:13:00
有没有好的教学资料或网站呀,谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-4-9 12:11:17
fengxingliulizi 发表于 2020-4-9 09:52
1、不知道楼主R语言掌握到什么程度,如果你常用for, matrix,并能轻松定义function,学python2-3天,如果R语 ...
谢谢你的回复,非常有用。
那么,我还有一个问题,python抓取数据完成以后,用网络获取的数据建立模型,完成小论文,是不是也可以发不错的期刊?
比如我从政策文件提出有用文本信息,主要面对的是自然语言处理的一些方法和技术,有无推荐的好模型或好方法,目标想发好期刊(比如中文B刊以上,也可以南大核心中属于中上游的,毕业要用),求推荐比较好的技术,可以是速成的,可以是慢慢的学的??感谢
还有一个困扰我的问题,就是考Pyhton抓取数据做的不错的文章,如过手里有的话,能否分享我看下,想知道别人怎么做的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群