全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
3784 7
2019-05-15
可以爬取任意扇贝单词书(学习使用,勿用于非法用途),网页结构变动可能导致不可用
输入单词书网址回车就可以,在同目录下保存为txt文件,按字母排序


附件列表
233930ad0gj8911b2691z7[1].png

原图尺寸 193.97 KB

233930ad0gj8911b2691z7[1].png

shanbay.rar

大小:5.9 MB

只需: 5 个论坛币  马上下载

爬取任意扇贝网单词书

本附件包括:

  • shanbay.exe

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-5-16 20:05:17
经本人测试,建议大家不要下载。理由如下:
1、扇贝单词书网站用的js很少,这种网页很好爬取。
2、作者在这里并没有提供源代码,只把代码封装成exe文件,这在PYthon 中很容易实现,百度有现成的教程。
3、大家若对这个问题有兴趣可以去开源数据github,https://github.com/search?l=Python&q=shanbay&type=Repositories,大致看了下仅仅python的就有61个。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-16 21:41:14
zhou1_20 发表于 2019-5-16 20:05
经本人测试,建议大家不要下载。理由如下:
1、扇贝单词书网站用的js很少,这种网页很好爬取。
2、作者在 ...
本来就是简单的小工具,简单就是不要下载的理由?工具是拿来用的,要是想学python,网上多的是资料,也没必要下载这个
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-22 10:22:45
wuliea 发表于 2019-5-16 21:41
本来就是简单的小工具,简单就是不要下载的理由?工具是拿来用的,要是想学python,网上多的是资料,也没 ...
你是哪个学校的?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-22 10:22:55
建议你找几个有难度的网站挑战下,如:拉钩全网爬取,CNDA某主题的全网爬取。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-6-13 06:06:41
作者 ,是否需要购买的单词书不能爬取? 我这边失败了  vocabulary.txt文件里面一个单词都没有
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群