daishen 查看完整内容
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
qimhe 发表于 2015-1-11 13:48 没有提供API的,要分析页面框架才能抓取的,不同的页面不一样。你应该把需求提的更具体一点,比如JD的哪个页 ...
原图尺寸 268.47 KB
daishen 发表于 2015-1-12 08:25 只有网页编码是UTF-8的基本都没有乱码,像你提供的这个网页就没有问题,但最大的问题的你要的价格被京东隐藏 ...
wuchm 发表于 2015-1-12 08:44 daishen 您好, 写的基本有点像了,能不能再优化下呢? 1、把2422个型号全部抓取出来,需要翻页;
daishen 发表于 2015-1-12 09:12 哪些都不是问题,关键问题在京东把价格隐藏起来了,你只能看见价格编码,实际价格看不见。你仔细看看数据 ...
wuchm 发表于 2015-1-12 18:38 前台价格能看到啊
daishen 发表于 2015-1-12 19:23 京东好像已经意识到这个问题,所以他把价格隐藏起来,就好像你在街上看见美女,但是你不能碰她是一个道理 ...
原图尺寸 257.06 KB
R运行结果
daishen 发表于 2015-1-13 21:42 运行多页是有些问题,我运行14页没有问题,但加到44也就出现问题了,而我随机的挑选一些页面还是正常的,搞 ...