全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1234 3
2017-08-09
#!/usr/bin/env python3
# -*- coding: utf-8 -*-


import sys
import urllib
import json
from bs4 import BeautifulSoup

tags=[]
url='https://movie.douban.com/j/search_tags?type=movie'

response=urllib.request.urlopen(url,timeout=20)
result=json.loads(response.read())
tags=result['tags']

movies=[]
for tag in tags:
    limit=0
    while 1:
        url='https://movie.douban.com/j/search_subjects?type=movie&tag=' + tag + '&sort=recommend&page_limit=20&page_start=' + str(limit)
        print(url)
        response=urllib.request.urlopen(url,timeout=20)
        result=json.loads(response.read())

        result=result['subjects']

        if len(result)==0:
            break
        limit+=20
        for item in result:
            movies.append(item)

就这段代码,一直报ascii,不知道问题出在哪里,哪位大神给看看啊

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-10 09:44:20
这问题在于‘热门’是汉语,你可以参考一下百度,比如百度‘热门’,浏览器的网址是
https://www.baidu.com/s?wd=%E7%83%AD%E9%97%A8,红色部分代表的就是‘热门’,被转换格式了。解决方式有两种,一种是把中文转换,另一种是用requests。
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-8-10 10:55:55
fengxingliulizi 发表于 2017-8-10 09:44
这问题在于‘热门’是汉语,你可以参考一下百度,比如百度‘热门’,浏览器的网址是
https://www.baidu.co ...
多谢,就是这个中文问题,谢谢大神
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-9-15 18:51:40
中文的问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群