爬虫返回的乱码怎么解决？,Python交流,编程语言专区,鱼C论坛

yhhpf 发表于 2020-6-1 20:50:52

爬虫返回的乱码怎么解决？

今天学习爬虫这块的时候，返回的是图中乱码格式的，这种情况需要如何解决？谢谢各位大佬

import urllib.request
import urllib.parse
import json

url ='https://www.woaifanyi.com/api/1.6/save/?ajaxtimestamp=1591014643998'
data ={}
data['source']='how+old+you'#input('请输入想要翻译的内容：')
data['from']='1'
data['to']='2'

data=urllib.parse.urlencode(data).encode('utf-8')

res = urllib.request.urlopen(url,data)
html = res.read()
target = json.loads(html)
print(html)

Twilight6 发表于 2020-6-1 20:51:49

这个不是乱码

yhhpf 发表于 2020-6-1 20:58:49

Twilight6 发表于 2020-6-1 20:51
这个不是乱码

我感觉也不是，像是需要解码？还是？

Twilight6 发表于 2020-6-1 20:59:36

import urllib.request
import urllib.parse
import json

url ='https://www.woaifanyi.com/api/1.6/save/?ajaxtimestamp=1591014643998'
data ={}
data['source']='how+old+you'#input('请输入想要翻译的内容：')
data['from']='1'
data['to']='2'

data=urllib.parse.urlencode(data).encode('utf-8')

res = urllib.request.urlopen(url,data)
html = res.read().decode('unicode-escape')
target = json.loads(html)
print(target)
这样即可，你返回的是unicode 码不是乱码

yhhpf 发表于 2020-6-1 21:02:12

Twilight6 发表于 2020-6-1 20:59
这样即可，你返回的是unicode 码不是乱码

多谢大佬，可以了
我原来的用utf-8弄的，这块了解的太少了...
{:5_106:}

Twilight6 发表于 2020-6-1 21:03:25

yhhpf 发表于 2020-6-1 21:02
多谢大佬，可以了
我原来的用utf-8弄的，这块了解的太少了...

没事问题如果已经解决，记得给个最佳~

页: [1]

鱼C论坛's Archiver

爬虫返回的乱码怎么解决？