yhhpf 发表于 2020-6-1 20:50:52

爬虫返回的乱码怎么解决?



今天学习爬虫这块的时候,返回的是图中乱码格式的,这种情况需要如何解决?谢谢各位大佬

import urllib.request
import urllib.parse
import json

url ='https://www.woaifanyi.com/api/1.6/save/?ajaxtimestamp=1591014643998'
data ={}
data['source']='how+old+you'#input('请输入想要翻译的内容:')
data['from']='1'
data['to']='2'

data=urllib.parse.urlencode(data).encode('utf-8')

res = urllib.request.urlopen(url,data)
html = res.read()
target = json.loads(html)
print(html)

Twilight6 发表于 2020-6-1 20:51:49

这个不是乱码

yhhpf 发表于 2020-6-1 20:58:49

Twilight6 发表于 2020-6-1 20:51
这个不是乱码

我感觉也不是,像是需要解码?还是?

Twilight6 发表于 2020-6-1 20:59:36

import urllib.request
import urllib.parse
import json

url ='https://www.woaifanyi.com/api/1.6/save/?ajaxtimestamp=1591014643998'
data ={}
data['source']='how+old+you'#input('请输入想要翻译的内容:')
data['from']='1'
data['to']='2'

data=urllib.parse.urlencode(data).encode('utf-8')

res = urllib.request.urlopen(url,data)
html = res.read().decode('unicode-escape')
target = json.loads(html)
print(target)
这样即可,你返回的是unicode 码 不是乱码

yhhpf 发表于 2020-6-1 21:02:12

Twilight6 发表于 2020-6-1 20:59
这样即可,你返回的是unicode 码 不是乱码

多谢大佬,可以了
我原来的用utf-8弄的,这块了解的太少了...
{:5_106:}

Twilight6 发表于 2020-6-1 21:03:25

yhhpf 发表于 2020-6-1 21:02
多谢大佬,可以了
我原来的用utf-8弄的,这块了解的太少了...

没事 问题如果已经解决,记得给个最佳~
页: [1]
查看完整版本: 爬虫返回的乱码怎么解决?