鱼C论坛

 找回密码
 立即注册
查看: 3230|回复: 12

[已解决]爬虫翻译入门,怎么编码里不是中文啊

[复制链接]
发表于 2016-6-3 20:31:48 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
各位大神么看看,为啥我的结果里的'tgt'是这种格式啊,我的是Python2.7.就没用urllib.parse.求指导
最佳答案
2016-6-3 23:06:18
python2的字符串编码和python3有些许不同
而json是unicode的扩展----utf8编码格式的
在python2里面就是这样的显示

这个是我的代码,一样的啊

这个是我的代码,一样的啊

这个是输出的结果,这是Unicode吧

这个是输出的结果,这是Unicode吧
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-6-3 23:06:18 | 显示全部楼层    本楼为最佳答案   
python2的字符串编码和python3有些许不同
而json是unicode的扩展----utf8编码格式的
在python2里面就是这样的显示
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-4 14:47:28 | 显示全部楼层
换py3
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-5 01:19:00 | 显示全部楼层
hldh214 发表于 2016-6-3 23:06
python2的字符串编码和python3有些许不同
而json是unicode的扩展----utf8编码格式的
在python2里面就是这 ...

我想知道怎么让他正确翻译出来啊,,在哪里改呢,,
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-5 01:19:38 | 显示全部楼层

可是我现在上课人家教的是Python2.7、、、、
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-5 10:52:45 | 显示全部楼层
decode('utf-8')
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-5 11:59:26 | 显示全部楼层
喔喔

评分

参与人数 1鱼币 -5 收起 理由
小甲鱼 -5 请不要无意义灌水!

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-6-6 09:11:42 | 显示全部楼层

这啥意思啊,话说明白啊,,,
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-6 09:12:31 | 显示全部楼层

你是来 水的么,,
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-6 10:27:50 | 显示全部楼层
西北无痕 发表于 2016-6-6 09:12
你是来 水的么,,

O(∩_∩)O哈哈~

评分

参与人数 1鱼币 -5 收起 理由
小甲鱼 -5 请不要无意义灌水!

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-6-6 11:12:31 | 显示全部楼层
输出 target   加编码试一试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-7 12:44:29 | 显示全部楼层
康熙 发表于 2016-6-6 11:12
输出 target   加编码试一试

字典没有encode方法,报错了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-6-7 12:46:08 | 显示全部楼层
  1. #coding:utf-8
  2. import urllib
  3. import urllib2
  4. import json

  5. content=raw_input('请输入要翻译的内容:')
  6. url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=fanyi.logo'
  7. data = {}
  8. data['type'] = 'AUTO'
  9. data['i'] = content
  10. data['doctype'] = 'json'
  11. data['xmlVersion'] = '1.8'
  12. data['keyfrom'] = 'fanyi.web'
  13. data['ue'] = 'UTF-8'
  14. data['action'] = 'FY_BY_CLICKBUTTON'
  15. data['typoResult'] = 'true'

  16. data = urllib.urlencode(data).encode('utf-8')#编码
  17. request=urllib2.Request(url,data)
  18. response = urllib2.urlopen(request)
  19. html = response.read().decode('utf-8')#解码

  20. target=json.loads(html)
  21. print target
  22. #print('翻译结果:%s'%(target['translateResult'][0][0]['tgt']))
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-21 06:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表