鱼C论坛

 找回密码
 立即注册
查看: 3278|回复: 9

53课课后习题答案有问题哎~~求助

[复制链接]
发表于 2016-2-18 18:02:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
屏幕快照 2016-02-18 下午6.00.31.png

小甲鱼的答案:
  1. import urllib.request
  2. import chardet

  3. def main():
  4.     i = 0
  5.    
  6.     with open("urls.txt", "r") as f:
  7.         # 读取待访问的网址
  8.         # 由于urls.txt每一行一个URL
  9.         # 所以按换行符'\n'分割
  10.         urls = f.read().splitlines()
  11.         
  12.     for each_url in urls:
  13.         response = urllib.request.urlopen(each_url)
  14.         html = response.read()

  15.         # 识别网页编码
  16.         encode = chardet.detect(html)['encoding']
  17.         if encode == 'GB2312':
  18.             encode = 'GBK'
  19.         
  20.         i += 1
  21.         filename = "url_%d.txt" % i

  22.         with open(filename, "w", encoding=encode) as each_file:
  23.             each_file.write(html.decode(encode, "ignore"))

  24. if __name__ == "__main__":
  25.     main()
复制代码



运行后报错:
  1. =========== RESTART: /Users/cristikaQ/Documents/Pycode/53-2小甲鱼.py ===========
  2. Traceback (most recent call last):
  3.   File "/Users/cristikaQ/Documents/Pycode/53-2小甲鱼.py", line 29, in <module>
  4.     main()
  5.   File "/Users/cristikaQ/Documents/Pycode/53-2小甲鱼.py", line 26, in main
  6.     each_file.write(html.decode(encode, "ignore"))
  7. TypeError: decode() argument 1 must be str, not None
  8. >>>
复制代码



报错说decode()的第一个参数必须是字符串,可是encode是字符串没错啊

我自己写的也是同样的问题

求助
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-2-18 19:18:37 | 显示全部楼层

回帖奖励 +10 鱼币

本帖最后由 小小大鱼 于 2016-2-18 19:20 编辑

1.首先说明下,chardet我不懂
2.报错信息:TypeError: decode() argument 1 must be str, not None说明你的encode为空
由此反推,
encode = chardet.detect(html)['encoding']#这句不明白它的意思
但这里只有一个判断:
        if encode == 'GB2312':
            encode = 'GBK'
如果encode=='GB2312'不成立,那么encode是不是空值(None),请自己检查下

评分

参与人数 1鱼币 +5 收起 理由
碗碗的泡菜坛 + 5 感谢楼主无私奉献!

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2016-2-18 19:55:00 | 显示全部楼层
默默领个鱼币
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-2-18 20:35:30 | 显示全部楼层

回帖奖励 +10 鱼币

encode = chardet.detect(html)['encoding']
18行的这步赋值是不是有问题

评分

参与人数 1鱼币 +5 收起 理由
碗碗的泡菜坛 + 5 感谢楼主无私奉献!

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-18 20:37:45 | 显示全部楼层
本帖最后由 碗碗的泡菜坛 于 2016-2-18 20:47 编辑
小小大鱼 发表于 2016-2-18 19:18
1.首先说明下,chardet我不懂
2.报错信息:TypeError: decode() argument 1 must be str, not None说明你 ...


检查过了仍然不明原因,不过还是谢谢~chardet是个模块,detetct方法返回一个字典 ,encoding键对应一个字符串
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-18 20:38:45 | 显示全部楼层

不好好回答问题的人是不会有鱼币的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-18 20:49:16 | 显示全部楼层
问题已经解决,是我大意了,检测百度的编码,检测出来为空。。。。囧
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-2-18 21:03:33 | 显示全部楼层

回帖奖励 +10 鱼币

你拿下面这个代码测试一下,我加了几个测试点,你看都能不能正常输出,尤其看print(encode)这个的输出,看看有没有值。
测试的时候把txt文档里面就留www.fishc.com剩下的都删了,刚我只测试了www.baidu.com发现执行response = urllib.request.urlopen(each_url)会报错,www.fishc.com就没事=_=

  1. import urllib.request
  2. import urllib
  3. import chardet

  4. def main():
  5.     i = 0
  6.     print(0)
  7.     with open("urls.txt", "r") as f:
  8.         # 读取待访问的网址
  9.         # 由于urls.txt每一行一个URL
  10.         # 所以按换行符'\n'分割
  11.         urls = f.read().splitlines()
  12.     print(urls)

  13.     for each_url in urls:
  14.         response = urllib.request.urlopen(each_url)
  15.         html = response.read()

  16.         print(1)
  17.         # 识别网页编码
  18.         encode = chardet.detect(html)['encoding']
  19.         if encode == 'GB2312':
  20.             encode = 'GBK'

  21.         print(encode)
  22.       
  23.         i += 1
  24.         filename = "url_%d.txt" % i

  25.         with open(filename, "w", encoding=encode) as each_file:
  26.             each_file.write(html.decode(encode, "ignore"))


  27. if __name__ == "__main__":
  28.     main()
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-2-18 21:06:51 | 显示全部楼层
回完贴发现你已经找到问题了。。。。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-2-19 11:18:21 | 显示全部楼层
shuofxz 发表于 2016-2-18 21:06
回完贴发现你已经找到问题了。。。。

哈哈哈哈哈哈 还是谢谢 反正还是拿到了鱼币
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-19 17:11

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表