鱼C论坛

 找回密码
 立即注册
查看: 1873|回复: 19

[已解决]print(html)报错

[复制链接]
发表于 2020-7-10 00:49:50 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
打印html就报错怎么回事,以前都可以直接打印的好久没用,突然发现就是打印不了html 咋肥四啊这是,哪位大佬可以帮忙解决一下
最佳答案
2020-7-10 10:02:51



11.png

我成功打印了,应该是你 PyCharm 没有设置编码的问题,去我帖子去设置下PyCharm 的编码

【萌新使用 PyCharm 必看】PyCharm 基础使用手册
https://fishc.com.cn/thread-173240-1-1.html
(出处: 鱼C论坛)
QQ图片20200710004449.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-7-10 00:54:58 | 显示全部楼层
本帖最后由 Stubborn 于 2020-7-10 00:56 编辑

应该是编码有问题。

你试试,不行就需要发下链接了
  1. response.encoding = "utf-8” # 不行再试"gb2312", "gbk"这两个
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2020-7-10 08:05:04 | 显示全部楼层
Stubborn 发表于 2020-7-10 00:54
应该是编码有问题。

你试试,不行就需要发下链接了

还是不行,print(len(html))就可以正常运行,就是不能print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 08:30:58 | 显示全部楼层
你一开始有一个unicode编码,最简单的方式把你这个html文件用记事本打开,之后另存为,另存为那边有一个编码选择,选择UTF-8即可
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 08:34:47 | 显示全部楼层
看你这个标题额还以为是web   html的print嘞
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 08:46:26 | 显示全部楼层
  1. r.encoding = r.apparent_encoding
复制代码

可以解决
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 08:58:17 | 显示全部楼层
BIO-张磊 发表于 2020-7-10 08:30
你一开始有一个unicode编码,最简单的方式把你这个html文件用记事本打开,之后另存为,另存为那边有一个编码 ...

根本就没有涉及到文件操作好不好...
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-10 08:59:20 | 显示全部楼层

试了,依然不行  源码已经获取到了,就是不能print
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-10 09:00:31 | 显示全部楼层
BIO-张磊 发表于 2020-7-10 08:30
你一开始有一个unicode编码,最简单的方式把你这个html文件用记事本打开,之后另存为,另存为那边有一个编码 ...

这是直接请求的,就是想打印在控制台上解析一下,
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 09:00:41 | 显示全部楼层
试试这样,不知道行不行
  1. html = response.content
  2. with open("text.html", 'wb') as f:
  3.     f.write(html)

  4. with open("text.html", 'r', encoding='utf-8') as f:
  5.     html = f.read()

  6. print(html)
复制代码

可能有更简洁的方法,这只是我想到的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 09:06:26 | 显示全部楼层
url发出来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 09:13:31 | 显示全部楼层
qiuyouzhi 发表于 2020-7-10 08:58
根本就没有涉及到文件操作好不好...

可能我没解释清楚,我的想法是把他保存为一个新的文件,之后在读取进来。类似于10楼的想法。如果这个方法不行,那说明我太菜了。。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 09:21:15 | 显示全部楼层
你把你的代码发上来
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-10 10:00:07 | 显示全部楼层
代码
  1. headers = {'User-Agent': 'daddddse'}
  2. #
  3. response = requests.get('https://www.vmgirls.com/14101.html',headers=headers)
  4. print(response.request.headers)
  5. html = response.text
  6. # print("ilove fash c")
  7. print(html)
复制代码
QQ图片20200710095908.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 10:02:51 | 显示全部楼层    本楼为最佳答案   



11.png

我成功打印了,应该是你 PyCharm 没有设置编码的问题,去我帖子去设置下PyCharm 的编码

【萌新使用 PyCharm 必看】PyCharm 基础使用手册
https://fishc.com.cn/thread-173240-1-1.html
(出处: 鱼C论坛)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-10 10:03:48 | 显示全部楼层
新建了个项目。。。可以了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-10 10:11:49 | 显示全部楼层
甜心先生 发表于 2020-7-10 10:03
新建了个项目。。。可以了


如果问题解决,那就设置下【最佳答案】吧~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-13 12:30:56 | 显示全部楼层
本帖最后由 johnnyb 于 2020-7-13 12:32 编辑
甜心先生 发表于 2020-7-10 10:03
新建了个项目。。。可以了


另存为的时候 open('x.html','w',encoding='utf-8')    这个encoding='utf-8' 是核心. 以u8方式写入.   不然如果你取得的内容可能是gbk 或者ascii 编码之间必须转换.  我吃过这亏

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-13 16:28:06 | 显示全部楼层
本帖最后由 甜心先生 于 2020-7-13 16:44 编辑

🙏
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-13 16:42:42 | 显示全部楼层
johnnyb 发表于 2020-7-13 12:30
另存为的时候 open('x.html','w',encoding='utf-8')    这个encoding='utf-8' 是核心. 以u8方式写入.   ...

我没有另存,只是打印在控制台,问题解决了,在设置里
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 16:45

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表