[python]做爬虫时候print不了中文
import osimport requests
import re
url='https://zhidao.baidu.com/question/154521735.html'
html=requests.get(url).content.decode('gbk')
msg=re.findall('<p>(.+?)</p>',html)
a=open('Story.txt','w',encoding='utf-8')
for i in msg:
if i[ :2] == '<a':
pass
else:
H=re.sub('[</strong>]','',i)
H=H+'\n'
a.write(H)
a.close()
os.rename('Story.txt','S.txt')
print('完成')
这个完成打不出来
错误:
SyntaxError: Non-UTF-8 code starting with '\xcd' in file F:/Python自制软件/爬虫/爬虫2/爬虫3/KKK/爬虫_1.py on line 18, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
怎么办啊~
改成print('end')就可以 把代码文件编码改成UTF-8 永恒的蓝色梦想 发表于 2020-3-28 21:22
把代码文件编码改成UTF-8
怎么转,我差百度也就到这,求 Pythonnewers 发表于 2020-3-28 21:27
怎么转,我差百度也就到这,求
Notepad++有吗 在代码最上方加
#coding:utf-8
geneguo 发表于 2020-3-28 23:28
在代码最上方加
#coding:utf-8
那我的gbk转码会报错吗 Pythonnewers 发表于 2020-3-29 00:09
那我的gbk转码会报错吗
你这个文件到底是什么编码的嘞 Pythonnewers 发表于 2020-3-29 00:09
那我的gbk转码会报错吗
utf-8 编码里包含全世界里的所有语言的文字
gbk 编码也在 utf-8 里面。
而且我试了用 gbk 编码会报错。
所以你就写 #coding:utf-8 就行
在代码最上方加
#coding:utf-8 永恒的蓝色梦想 发表于 2020-3-29 08:28
你这个文件到底是什么编码的嘞
我后面get转码成gbk了
Pythonnewers 发表于 2020-3-29 09:46
我后面get转码成gbk了
你可以运行试试看
页:
[1]