Pythonnewers 发表于 2020-3-28 20:44:33

[python]做爬虫时候print不了中文

import os
import requests
import re
url='https://zhidao.baidu.com/question/154521735.html'
html=requests.get(url).content.decode('gbk')
msg=re.findall('<p>(.+?)</p>',html)
a=open('Story.txt','w',encoding='utf-8')
for i in msg:
    if i[ :2] == '<a':
      pass

    else:
      H=re.sub('[</strong>]','',i)
      H=H+'\n'
      a.write(H)
a.close()
os.rename('Story.txt','S.txt')
print('完成')


这个完成打不出来
错误:
SyntaxError: Non-UTF-8 code starting with '\xcd' in file F:/Python自制软件/爬虫/爬虫2/爬虫3/KKK/爬虫_1.py on line 18, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
怎么办啊~
改成print('end')就可以

永恒的蓝色梦想 发表于 2020-3-28 21:22:55

把代码文件编码改成UTF-8

Pythonnewers 发表于 2020-3-28 21:27:55

永恒的蓝色梦想 发表于 2020-3-28 21:22
把代码文件编码改成UTF-8

怎么转,我差百度也就到这,求

永恒的蓝色梦想 发表于 2020-3-28 21:30:47

Pythonnewers 发表于 2020-3-28 21:27
怎么转,我差百度也就到这,求

Notepad++有吗

geneguo 发表于 2020-3-28 23:28:06

在代码最上方加
#coding:utf-8

Pythonnewers 发表于 2020-3-29 00:09:20

geneguo 发表于 2020-3-28 23:28
在代码最上方加
#coding:utf-8

那我的gbk转码会报错吗

永恒的蓝色梦想 发表于 2020-3-29 08:28:39

Pythonnewers 发表于 2020-3-29 00:09
那我的gbk转码会报错吗

你这个文件到底是什么编码的嘞

lixiangyv 发表于 2020-3-29 08:33:03

Pythonnewers 发表于 2020-3-29 00:09
那我的gbk转码会报错吗

utf-8 编码里包含全世界里的所有语言的文字
gbk 编码也在 utf-8 里面。
而且我试了用 gbk 编码会报错。
所以你就写 #coding:utf-8 就行

Mike_python小 发表于 2020-3-29 09:18:05


在代码最上方加
#coding:utf-8

Pythonnewers 发表于 2020-3-29 09:46:48

永恒的蓝色梦想 发表于 2020-3-29 08:28
你这个文件到底是什么编码的嘞

我后面get转码成gbk了

永恒的蓝色梦想 发表于 2020-3-29 09:58:09

Pythonnewers 发表于 2020-3-29 09:46
我后面get转码成gbk了

你可以运行试试看
页: [1]
查看完整版本: [python]做爬虫时候print不了中文