3236654291 发表于 2021-8-3 22:28:58

乱码问题

爬取下来的乱码如何变回中文{:10_257:}
在网上查了半天也找不到适合的办法{:10_254:}
如:臧霸

或夏ä¾ˉ恩

或æ›1真

澍梵. 发表于 2021-8-3 22:34:48

编码问题吧,改用encoding='utf-8'格式试试

深谙流年 发表于 2021-8-3 22:56:50

你在源码里找找代码格式,看有没有

大马强 发表于 2021-8-3 23:09:12

req.encoding = req.apparent_encoding
req是你请求回来的数据, req.apparent_encoding会给出它认为的编码
或是两个常用的
req.encoding="UTF-8""

req.encoding="gbk"

再不济在源码中找,一般在开头位置的 <meta charset=xxx编码>这个标签中,比如这个 <meta charset="UTF-8">

3236654291 发表于 2021-8-3 23:28:14

我试试

3236654291 发表于 2021-8-3 23:29:32

大马强 发表于 2021-8-3 23:09
req是你请求回来的数据, req.apparent_encoding会给出它认为的编码
或是两个常用的



可以了{:10_277:}

3236654291 发表于 2021-8-3 23:32:22

感谢大佬{:10_254:}
页: [1]
查看完整版本: 乱码问题