鱼C论坛

 找回密码
 立即注册
查看: 2913|回复: 19

[已解决]bytes 数据解码问题求助

[复制链接]
发表于 2022-11-28 23:58:30 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
遇到一个小说网站返回的数据类型解码问题,求大佬们指点一二


新人还不能+url,贴图里有,需要测试的麻烦动动小手打一下,辛苦了


随便抓一段测试了下,post请求返回的数据怎么解码都只有一段,不知道咋回事....




                               
登录/注册后可看大图
最佳答案
2022-11-29 13:23:17
本帖最后由 阿奇_o 于 2022-11-29 13:25 编辑

.text 和 .content  本质就是一样的数据。 所以根本不是解码的问题,而是这个接口请求响应回的本身数据的问题!(可能是它有特殊js控制。。

反正我研究了半天,即使headers,cookies,data,verify证书 等等都搞对了,它这个接口 还是返回那一小段数据。。

可行的、简单的办法,反而是用Selenium或Playwright (等它动态加载完毕),就简单地爬原网页即可(所见即所得)。。

当然,效率上,这肯定没有直接爬api快,但前提是你能搞定人家的api反爬机制呀。。

ps:个人感觉,js等前端知识不足,网络安全知识不足,是很难搞爬虫的~   


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-11-29 00:12:30 | 显示全部楼层
本帖最后由 jackz007 于 2022-11-29 00:16 编辑

        bytes 是 string 编码的结果,所以,要得到 string,只需要对 bytes . decode() 就可以。
        第43行改为:
  1. print(response . content . decode('utf-8'))
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 00:28:35 | 显示全部楼层
jackz007 发表于 2022-11-29 00:12
bytes 是 string 编码的结果,所以,要得到 string,只需要对 bytes . decode() 就可以。
        ...

大佬 您说的我懂,我都尝试过,解出来的数据只有一段,您看我第一个图,他返回的数据不解码就都能显示出来


                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 00:56:17 | 显示全部楼层
有大佬分析下不,这个问题真的难到我了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 12:46:12 | 显示全部楼层
小白阿 发表于 2022-11-29 00:28
大佬 您说的我懂,我都尝试过,解出来的数据只有一段,您看我第一个图,他返回的数据不解码就都能显示出 ...


           可是,你的字节码明摆着不止就这几个字啊,就你截屏部分的内容,至少应该有 3 行才对啊。
           这样,在第 43、44 行之间插入 2 行代码:
  1. open("Sample.txt" , "wb") as fp:
  2.     fp . write(response . content)
复制代码

           执行过后,用资源管理器打开 Python 代码所在目录,再用 Windows 记事本打开 "Sample.txt" 看看里面的内容,是不是还是只有一行文本?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 13:23:17 | 显示全部楼层    本楼为最佳答案   
本帖最后由 阿奇_o 于 2022-11-29 13:25 编辑

.text 和 .content  本质就是一样的数据。 所以根本不是解码的问题,而是这个接口请求响应回的本身数据的问题!(可能是它有特殊js控制。。

反正我研究了半天,即使headers,cookies,data,verify证书 等等都搞对了,它这个接口 还是返回那一小段数据。。

可行的、简单的办法,反而是用Selenium或Playwright (等它动态加载完毕),就简单地爬原网页即可(所见即所得)。。

当然,效率上,这肯定没有直接爬api快,但前提是你能搞定人家的api反爬机制呀。。

ps:个人感觉,js等前端知识不足,网络安全知识不足,是很难搞爬虫的~   


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 13:35:23 | 显示全部楼层
jackz007 发表于 2022-11-29 12:46
可是,你的字节码明摆着不止就这几个字啊,就你截屏部分的内容,至少应该有 3 行才对啊。
...

对啊 ,我开始问的这个问题就是这个意思,不解码我复制手动去解就是整个的内容, 但是python解码后就只有一段内容了,不知道啥问题
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 13:39:03 | 显示全部楼层
阿奇_o 发表于 2022-11-29 13:23
.text 和 .content  本质就是一样的数据。 所以根本不是解码的问题,而是这个接口请求响应回的本身数据的问 ...

对,text和content本质上一样,一个解码了一个没解码,但是我本地获取到数据了她js是控制不了的啊,很明显不解码的时候整段内容都在的,我怀疑是不是python在解码的时候把那个<p></p>给截断了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 15:15:51 | 显示全部楼层
小白阿 发表于 2022-11-29 13:39
对,text和content本质上一样,一个解码了一个没解码,但是我本地获取到数据了她js是控制不了的啊,很明 ...


"很明显不解码的时候整段内容都在的"???

.text是 响应体的utf-8的字符串形式,.content是 响应体的utf-8的字节码形式(十六进制), 懂?不懂就仔细看看requests的官方文档。

你若实在不信,认为它response里包含全部文章数据,那你就自己 读取session的原始字节数据,response.raw.read(..)  ,然后自己解码看看 。。



想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 15:40:39 | 显示全部楼层
本帖最后由 阿奇_o 于 2022-11-29 15:41 编辑
阿奇_o 发表于 2022-11-29 15:15
"很明显不解码的时候整段内容都在的"???

.text是 响应体的utf-8的字符串形式,.content是 响应体的 ...


好吧,打脸了,我自己打脸了,你的怀疑是对的   

的确是 字节码 转 字符串 时,出了问题。。 居然会出这种问题。。实在想不到。。

我验证了一下。。我根据requests官方文档,自己解码 响应体的数据,果然包括全部段落:
  1. with open('content.txt', 'wb') as fd:
  2.     for chunk in response.iter_content(chunk_size=128):
  3.         fd.write(chunk)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 15:57:46 | 显示全部楼层
jackz007 发表于 2022-11-29 12:46
可是,你的字节码明摆着不止就这几个字啊,就你截屏部分的内容,至少应该有 3 行才对啊。
...

终于解决了,您的获得对,卡了我多年的问题,,之前我看他没打印出来我就以为只解码了一段内容,但是数据是写进去了,有点理解不了只打印了一段

                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 15:59:24 | 显示全部楼层
阿奇_o 发表于 2022-11-29 15:40
好吧,打脸了,我自己打脸了,你的怀疑是对的   

的确是 字节码 转 字符串 时,出了问题 ...

我都说了啊,发帖的时候贴的图就是,其实不解码数据都出来了,解码的话就只有一段,然后我尝试了5楼的方法,居然全部写进去了,还是没搞懂为啥只输出了一段内容

                               
登录/注册后可看大图
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 16:02:49 | 显示全部楼层
小白阿 发表于 2022-11-29 15:57
终于解决了,您的获得对,卡了我多年的问题,,之前我看他没打印出来我就以为只解码了一段内容,但是数据 ...


         可不可以把 response . content 全部的字节数据复制、粘贴出来,我研究一下看看,为什么不能整体解码。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 16:07:56 | 显示全部楼层
jackz007 发表于 2022-11-29 16:02
可不可以把 response . content 全部的字节数据复制、粘贴出来,我研究一下看看,为什么不能 ...

可以啊,我就前短时间突然发现这个小说的加载方式就试了下,一直没有尝试保存,就是因为卡在输出这里了,现在还是理解不了为啥,试过本办法去手动解码,不知道是不是因为里面有\r</p><p> 这种字符


  1. b'<p> \xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe5\xa4\x9a\xe4\xb9\x88\xe5\x8b\x87\xe7\x8c\x9b\xe5\xbc\xba\xe5\xa3\xae\xe7\x9a\x84\xe4\xb8\x80\xe4\xb8\xaa\xe6\xb1\x89\xe5\xad\x90\xef\xbc\x8c\xe8\xbf\x99\xe4\xbc\x9a\xe7\xab\x9f\xe7\x84\xb6\xe5\x83\x8f\xe5\xad\xa9\xe5\xad\x90\xe4\xb8\x80\xe8\x88\xac\xe7\x9a\x84\xe6\x9f\x94\xe5\xbc\xb1\xe3\x80\x82\xe5\xbe\x90\xe4\xb9\x90\xe4\xb9\x9f\xe6\x9c\x89\xe4\xba\x9b\xe9\xbb\xaf\xe7\x84\xb6\xef\xbc\x8c\xe4\xbb\x96\xe4\xb8\x8d\xe5\x96\x9c\xe6\xac\xa2\xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xef\xbc\x8c\xe8\xbf\x99\xe5\x9b\x9e\xe5\x8d\xb4\xe5\xaf\xb9\xe4\xbb\x96\xe6\xbb\xa1\xe6\x98\xaf\xe5\x90\x8c\xe6\x83\x85\xe3\x80\x82\r</p><p> \xe4\xbb\xbb\xe4\xbd\x95\xe4\xba\xba\xe9\x83\xbd\xe4\xbc\x9a\xe7\x95\x8f\xe6\x83\xa7\xe6\xad\xbb\xe4\xba\xa1\xe3\x80\x82\xe5\xb0\xa4\xe5\x85\xb6\xe6\x98\xaf\xe5\x89\xa7\xe7\x83\x88\xe4\xbc\xa4\xe7\x97\x9b\xe4\xb8\xad\xef\xbc\x8c\xe6\x9b\xb4\xe4\xbc\x9a\xe5\xaf\xb9\xe6\xad\xbb\xe4\xba\xa1\xe5\xbc\x82\xe5\xb8\xb8\xe6\x81\x90\xe6\x83\xa7\xe3\x80\x82\xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe7\x9a\x84\xe5\xa4\xb1\xe6\x80\x81\xe5\x8f\xaa\xe6\x98\xaf\xe4\xba\xba\xe7\x9a\x84\xe6\x9c\xac\xe6\x80\xa7\xe3\x80\x82\r</p><p> \xe6\xb2\xa1\xe6\x9c\x89\xe5\x90\x88\xe9\x80\x82\xe7\x9a\x84\xe8\x8d\xaf\xe7\x89\xa9\xef\xbc\x8c\xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe4\xb9\x9f\xe5\x8f\xaa\xe8\x83\xbd\xe4\xbe\x9d\xe9\x9d\xa0\xe8\xba\xab\xe4\xbd\x93\xe7\xa1\xac\xe6\x89\x9b\xe4\xba\x86\xe3\x80\x82\xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe8\xbf\x99\xe7\xa7\x8d\xe7\x8a\xb6\xe6\x80\x81\xef\xbc\x8c\xe5\xbe\x90\xe4\xb9\x90\xe5\xbe\x88\xe6\x80\x80\xe7\x96\x91\xe4\xbb\x96\xe8\x83\xbd\xe5\x90\xa6\xe5\x9d\x9a\xe6\x8c\x81\xe4\xb8\x8b\xe5\x8e\xbb\xe3\x80\x82\r</p><p> \xe2\x80\x9c\xe7\x99\xbd\xe5\xa4\xa9\xe6\xb2\xa1\xe7\x9c\x8b\xe5\x88\xb0\xe8\xbf\x99\xe7\xbe\xa4\xe8\x99\xab\xe5\xad\x90\xef\xbc\x8c\xe4\xbb\x8e\xe7\x94\x9f\xe7\x89\xa9\xe4\xb9\xa0\xe6\x80\xa7\xe4\xb8\x8a\xe8\xaf\xb4\xef\xbc\x8c\xe4\xb9\x9f\xe8\xae\xb8\xe5\xae\x83\xe4\xbb\xac\xe9\x83\xbd\xe7\x95\x8f\xe6\x83\xa7\xe5\xbc\xba\xe5\x85\x89\xe3\x80\x82\xe9\x82\xa3\xe6\x88\x91\xe4\xbb\xac\xe7\x99\xbd\xe5\xa4\xa9\xe5\xb0\xb1\xe8\x83\xbd\xe8\x84\xb1\xe5\x9b\xb0\xe4\xba\x86\xe3\x80\x82\xe2\x80\x9d\r</p><p> \xe9\xa2\x9c\xe8\x90\xbd\xe4\xb9\x9f\xe5\xae\x89\xe6\x85\xb0\xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe9\x81\x93\xef\xbc\x9a\xe2\x80\x9c\xe4\xbd\xa0\xe5\x9d\x9a\xe6\x8c\x81\xe4\xb8\x80\xe4\xb8\x8b\xef\xbc\x8c\xe7\xad\x89\xe5\x88\xb0\xe5\xa4\xa9\xe4\xba\xae\xe6\x88\x91\xe4\xbb\xac\xe5\xb0\xb1\xe8\x83\xbd\xe7\xa6\xbb\xe5\xbc\x80\xe8\xbf\x99\xe9\x87\x8c\xef\xbc\x8c\xe7\x84\xb6\xe5\x90\x8e\xe6\x83\xb3\xe5\x8a\x9e\xe6\xb3\x95\xe5\x9b\x9e\xe5\xad\xa4\xe6\x98\x9f\xe3\x80\x82\xe2\x80\x9d\r</p><p> \xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe7\x94\xa8\xe5\x8a\x9b\xe7\x9a\x84\xe7\x82\xb9\xe7\x82\xb9\xe5\xa4\xb4\xef\xbc\x8c\xe5\x89\xa9\xe4\xb8\x8b\xe7\x9a\x84\xe4\xb8\x80\xe5\x8f\xaa\xe7\x9c\xbc\xe7\x9d\x9b\xe9\x97\xaa\xe7\x9d\x80\xe5\x85\x89\xef\xbc\x8c\xe9\xa2\x9c\xe8\x90\xbd\xe7\x9a\x84\xe8\xaf\x9d\xe8\xae\xa9\xe4\xbb\x96\xe7\x9c\x8b\xe5\x88\xb0\xe4\xba\x86\xe5\xb8\x8c\xe6\x9c\x9b\xef\xbc\x8c\xe6\xb1\x82\xe7\x94\x9f\xe7\x9a\x84\xe6\xac\xb2\xe6\x9c\x9b\xe6\x9b\xb4\xe5\xbc\xba\xe7\x83\x88\xe4\xba\x86\xe3\x80\x82\r</p><p> \xe5\xbe\x90\xe4\xb9\x90\xe8\xbd\xbb\xe8\xbd\xbb\xe6\x91\x87\xe5\xa4\xb4\xef\xbc\x8c\xe9\xa2\x9c\xe8\x90\xbd\xe7\x9a\x84\xe6\x83\xb3\xe6\xb3\x95\xe6\x8c\xba\xe5\xa5\xbd\xef\xbc\x8c\xe5\x8f\xaf\xe8\xb0\x81\xe7\x9f\xa5\xe9\x81\x93\xe8\x99\xab\xe5\xad\x90\xe6\x98\xaf\xe4\xb8\x8d\xe6\x98\xaf\xe7\x9c\x9f\xe7\x9a\x84\xe7\x95\x8f\xe6\x83\xa7\xe5\xbc\xba\xe5\x85\x89\xef\xbc\x9f\xe6\x9b\xb4\xe5\xa4\xa7\xe7\x9a\x84\xe9\x97\xae\xe9\xa2\x98\xe6\x98\xaf\xef\xbc\x8c\xe5\xb0\xb1\xe7\xae\x97\xe7\xa6\xbb\xe5\xbc\x80\xe8\xbf\x99\xe9\x87\x8c\xef\xbc\x8c\xe5\x8f\x88\xe8\xaf\xa5\xe6\x80\x8e\xe4\xb9\x88\xe5\x9b\x9e\xe5\xae\xb6\xe5\x91\xa2\xef\xbc\x9f\r</p><p> \xe2\x80\x9c\xe5\xaf\xb9\xe4\xba\x86\xef\xbc\x8c\xe4\xbd\xa0\xe7\xa9\xb6\xe7\xab\x9f\xe6\x98\xaf\xe6\x80\x8e\xe4\xb9\x88\xe5\x8f\x97\xe7\x9a\x84\xe4\xbc\xa4\xef\xbc\x9f\xe2\x80\x9d\xe9\xa2\x9c\xe8\x90\xbd\xe6\x83\xb3\xe8\xb5\xb7\xe4\xba\x86\xe4\xb8\x80\xe4\xb8\xaa\xe6\x9e\x81\xe5\x85\xb6\xe5\x85\xb3\xe9\x94\xae\xe7\x9a\x84\xe9\x97\xae\xe9\xa2\x98\xef\xbc\x8c\xe5\xa5\xb9\xe9\x81\x87\xe5\x88\xb0\xe7\x9a\x84\xe8\x99\xab\xe5\xad\x90\xe5\x8f\xaa\xe4\xbc\x9a\xe5\x92\xac\xe4\xba\xba\xef\xbc\x8c\xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe6\x98\xaf\xe6\x80\x8e\xe4\xb9\x88\xe4\xbc\xa4\xe6\x88\x90\xe8\xbf\x99\xe6\xa0\xb7\xe7\x9a\x84\xef\xbc\x9f\r</p><p> \xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe6\x9c\x89\xe4\xba\x9b\xe4\xb8\xba\xe9\x9a\xbe\xe7\x9a\x84\xe7\x9c\xa8\xe4\xba\x86\xe7\x9c\xa8\xe7\x9c\xbc\xe7\x9d\x9b\xef\xbc\x8c\xe5\xbf\x8d\xe7\x9d\x80\xe5\x89\xa7\xe7\x97\x9b\xe5\x90\x83\xe5\x8a\x9b\xe7\x9a\x84\xe8\xaf\xb4\xe9\x81\x93\xef\xbc\x9a\xe2\x80\x9c\xe6\x88\x91\xe4\xb9\x9f\xe4\xb8\x8d\xe7\x9f\xa5\xe9\x81\x93\xef\xbc\x8c\xe5\xb0\xb1\xe6\x98\xaf\xe9\xbb\x91\xe6\x9a\x97\xe4\xb8\xad\xe6\x9c\x89\xe4\xb8\xaa\xe8\x99\xab\xe5\xad\x90\xe7\xaa\x81\xe7\x84\xb6\xe5\x96\xb7\xe5\x87\xba\xe4\xb8\x80\xe7\x89\x87\xe6\xaf\x92\xe6\xb6\xb2\xef\xbc\x8c\xe6\x88\x91\xe6\x9c\xac\xe8\x83\xbd\xe7\x9a\x84\xe8\xba\xb2\xe9\x81\xbf\xef\xbc\x8c\xe4\xbd\x86\xe6\xb2\xa1\xe8\x83\xbd\xe9\x81\xbf\xe5\xbc\x80\xe2\x80\xa6\xe2\x80\xa6\xe2\x80\x9d\r</p><p> \xe4\xbc\x97\xe4\xba\xba\xe5\x8f\x88\xe6\x98\xaf\xe4\xb8\x80\xe9\x98\xb5\xe6\xb2\x89\xe9\xbb\x98\xef\xbc\x8c\xe4\xbc\x9a\xe5\x96\xb7\xe6\xaf\x92\xe6\xb6\xb2\xe7\x9a\x84\xe8\x99\xab\xe5\xad\x90\xef\xbc\x8c\xe5\x8d\xb1\xe9\x99\xa9\xe7\xa8\x8b\xe5\xba\xa6\xe4\xb8\x80\xe4\xb8\x8b\xe6\x8f\x90\xe5\x8d\x87\xe4\xba\x86\xe5\x8d\x81\xe5\x80\x8d\xe3\x80\x82\xe8\xa6\x81\xe6\x98\xaf\xe8\xbf\x99\xe6\xa0\xb7\xe7\x9a\x84\xe8\x99\xab\xe5\xad\x90\xe6\x9c\x89\xe5\xbe\x88\xe5\xa4\x9a\xef\xbc\x8c\xe4\xbb\x96\xe4\xbb\xac\xe5\xb0\xb1\xe5\x8d\xb1\xe9\x99\xa9\xe4\xba\x86\xe3\x80\x82\r</p><p> \xe6\x8e\xa5\xe4\xb8\x8b\xe6\x9d\xa5\xe7\x9a\x84\xe6\x97\xb6\xe9\x97\xb4\xef\xbc\x8c\xe5\x9b\x9b\xe4\xb8\xaa\xe4\xba\xba\xe5\x90\x84\xe8\x87\xaa\xe5\xae\x88\xe7\x9d\x80\xe4\xb8\x80\xe4\xb8\xaa\xe6\x96\xb9\xe5\x90\x91\xef\xbc\x8c\xe9\x98\xb2\xe6\xad\xa2\xe6\x9c\x89\xe8\x99\xab\xe5\xad\x90\xe5\x86\xb2\xe4\xb8\x8a\xe6\x9d\xa5\xe3\x80\x82\xe5\xae\x89\xe9\x9d\x99\xe7\x9a\x84\xe5\xa4\xa9\xe5\x8f\xb0\xe4\xb8\x8a\xef\xbc\x8c\xe5\x8f\xaa\xe6\x9c\x89\xe4\xbd\x95\xe9\x93\x81\xe5\x86\x9b\xe5\x9c\xa8\xe4\xb8\x8d\xe5\x81\x9c\xe7\x9a\x84\xe5\x91\xbb\xe5\x90\x9f\xe3\x80\x82\xe5\xbc\xba\xe5\x8a\x9b\xe6\xad\xa2\xe7\x97\x9b\xe5\x89\x82\xe8\xae\xa9\xe4\xbb\x96\xe7\x9a\x84\xe8\x84\x91\xe5\xad\x90\xe6\x98\x8f\xe6\xb2\x89\xef\xbc\x8c\xe5\x8d\xb4\xe6\x97\xa0\xe6\xb3\x95\xe7\x9c\x9f\xe6\xad\xa3\xe6\xad\xa2\xe4\xbd\x8f\xe7\x9a\x84\xe5\x89\xa7\xe7\x97\x9b\xe3\x80\x82\r</p><p> \xe6\xa5\xbc\xe6\xa2\xaf\xe9\x80\x9a\xe9\x81\x93\xe8\x99\xbd\xe7\x84\xb6\xe8\xa2\xab\xe7\x82\xb8\xe5\xa1\x8c\xef\xbc\x8c\xe4\xbe\x9d\xe7\x84\xb6\xe8\x83\xbd\xe9\x9a\x90\xe9\x9a\x90\xe5\x90\xac\xe5\x88\xb0\xe8\x99\xab\xe5\xad\x90\xe4\xbb\xac\xe5\x9c\xa8\xe4\xb8\x8b\xe9\x9d\xa2\xe6\xbb\x8b\xe6\xbb\x8b\xe4\xb9\xb1\xe5\x8f\xab\xe3\x80\x82\r</p><p> \xe9\x95\xbf\xe5\xa4\x9c\xe6\x98\xaf\xe5\xa6\x82\xe6\xad\xa4\xe6\xbc\xab\xe9\x95\xbf\xef\xbc\x8c\xe6\xaf\x8f\xe4\xb8\xaa\xe4\xba\xba\xe9\x83\xbd\xe8\xa7\x89\xe5\xbe\x97\xe5\xbc\x82\xe5\xb8\xb8\xe7\x85\x8e\xe7\x86\xac\xe3\x80\x82\r</p><p> \xe5\x8d\x81\xe4\xb8\xaa\xe5\xb0\x8f\xe6\x97\xb6\xe5\x90\x8e\xef\xbc\x8c\xe4\xb8\x80\xe8\xbd\xae\xe6\x97\xad\xe6\x97\xa5\xe4\xbb\x8e\xe5\x9c\xb0\xe5\xb9\xb3\xe7\xba\xbf\xe5\x8d\x87\xe8\xb5\xb7\xef\xbc\x8c\xe4\xba\xbf\xe4\xb8\x87\xe9\x87\x91\xe5\x85\x89\xe5\xbe\x88\xe5\xbf\xab\xe5\xb0\xb1\xe9\x93\xba\xe6\xbb\xa1\xe5\xa4\xa9\xe7\xa9\xba\xe5\x92\x8c\xe5\xa4\xa7\xe5\x9c\xb0\xef\xbc\x8c\xe5\xae\xa3\xe5\x91\x8a\xe7\x9d\x80\xe9\x95\xbf\xe5\xa4\x9c\xe5\xbd\xbb\xe5\xba\x95\xe8\xbf\x87\xe5\x8e\xbb\xe3\x80\x82\r</p><p> \xe4\xbd\x86\xe5\xbe\x90\xe4\xb9\x90\xe7\xad\x89\xe4\xba\xba\xe7\x9a\x84\xe5\xbf\x83\xe5\x8d\xb4\xe4\xb8\x80\xe7\x89\x87\xe5\x86\xb0\xe5\x86\xb7\xef\xbc\x8c\xe5\x9b\xb4\xe5\x9c\xa8\xe5\xa4\xa7\xe6\xa5\xbc\xe4\xb8\x8b\xe7\x9a\x84\xe8\x99\xab\xe5\xad\x90\xe5\xb9\xb6\xe6\xb2\xa1\xe6\x9c\x89\xe9\x80\x80\xe8\xb5\xb0\xef\xbc\x8c\xe6\x95\xb0\xe9\x87\x8f\xe4\xb8\x8a\xe5\xa5\xbd\xe5\x83\x8f\xe6\x9b\xb4\xe5\xa4\x9a\xe4\xba\x86\xe4\xb8\x80\xe4\xba\x9b\xe3\x80\x82\r</p><p> \xe4\xbb\x8e\xe4\xb8\x8a\xe9\x9d\xa2\xe7\x9c\x8b\xe4\xb8\x8b\xe5\x8e\xbb\xef\xbc\x8c\xe5\xaf\x86\xe5\xaf\x86\xe9\xba\xbb\xe9\xba\xbb\xe7\x9a\x84\xe6\xbc\x86\xe9\xbb\x91\xe4\xb8\x80\xe5\xa4\xa7\xe7\x89\x87\xef\xbc\x8c\xe6\x8a\x8a\xe5\xa4\xa7\xe6\xa5\xbc\xe5\x9b\xa2\xe5\x9b\xa2\xe5\x9b\xb4\xe4\xbd\x8f\xe3\x80\x82\r</p><p> \xe2\x80\x9c\xe5\xae\x83\xe4\xbb\xac\xe5\xa5\xbd\xe5\x83\x8f\xe4\xb8\x8d\xe6\x80\x95\xe5\x85\x89\xe2\x80\xa6\xe2\x80\xa6\xe2\x80\x9d\xe7\x8e\x8b\xe5\x87\xaf\xe8\x84\xb8\xe8\x89\xb2\xe5\xbc\x82\xe5\xb8\xb8\xe6\xb2\x89\xe9\x87\x8d\xef\xbc\x8c\xe5\xa6\x82\xe6\x9e\x9c\xe8\x99\xab\xe5\xad\x90\xe4\xb8\x8d\xe6\x80\x95\xe9\x98\xb3\xe5\x85\x89\xef\xbc\x8c\xe4\xbb\x96\xe4\xbb\xac\xe5\x9f\xba\xe6\x9c\xac\xe6\xb2\xa1\xe6\x9c\x89\xe9\x80\x83\xe8\x84\xb1\xe7\x9a\x84\xe5\x8f\xaf\xe8\x83\xbd\xe4\xba\x86\xe3\x80\x82\r</p><p> \xe9\xa2\x9c\xe8\x90\xbd\xe5\x88\xb0\xe6\x98\xaf\xe6\xaf\x94\xe7\x8e\x8b\xe5\x87\xaf\xe5\x86\xb7\xe9\x9d\x99\xef\xbc\x8c\xe5\xa5\xb9\xe8\xaf\xb4\xe9\x81\x93\xef\xbc\x9a\xe2\x80\x9c\xe7\x8e\xb0\xe5\x9c\xa8\xe9\x98\xb3\xe5\x85\x89\xe8\xbf\x98\xe5\xbe\x88\xe6\x9f\x94\xe5\x92\x8c\xe3\x80\x82\xe8\xbf\x99\xe9\xa2\x97\xe6\x98\x9f\xe7\x90\x83\xe6\x9c\x89\xe4\xb8\xa4\xe9\xa2\x97\xe5\xa4\xaa\xe9\x98\xb3\xef\xbc\x8c\xe4\xb8\xad\xe5\x8d\x88\xe7\x9a\x84\xe6\x97\xb6\xe5\x80\x99\xe9\x98\xb3\xe5\x85\x89\xe5\xbc\x82\xe5\xb8\xb8\xe5\xbc\xba\xe7\x9b\x9b\xe3\x80\x82\xe6\x88\x91\xe4\xbb\xac\xe5\x86\x8d\xe7\xad\x89\xe7\xad\x89\xe3\x80\x82\xe2\x80\x9d\r</p><p> \xe5\xbe\x90\xe4\xb9\x90\xe5\x85\xb6\xe5\xae\x9e\xe4\xb8\x8d\xe5\xa4\xaa\xe7\x9b\xb8\xe4\xbf\xa1\xe9\xa2\x9c\xe8\x90\xbd\xe7\x9a\x84\xe5\x88\x86\xe6\x9e\x90\xef\xbc\x8c\xe5\x8f\xaf\xe4\xba\x8b\xe5\xb7\xb2\xe8\x87\xb3\xe6\xad\xa4\xef\xbc\x8c\xe4\xbb\x96\xe4\xb9\x9f\xe6\xb2\xa1\xe6\x9c\x89\xe5\x88\xab\xe7\x9a\x84\xe5\x8a\x9e\xe6\xb3\x95\xe3\x80\x82\xe5\x8f\xaa\xe8\x83\xbd\xe7\xbb\xa7\xe7\xbb\xad\xe7\xad\x89\xe5\xbe\x85\xe3\x80\x82\xe4\xb8\x8b\xe9\x9d\xa2\xe7\x9a\x84\xe8\x99\xab\xe5\xad\x90\xe5\x8d\xb4\xe4\xb8\x8d\xe7\xad\x89\xe4\xba\x86\xef\xbc\x8c\xe4\xb8\x80\xe4\xba\x9b\xe8\x99\xab\xe5\xad\x90\xe8\xaf\x95\xe5\x9b\xbe\xe4\xbb\x8e</p>'
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 16:12:55 | 显示全部楼层
小白阿 发表于 2022-11-29 16:07
可以啊,我就前短时间突然发现这个小说的加载方式就试了下,一直没有尝试保存,就是因为卡在输出这里了, ...

        谢谢!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-29 16:16:51 | 显示全部楼层

不对不对,我该感谢你,我这个帖子的疑惑您帮我解决了,这个输出问题您要是解决了也和我说下,这个数据其实没啥用,主要是想研究研究这个到底怎么回事,有点不解
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 16:19:41 | 显示全部楼层
小白阿 发表于 2022-11-29 16:16
不对不对,我该感谢你,我这个帖子的疑惑您帮我解决了,这个输出问题您要是解决了也和我说下,这个数据其 ...

     Ok
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 16:25:10 | 显示全部楼层
其实是换行符的问题,你获取到的字节码换行符是 \r,在 Windows 控制台里是回车(回到原行开头),所以前面打印的内容被后面的覆盖了
  1. print(response.content.decode("utf-8").replace("\r", "\r\n"))
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2022-11-29 16:28:16 | 显示全部楼层
hrpzcf 发表于 2022-11-29 16:25
其实是换行符的问题,你获取到的字节码换行符是 \r,在 Windows 控制台里是回车(回到原行开头),所以前面 ...

好嘞,我来试下,之前操作是把\r</p><p>全给换掉了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-11-29 16:57:46 | 显示全部楼层
本帖最后由 阿奇_o 于 2022-11-29 17:02 编辑

哈哈哈,我是领教到这 \r 的真实场景了,哈哈哈,我调试看它 content 和 text 完全没问题,到了 print() 就有问题。。
原来是因为 它就带了一个 \r ,所以在Windows里 "指针" 每次都回到行首,把前一行的内容给覆盖掉,最后只剩最后一行 。。
所以,要打印的话,将 \r 替换 \r\n , 或 按\r 来分割后再print 即可:
  1. print(response.text)        # ??
  2. txt = response.text
  3. for line in txt.split('\r'):
  4.     print(line)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 08:46

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表