鱼C论坛

 找回密码
 立即注册
查看: 3506|回复: 8

[已解决]python爬取的网站代码为什么不分行?

[复制链接]
发表于 2021-8-18 23:19:44 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
各位大佬,
我照着视频里的教程敲了代码,
但是老师出来的网站代码分行,
我的直接是好长的两行码没有分行,
请问这是为什么呀?
(图一是代码,图二是老师的结果,图三是我的结果)
最佳答案
2021-8-19 10:49:27
你看看你第二张图,你老师看的就不是运行结果,而是看的保存的文件

1.png
1.png
2.png
3.jpg
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-8-19 07:18:26 From FishC Mobile | 显示全部楼层
返回的是错误信息
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-19 08:50:24 | 显示全部楼层
因为你把获取到的写入到另外一个html文件里面了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-19 10:25:12 | 显示全部楼层
写入到文件里去了,with open()方法是保存到文件中去,文件名就是sogou.html
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-19 10:30:28 | 显示全部楼层
不改header会被反扒的。
headers = {'User-agent': 'Mozilla'}
response = requests.get(url, headers=headers)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-19 10:49:27 | 显示全部楼层    本楼为最佳答案   
你看看你第二张图,你老师看的就不是运行结果,而是看的保存的文件

1.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-8-19 10:53:07 | 显示全部楼层
你打印结果只有一行是因为网页源代码就一行啊

1.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-2 00:24:50 | 显示全部楼层
ctrl+alt+l 重新格式化代码就好了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-9-2 01:39:26 | 显示全部楼层
你这图2和图3压根看的不是同一个东西,一个看的是html文件,一个看的是执行结果窗口
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-28 16:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表