第三天学习Python做的爬虫
打卡,继续努力,学Python!!!爬虫项目:20行代码获取百度首页的源代码
# coding:utf-8
# 爬取百度首页的页面数据(HTML源码)
import requests
if __name__ == "__main__":
# 第一步: 指定url
url = 'https://www.baidu.com/'
# 第二步: 发起请求
# get方法会返回一个响应对象
response = requests.get(url=url)
# 第三步: 获取相应数据.text返回的是字符串形式的响应数据
page_text = response.text
print(page_text)
# 第四步: 持久化储存
with open('./百度.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬虫完毕!!!')
继续努力,萌新的学习笔记,希望大佬点评啊!!!我要努力!~~~ 注释太多 wp231957 发表于 2022-4-2 10:42
注释太多
萌新一个,注释多点也是正常的吗
页:
[1]