C丁洞杀O 发表于 2022-4-1 22:21:41

第三天学习Python做的爬虫

打卡,继续努力,学Python!!!

爬虫项目:20行代码获取百度首页的源代码
# coding:utf-8
# 爬取百度首页的页面数据(HTML源码)
import requests
if __name__ == "__main__":
    # 第一步: 指定url
    url = 'https://www.baidu.com/'
    # 第二步: 发起请求
    # get方法会返回一个响应对象
    response = requests.get(url=url)
    # 第三步: 获取相应数据.text返回的是字符串形式的响应数据
    page_text = response.text
    print(page_text)
    # 第四步: 持久化储存
    with open('./百度.html','w',encoding='utf-8') as fp:
      fp.write(page_text)
    print('爬虫完毕!!!')

继续努力,萌新的学习笔记,希望大佬点评啊!!!我要努力!~~~

wp231957 发表于 2022-4-2 10:42:35

注释太多

C丁洞杀O 发表于 2022-4-2 11:09:40

wp231957 发表于 2022-4-2 10:42
注释太多

萌新一个,注释多点也是正常的吗
页: [1]
查看完整版本: 第三天学习Python做的爬虫