|
20鱼币
本帖最后由 红唇如刀 于 2020-7-4 09:36 编辑
尝试一个简易的爬虫时,遇到两个问题,求助所有路过的鱼友
问题1:为什么我在请求的时候,如果带上headers,会提示错误:
如果我把headers去掉后,就可以正常使用?我想在请求的时候带上headers应该如何实现?
问题2:我需要的是图中标红的信息,我自己的代码中的倒数第二句没有效果,如何用代码实现?
- import requests
- import os
- from bs4 import BeautifulSoup
- url = "https://xuangubao.cn/theme/17006066"
- headers ={ 'User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36' }
- path = (r'C:\Users\Administrator\Desktop\\')
- file_html = requests.get(url,headers = headers)
- demo = file_html.text
- soup = BeautifulSoup(demo,'html.parser')
- name =soup.title.text.split(' |')[0]+'.txt'
- file_name =path +name
- with open(file_name,'w',encoding= 'utf-8')as f:
- f.writelines(demo)
- print('已在桌面生成%s文件'%(name))
- code =soup.body.text.split('".ss"')
- print(code)
复制代码
请各位鱼友出手相助!
|
|