本帖最后由 红唇如刀 于 2020-7-4 09:36 编辑
尝试一个简易的爬虫时,遇到两个问题,求助所有路过的鱼友
问题1:为什么我在请求的时候,如果带上headers,会提示错误:
如果我把headers去掉后,就可以正常使用?我想在请求的时候带上headers应该如何实现?
问题2:我需要的是图中标红的信息,我自己的代码中的倒数第二句没有效果,如何用代码实现?
import requests
import os
from bs4 import BeautifulSoup
url = "https://xuangubao.cn/theme/17006066"
headers ={ 'User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36' }
path = (r'C:\Users\Administrator\Desktop\\')
file_html = requests.get(url,headers = headers)
demo = file_html.text
soup = BeautifulSoup(demo,'html.parser')
name =soup.title.text.split(' |')[0]+'.txt'
file_name =path +name
with open(file_name,'w',encoding= 'utf-8')as f:
f.writelines(demo)
print('已在桌面生成%s文件'%(name))
code =soup.body.text.split('".ss"')
print(code)
请各位鱼友出手相助!
|