|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
- import requests, os
- from lxml import etree
- from fake_useragent import UserAgent
- import time
- url = "http://www.cbaigui.com/?paged=1"
- ua = UserAgent(verify_ssl=False)
- for i in range(1, 50):
- headers = {
- 'User-Agent': ua.random,
- 'Host': 'www.cbaigui.com',
- 'Referer': 'http://www.cbaigui.com /?paged={}'
- }
- res = requests.get(url=url, headers=headers)
复制代码
代码如上
问题0. ua = UserAgent(verify_ssl=False)是实例化一个UserAgent对象的意思吗,verify_ssl=False又是什么意思?
问题1. for i in range(1, 50) 是构造49个Refer的意思?这样就有49个请求头?
是的,你可以在你请求头那这样写:
- headers = {
- 'User-Agent': UserAgent().chrome
- }
复制代码
这样就是随机 谷歌的 UA头 你也可以改成 ie 或者 火狐的拼写
是否跳过证书验证,有些网站需要验证才能访问,但你跳过验证就可以正常访问
for i in range(1, 50) 是构造49个Refer的意思?这样就有49个请求头?
你代码可能 漏了个 i :
- for i in range(1, 50):
- headers = {
- 'User-Agent': ua.random,
- 'Host': 'www.cbaigui.com',
- 'Referer': f'http://www.cbaigui.com /?paged={i}'
- }
复制代码
没错 ,49 个请求头,Referer 是说明你从哪个网站跳转过来的,如果这样做出头,伪装人为更加真实,就是像人一页一页的翻一样
|
|