爬取新浪微博个人主页
import requests# 网络请求模块import time,random # 时间模块
import re
json_url = 'https://weibo.com/ajax/profile/info?uid=5642995337'
cookies ='填写账号ID'
# 创建RequestsCookieJar对象,用于设置cookies信息
cookies_jar = requests.cookies.RequestsCookieJar()
for cookie in cookies.split(';'):
key, value = cookie.split('=', 1)
cookies_jar.set(key, value)# 将cookies保存RequestsCookieJar当中
class Crawl():
def __init__(self):
# 创建头部信息
self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36'}
def get_json(self,json_url):
response = requests.get(json_url, headers=self.headers,cookies=cookies_jar)
name = re.findall('"screen_name":"(.*?)"',response.text)
fensi = re.findall('"followers_count":(.*?),', response.text)
print('用户名为:' + str(name))
print('粉丝数量:' + str(fensi))
if __name__ == '__main__':
c = Crawl() # 创建爬虫类对象
text = c.get_json(json_url)
time.sleep(random.randint(2,4))# 随机产生获取json请求的间隔时间'''
{:10_254:} 每日一爬 支持大佬 rebellion51 发表于 2021-7-4 10:44
支持大佬
我是小白{:10_254:} 感谢分享! 水币的日常{:10_245:} 支持大佬 日常水币{:10_266:} 学习学习 111
{:5_102:} 感谢分享 厉害了
认真学习!
页:
[1]