爬取新浪微博个人主页

wcq15759797758 · 发表于 2021-7-3 20:01:18

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests # 网络请求模块
import time,random # 时间模块
import re
json_url = 'https://weibo.com/ajax/profile/info?uid=5642995337'
cookies ='填写账号ID'
# 创建RequestsCookieJar对象，用于设置cookies信息
cookies_jar = requests.cookies.RequestsCookieJar()
for cookie in cookies.split(';'):
key, value = cookie.split('=', 1)
cookies_jar.set(key, value) # 将cookies保存RequestsCookieJar当中
class Crawl():
def __init__(self):
# 创建头部信息
self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36'}
def get_json(self,json_url):
response = requests.get(json_url, headers=self.headers,cookies=cookies_jar)
name = re.findall('"screen_name":"(.*?)"',response.text)
fensi = re.findall('"followers_count":(.*?),', response.text)
print('用户名为：' + str(name))
print('粉丝数量：' + str(fensi))
if __name__ == '__main__':
c = Crawl() # 创建爬虫类对象
text = c.get_json(json_url)
time.sleep(random.randint(2,4)) # 随机产生获取json请求的间隔时间'''

复制代码

每日一爬

rebellion51 · 发表于 2021-7-4 10:44:43

支持大佬

wcq15759797758 · 发表于 2021-7-4 11:39:44

rebellion51 发表于 2021-7-4 10:44
支持大佬

我是小白

hornwong · 发表于 2021-7-4 12:04:29

感谢分享！

FC童梦 · 发表于 2021-7-4 14:02:49

水币的日常

第五天 · 发表于 2021-7-4 14:04:22

支持大佬

sunwenwu123 · 发表于 2021-7-4 15:39:24

日常水币

超级玛尼哄 · 发表于 2021-7-4 16:38:57

学习学习

fr1518 · 发表于 2021-7-4 20:54:27

111

邓CX · 发表于 2021-7-4 22:54:41

芬里尔ming · 发表于 2021-7-5 21:53:18

感谢分享

白开水加点料 · 发表于 2021-7-6 15:39:06

厉害了

兔子乙 · 发表于 2023-5-3 21:42:54

认真学习！

账号		自动登录	找回密码
密码			立即注册

[技术交流] 爬取新浪微博个人主页