wcq15759797758 发表于 2021-7-3 20:01:18

爬取新浪微博个人主页

import requests# 网络请求模块
import time,random      # 时间模块
import re
json_url = 'https://weibo.com/ajax/profile/info?uid=5642995337'
cookies ='填写账号ID'
# 创建RequestsCookieJar对象,用于设置cookies信息
cookies_jar = requests.cookies.RequestsCookieJar()
for cookie in cookies.split(';'):
    key, value = cookie.split('=', 1)
    cookies_jar.set(key, value)# 将cookies保存RequestsCookieJar当中
class Crawl():
    def __init__(self):
      # 创建头部信息
      self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36'}
    def get_json(self,json_url):
      response = requests.get(json_url, headers=self.headers,cookies=cookies_jar)
      name = re.findall('"screen_name":"(.*?)"',response.text)
      fensi = re.findall('"followers_count":(.*?),', response.text)
      print('用户名为:' + str(name))
      print('粉丝数量:' + str(fensi))
if __name__ == '__main__':
    c = Crawl()                # 创建爬虫类对象
    text = c.get_json(json_url)
    time.sleep(random.randint(2,4))# 随机产生获取json请求的间隔时间'''

{:10_254:} 每日一爬

rebellion51 发表于 2021-7-4 10:44:43

支持大佬

wcq15759797758 发表于 2021-7-4 11:39:44

rebellion51 发表于 2021-7-4 10:44
支持大佬

我是小白{:10_254:}

hornwong 发表于 2021-7-4 12:04:29

感谢分享!

FC童梦 发表于 2021-7-4 14:02:49

水币的日常{:10_245:}

第五天 发表于 2021-7-4 14:04:22

支持大佬

sunwenwu123 发表于 2021-7-4 15:39:24

日常水币{:10_266:}

超级玛尼哄 发表于 2021-7-4 16:38:57

学习学习

fr1518 发表于 2021-7-4 20:54:27

111

邓CX 发表于 2021-7-4 22:54:41

{:5_102:}

芬里尔ming 发表于 2021-7-5 21:53:18

感谢分享

白开水加点料 发表于 2021-7-6 15:39:06

厉害了

兔子乙 发表于 2023-5-3 21:42:54

认真学习!
页: [1]
查看完整版本: 爬取新浪微博个人主页