鱼C论坛

 找回密码
 立即注册
查看: 2978|回复: 4

[已解决]python爬取百度地图的数据为什么只能返回400条记录?

[复制链接]
发表于 2018-1-24 16:33:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import requests
  2. import json
  3. from datetime import datetime

  4. def getjson(page_num=0):
  5.     headers = {
  6.         'User-Agent': 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
  7.     }
  8.     url='http://api.map.baidu.com/place/v2/search'
  9.     params={
  10.         'q':'网吧',
  11.         'region':'北京',
  12.         'scope':'2',
  13.         'page_size':'10',
  14.         'page_num':page_num,
  15.         'output':'json',
  16.         'ak':'XM53LMurtNQaAPFuKVy1WzSyZCNmNA9H',
  17.     }
  18.     response=requests.get(url=url,params=params,headers=headers)
  19.     html=response.text
  20.     decodejson=json.loads(html)
  21.     return decodejson


  22. count = 0  #计数器

  23. not_last_page=True
  24. page_num=0
  25. while not_last_page:
  26.     decodejson=getjson(page_num)
  27.     print(page_num)
  28.     if decodejson.get('results'):
  29.         for result in decodejson.get('results'):
  30.             name=result.get('name')
  31.             lat=result.get('location').get('lat')
  32.             lng=result.get('location').get('lng')
  33.             address=result.get('address')
  34.             street_id=result.get('street_id')
  35.             uid=result.get('uid')
  36.             print('\naddress:''name:',name,'\n','address:',address,'\n','lat:',lat,'\n','lng:',lng)
  37.             count+=1;
  38.             print('count:',count)
  39.         page_num=page_num+1
  40.     else:
  41.         not_last_page=False
  42.         
复制代码
最佳答案
2018-1-24 16:55:14
http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-placeapi
POI检索总数,开发者请求中设置了page_num字段才会出现total字段。出于数据保护目的,单次请求total最多为400。
www.PNG
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-1-24 16:39:36 | 显示全部楼层
可能 大概 北京只有400个网吧吧
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-1-24 16:46:16 | 显示全部楼层
sky 发表于 2018-1-24 16:39
可能 大概 北京只有400个网吧吧

qwe.PNG
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-1-24 16:55:14 | 显示全部楼层    本楼为最佳答案   
http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-placeapi
POI检索总数,开发者请求中设置了page_num字段才会出现total字段。出于数据保护目的,单次请求total最多为400。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-1-24 17:06:22 | 显示全部楼层
sky 发表于 2018-1-24 16:55
http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-placeapi
POI检索总数,开发者请求中 ...

把page_num去掉后根本停不下来
感谢大佬!!!
eed.PNG
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-6 07:56

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表