鱼C论坛

 找回密码
 立即注册
查看: 48|回复: 2

怎么获取分页id

[复制链接]
发表于 昨天 22:29 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
?id=237332&sort=0&size=30&ptype=1

这里的id=237332是一页的id,怎么获取到所有分页的id     
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 昨天 22:30 | 显示全部楼层
首先,分页id通常来自分页控件的链接参数。要获取所有分页的id,你可以按照以下步骤操作:

  • 手动观察分页规律:在浏览器中打开网页,查看分页控件(如“上一页”、“下一页”或页码)的链接地址。右键点击分页链接,选择“检查元素”或“查看源代码”,找到类似 ?id=237332 的片段。比较多个分页链接,看id值是否递增或有固定模式。
  • 如果id是递增的,可以直接推算所有分页id。例如,第一页id=237332,第二页可能是237333,以此类推。注意总页数可能有限制,需从页面信息中获取。
  • 使用编程方法自动获取(以Python为例):
    如果id是递增的,可以循环生成:

    1. base_id = 237332  # 起始id
    2. total_pages = 10   # 假设总页数为10,你需要根据实际情况调整

    3. for page in range(total_pages):
    4.     current_id = base_id + page
    5.     print(f"第{page+1}页id: {current_id}")
    复制代码

    如果id无规律,需要解析网页获取所有分页链接的id。示例使用BeautifulSoup:

    1. import requests
    2. from bs4 import BeautifulSoup

    3. # 替换为实际网址
    4. url = "[url=http://example.com/page?id=237332"]http://example.com/page?id=237332"[/url]
    5. response = requests.get(url)
    6. soup = BeautifulSoup(response.text, 'html.parser')

    7. # 假设分页链接包含在class为"pagination"的div中
    8. pagination = soup.find('div', class_='pagination')
    9. if pagination:
    10.     links = pagination.find_all('a')
    11.     for link in links:
    12.         href = link.get('href')
    13.         # 从href中提取id参数,例如使用字符串分割
    14.         if 'id=' in href:
    15.             id_value = href.split('id=')[1].split('&')[0]
    16.             print(id_value)
    复制代码



关键点:先手动查看分页链接结构,确定id变化规律,再选择合适的方法获取。注意遵守网站的robots.txt,避免频繁请求造成负担。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 昨天 22:57 | 显示全部楼层
什么网站?fishc?

(因你的等级过低,你暂时不能发出带“http(s)://“的链接,你可以去掉https://之后发出来
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-29 04:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表