鱼C论坛

 找回密码
 立即注册
查看: 3205|回复: 6

[已解决]自己爬不动了,寻求支持

[复制链接]
发表于 2023-4-28 18:51:05 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 wp231957 于 2023-4-28 18:52 编辑
  1. https://www.philips.com.cn/c-w/search.html#q=%E7%A9%BA%E6%B0%94%E5%87%80%E5%8C%96%E5%99%A8&sort=relevancy
复制代码


这里面有1314条记录   我想获取他们的二级链接

这里面有个payload 面板   完全看不懂啊

这里面q=空气净化器
最佳答案
2023-4-28 20:54:26
wp231957 发表于 2023-4-28 20:26
略改进:
就是把前面的产品 勾挑
https://www.philips.com.cn/c-w/search.html#q=空气净化器&sort=re ...

  1. import requests

  2. url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
  3. headers = {
  4.     'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
  5. }

  6. data1 = {'q': '空气净化器', 'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]'}
  7. num = requests.post(url, data=data1, headers=headers).json()['totalCount']

  8. data2={
  9.     'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]',
  10.     "q":"空气净化器",
  11.     'numberOfResults': num
  12. }


  13. resp = requests.post(url, data=data2, headers=headers)
  14. print(resp.text)
  15. results = resp.json()['results']
  16. for i in results:
  17.     print(i['uri'])

  18. print(f'一共有{num}个结果')
复制代码

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2023-4-28 20:00:51 | 显示全部楼层
  1. import requests

  2. url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
  3. headers = {
  4.     'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
  5. }
  6. num = requests.post(url, data={'q': '空气净化器'}, headers=headers).json()['totalCount']
  7. resp = requests.post(url, data={'q': '空气净化器', 'numberOfResults': num}, headers=headers)
  8. results = resp.json()['results']
  9. for i in results:
  10.     print(i['uri'])

  11. print(f'一共有{num}个结果')
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-28 20:21:15 | 显示全部楼层
本帖最后由 isdkz 于 2023-4-28 20:26 编辑

我觉得授人以鱼不如授人以渔,所以在这里给出过程,给你一些 chatgpt 工程师的参考

一、先在浏览器的开发者工具中搜索空气净化器的数据来自于哪个请求

00.png

二、然后将该http请求包的内容丢到 chatgpt 询问

01.png

02.png

03png.png

04.png

05.png

三、然后自己调测一下,就有了以下的代码:
  1. import requests

  2. url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
  3. headers = {
  4.     'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
  5. }
  6. num = requests.post(url, data={'q': '空气净化器'}, headers=headers).json()['totalCount']
  7. resp = requests.post(url, data={'q': '空气净化器', 'numberOfResults': num}, headers=headers)
  8. results = resp.json()['results']
  9. for i in results:
  10.     print(i['uri'])

  11. print(f'一共有{num}个结果')
复制代码

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-4-28 20:26:57 | 显示全部楼层
本帖最后由 wp231957 于 2023-4-28 20:49 编辑


略改进:
就是把前面的产品 勾挑
https://www.philips.com.cn/c-w/search.html#q=空气净化器&sort=relevancy&f:@commoncontenttypedict=[产品]

但是代码运行错误:
  1. import requests

  2. url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
  3. headers = {
  4.     'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
  5. }
  6. num = requests.post(url, data={'q': '空气净化器'}, headers=headers).json()['totalCount']

  7. data={
  8.    'facets':
  9.     {
  10.         "facetId":"@commoncontenttypedict",
  11.         "field":"commoncontenttypedict",
  12.         "type":"specific",
  13.         "injectionDepth":1000,
  14.         "filterFacetCount":'true',
  15.         "currentValues":[{"value":"产品","state":"selected"}],
  16.         "numberOfValues":8,
  17.         "freezeCurrentValues":'false',
  18.         "preventAutoSelect":'false',
  19.         "isFieldExpanded":'false'
  20.     },
  21.     "q":"空气净化器",
  22.     'numberOfResults': num
  23. }

  24. resp = requests.post(url, data=data, headers=headers)
  25. print(resp.json())
  26. results = resp.json()['results']
  27. for i in results:
  28.     print(i['uri'])

  29. print(f'一共有{num}个结果')



复制代码


小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-4-28 20:28:43 | 显示全部楼层
isdkz 发表于 2023-4-28 20:21
我觉得授人以鱼不如授人以渔,所以在这里给出过程,给你一些 chatgpt 工程师的参考 :

一、先 ...

谢了,我没有chatgpt
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-28 20:54:26 | 显示全部楼层    本楼为最佳答案   
wp231957 发表于 2023-4-28 20:26
略改进:
就是把前面的产品 勾挑
https://www.philips.com.cn/c-w/search.html#q=空气净化器&sort=re ...

  1. import requests

  2. url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
  3. headers = {
  4.     'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
  5. }

  6. data1 = {'q': '空气净化器', 'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]'}
  7. num = requests.post(url, data=data1, headers=headers).json()['totalCount']

  8. data2={
  9.     'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]',
  10.     "q":"空气净化器",
  11.     'numberOfResults': num
  12. }


  13. resp = requests.post(url, data=data2, headers=headers)
  14. print(resp.text)
  15. results = resp.json()['results']
  16. for i in results:
  17.     print(i['uri'])

  18. print(f'一共有{num}个结果')
复制代码

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-29 10:10:31 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-24 23:34

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表