鱼C论坛

 找回密码
 立即注册
查看: 2609|回复: 6

[已解决]自己爬不动了,寻求支持

[复制链接]
发表于 2023-4-28 18:51:05 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 wp231957 于 2023-4-28 18:52 编辑
https://www.philips.com.cn/c-w/search.html#q=%E7%A9%BA%E6%B0%94%E5%87%80%E5%8C%96%E5%99%A8&sort=relevancy

这里面有1314条记录   我想获取他们的二级链接

这里面有个payload 面板   完全看不懂啊

这里面q=空气净化器
最佳答案
2023-4-28 20:54:26
wp231957 发表于 2023-4-28 20:26
略改进:
就是把前面的产品 勾挑
https://www.philips.com.cn/c-w/search.html#q=空气净化器&sort=re ...

import requests

url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
headers = {
    'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
}

data1 = {'q': '空气净化器', 'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]'}
num = requests.post(url, data=data1, headers=headers).json()['totalCount']

data2={
    'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]',
    "q":"空气净化器",
    'numberOfResults': num
}


resp = requests.post(url, data=data2, headers=headers)
print(resp.text)
results = resp.json()['results']
for i in results:
    print(i['uri'])

print(f'一共有{num}个结果')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-4-28 20:00:51 | 显示全部楼层
import requests

url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
headers = {
    'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
}
num = requests.post(url, data={'q': '空气净化器'}, headers=headers).json()['totalCount']
resp = requests.post(url, data={'q': '空气净化器', 'numberOfResults': num}, headers=headers)
results = resp.json()['results']
for i in results:
    print(i['uri'])

print(f'一共有{num}个结果')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-28 20:21:15 | 显示全部楼层
本帖最后由 isdkz 于 2023-4-28 20:26 编辑

我觉得授人以鱼不如授人以渔,所以在这里给出过程,给你一些 chatgpt 工程师的参考

一、先在浏览器的开发者工具中搜索空气净化器的数据来自于哪个请求

00.png

二、然后将该http请求包的内容丢到 chatgpt 询问

01.png

02.png

03png.png

04.png

05.png

三、然后自己调测一下,就有了以下的代码:
import requests

url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
headers = {
    'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
}
num = requests.post(url, data={'q': '空气净化器'}, headers=headers).json()['totalCount']
resp = requests.post(url, data={'q': '空气净化器', 'numberOfResults': num}, headers=headers)
results = resp.json()['results']
for i in results:
    print(i['uri'])

print(f'一共有{num}个结果')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-4-28 20:26:57 | 显示全部楼层
本帖最后由 wp231957 于 2023-4-28 20:49 编辑


略改进:
就是把前面的产品 勾挑
https://www.philips.com.cn/c-w/search.html#q=空气净化器&sort=relevancy&f:@commoncontenttypedict=[产品]

但是代码运行错误:
import requests

url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
headers = {
    'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
}
num = requests.post(url, data={'q': '空气净化器'}, headers=headers).json()['totalCount']

data={
   'facets': 
    {
        "facetId":"@commoncontenttypedict",
        "field":"commoncontenttypedict",
        "type":"specific",
        "injectionDepth":1000,
        "filterFacetCount":'true',
        "currentValues":[{"value":"产品","state":"selected"}],
        "numberOfValues":8,
        "freezeCurrentValues":'false',
        "preventAutoSelect":'false',
        "isFieldExpanded":'false'
    },
    "q":"空气净化器",
    'numberOfResults': num
}

resp = requests.post(url, data=data, headers=headers)
print(resp.json())
results = resp.json()['results']
for i in results:
    print(i['uri'])

print(f'一共有{num}个结果')

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-4-28 20:28:43 | 显示全部楼层
isdkz 发表于 2023-4-28 20:21
我觉得授人以鱼不如授人以渔,所以在这里给出过程,给你一些 chatgpt 工程师的参考 :

一、先 ...

谢了,我没有chatgpt
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-28 20:54:26 | 显示全部楼层    本楼为最佳答案   
wp231957 发表于 2023-4-28 20:26
略改进:
就是把前面的产品 勾挑
https://www.philips.com.cn/c-w/search.html#q=空气净化器&sort=re ...

import requests

url = 'https://koninklijkephilipsnvproduction2k8xfrmr.org.coveo.com/rest/search/v2'
headers = {
    'Authorization': 'Bearer xx0d641857-e140-4e94-af32-ea8fe1063ce8'
}

data1 = {'q': '空气净化器', 'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]'}
num = requests.post(url, data=data1, headers=headers).json()['totalCount']

data2={
    'facets': '[{"field":"commoncontenttypedict", "currentValues":[{"value":"产品","state":"selected"}]}]',
    "q":"空气净化器",
    'numberOfResults': num
}


resp = requests.post(url, data=data2, headers=headers)
print(resp.text)
results = resp.json()['results']
for i in results:
    print(i['uri'])

print(f'一共有{num}个结果')
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-4-29 10:10:31 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-28 17:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表