Python访问路径有中文,Python交流,编程语言专区,鱼C论坛

rswc53 发表于 2022-10-18 10:59:26

Python访问路径有中文

h00ps://000.baidu.com.cn/task/search/list?pageable=true&selectColumns=id,priority,delay_status,code,name,creator_name,create_date,icd_code,plan_principal_name,solved_date,status,task_type&_search=true&nd=1666057677957&rows=100&page=1&sidx=status&sord=asc&notMenu=true&filters={"groupOp":"AND","rules":[{"field":"create_date","op":"gt","data":"2022-09-01","type":3},{"field":"solver_department_treenode","op":"cn","data":"/合作伙伴/D-IT合作伙伴/","type":000},{"field":"status","op":"in","data":"'已分配','处理中','重新分派','解决','已关闭'","type":10}]}

这个路径的后面中文怎么处理 "data":"'已分配','处理中','重新分派','解决','已关闭'"

Brick_Porter 发表于 2022-10-18 11:03:48

你是要从这个URL中提取这些值吗？

rswc53 发表于 2022-10-18 11:07:05

要从这个URL访问，然后爬数据下来

rswc53 发表于 2022-10-18 11:07:39

Brick_Porter 发表于 2022-10-18 11:03
你是要从这个URL中提取这些值吗？

要从这个URL访问，然后爬数据下来

suchocolate 发表于 2022-10-18 13:17:57

本帖最后由 suchocolate 于 2022-10-18 13:23 编辑

requests会自动将中文转成url编码，正常直接写中文就行
import requests

url = 'https://www.baidu.com/s?wd=天宫'
headers = {'user-agent': 'Mozialla'}
r = requests.get(url, headers=headers)
print(r.url)
print(r.status_code)
你的url里有单引号和双引号，写url的时候要注意转义一下。
url = 'https://www.baidu.com.cn/task/search/list?pageable=true&selectColumns=id,priority,' \
   'delay_status,code,name,creator_name,create_date,icd_code,plan_principal_name,solved_date,' \
   'status,task_type&_search=true&nd=1666057677957&rows=100&page=1&sidx=status&sord=asc&notMenu=true&' \
   'filters={"groupOp":"AND","rules":[{"field":"create_date","op":"gt","data":"2022-09-01","type":3},' \
   '{"field":"solver_department_treenode","op":"cn","data":"/合作伙伴/D-IT合作伙伴/","type":000},' \
   '{"field":"status","op":"in","data":"\'已分配\',\'处理中\',\'重新分派\',\'解决\',\'已关闭\'","type":10}]}'

不过你这个url是自己写的吗，还是从哪得到的，如果是从其他链接获取的，可以写一个自动解析的函数，把后面那一堆解析出数据，然后作为params带如下一次请求，就不用care编码什么的问题了。
你把代码发全，我们看看。

页: [1]

鱼C论坛's Archiver

Python访问路径有中文