Python访问路径有中文
h00ps://000.baidu.com.cn/task/search/list?pageable=true&selectColumns=id,priority,delay_status,code,name,creator_name,create_date,icd_code,plan_principal_name,solved_date,status,task_type&_search=true&nd=1666057677957&rows=100&page=1&sidx=status&sord=asc¬Menu=true&filters={"groupOp":"AND","rules":[{"field":"create_date","op":"gt","data":"2022-09-01","type":3},{"field":"solver_department_treenode","op":"cn","data":"/合作伙伴/D-IT合作伙伴/","type":000},{"field":"status","op":"in","data":"'已分配','处理中','重新分派','解决','已关闭'","type":10}]}这个路径的后面 中文怎么处理 "data":"'已分配','处理中','重新分派','解决','已关闭'" 你是要从这个URL中提取这些值吗? 要从这个URL访问,然后爬数据下来 Brick_Porter 发表于 2022-10-18 11:03
你是要从这个URL中提取这些值吗?
要从这个URL访问,然后爬数据下来 本帖最后由 suchocolate 于 2022-10-18 13:23 编辑
requests会自动将中文转成url编码,正常直接写中文就行
import requests
url = 'https://www.baidu.com/s?wd=天宫'
headers = {'user-agent': 'Mozialla'}
r = requests.get(url, headers=headers)
print(r.url)
print(r.status_code)
你的url里有单引号和双引号,写url的时候要注意转义一下。
url = 'https://www.baidu.com.cn/task/search/list?pageable=true&selectColumns=id,priority,' \
'delay_status,code,name,creator_name,create_date,icd_code,plan_principal_name,solved_date,' \
'status,task_type&_search=true&nd=1666057677957&rows=100&page=1&sidx=status&sord=asc¬Menu=true&' \
'filters={"groupOp":"AND","rules":[{"field":"create_date","op":"gt","data":"2022-09-01","type":3},' \
'{"field":"solver_department_treenode","op":"cn","data":"/合作伙伴/D-IT合作伙伴/","type":000},' \
'{"field":"status","op":"in","data":"\'已分配\',\'处理中\',\'重新分派\',\'解决\',\'已关闭\'","type":10}]}'
不过你这个url是自己写的吗,还是从哪得到的,如果是从其他链接获取的,可以写一个自动解析的函数,把后面那一堆解析出数据,然后作为params带如下一次请求,就不用care编码什么的问题了。
你把代码发全,我们看看。
页:
[1]