|
发表于 2023-4-14 21:03:27
|
显示全部楼层
当我们在网址中输入中文字符时,浏览器会将这些字符进行编码,即将其转换成符合 URL 规范的字符,比如 %E9%B1%BCC 就是 鱼C 的 URL 编码。URL 编码的目的是为了保证在因某种原因而需要特殊处理的情况下,这些字符能够被正确地传递和解析。
下面是一张常见字符的 URL 编码表:
字符 ASCII 码 URL 编码
空格 32 %20
! 33 %21
" 34 %22
# 35 %23
$ 36 %24
% 37 %25
& 38 %26
' 39 %27
( 40 %28
) 41 %29
* 42 %2A
+ 43 %2B
, 44 %2C
- 45 %2D
. 46 %2E
/ 47 %2F
: 58 %3A
; 59 %3B
< 60 %3C
= 61 %3D
> 62 %3E
? 63 %3F
@ 64 %40
[ 91 %5B
\ 92 %5C
] 93 %5D
^ 94 %5E
_ 95 %5F
` 96 %60
{ 123 %7B
| 124 %7C
} 125 %7D
~ 126 %7E
URL 编码表中,可以看到将常见的符号都映射成了一些特殊的字符序列,在 URL 中使用这些特殊的字符序列代替原始的字符,就可以避免一些转义问题。对于中文等非 ASCII 字符,则会将其转换成 %xx 类似的形式进行表示。
- from urllib.parse import quote
- s = "你好,世界!"
- urlencode = quote(s)
- print(urlencode) # %E4%BD%A0%E5%A5%BD%EF%BC%8C%E4%B8%96%E7%95%8C%EF%BC%81
复制代码 |
|