鱼C论坛

 找回密码
 立即注册
查看: 4951|回复: 4

[已解决]为什么我用.isalpha()检查全是中文的字符串,结果是true?

[复制链接]
发表于 2018-2-18 01:05:21 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
为什么我用.isalpha()检查全是中文的字符串,结果是true?
最佳答案
2018-2-18 11:41:49
我试了下,还真是
以前都不知道啊
然后我查了文档
  1. str.isalpha()
  2. Return true if all characters in the string are alphabetic and there is at least one character, false otherwise. Alphabetic characters are those characters defined in the Unicode character database as “Letter”, i.e., those with general category property being one of “Lm”, “Lt”, “Lu”, “Ll”, or “Lo”. Note that this is different from the “Alphabetic” property defined in the Unicode Standard.
复制代码

说是isalpha在Unicode字符串是基于"Letter"定义的字符,不是标准意义上的纯字母
还有另外一个文档
  1. bytes.isalpha()
  2. bytearray.isalpha()
  3. Return true if all bytes in the sequence are alphabetic ASCII characters and the sequence is not empty, false otherwise. Alphabetic ASCII characters are those byte values in the sequence b'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
复制代码

二进制字符串中的isalpha方法似乎就是基于ASCII码纯字母的判断
所以建议用b字符串的isalpha 方法,比如
  1. "中文显示".encode('utf-8').isalpha()
复制代码


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-2-18 11:41:49 | 显示全部楼层    本楼为最佳答案   
我试了下,还真是
以前都不知道啊
然后我查了文档
  1. str.isalpha()
  2. Return true if all characters in the string are alphabetic and there is at least one character, false otherwise. Alphabetic characters are those characters defined in the Unicode character database as “Letter”, i.e., those with general category property being one of “Lm”, “Lt”, “Lu”, “Ll”, or “Lo”. Note that this is different from the “Alphabetic” property defined in the Unicode Standard.
复制代码

说是isalpha在Unicode字符串是基于"Letter"定义的字符,不是标准意义上的纯字母
还有另外一个文档
  1. bytes.isalpha()
  2. bytearray.isalpha()
  3. Return true if all bytes in the sequence are alphabetic ASCII characters and the sequence is not empty, false otherwise. Alphabetic ASCII characters are those byte values in the sequence b'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
复制代码

二进制字符串中的isalpha方法似乎就是基于ASCII码纯字母的判断
所以建议用b字符串的isalpha 方法,比如
  1. "中文显示".encode('utf-8').isalpha()
复制代码


想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-2-18 13:15:05 | 显示全部楼层
solomonxian 发表于 2018-2-18 11:41
我试了下,还真是
以前都不知道啊
然后我查了文档

我是小白,有点不懂你最后一句话
请问什么是b字符串的isalpha
还有中文是为什么能用ASCⅡ码判断啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-2-18 16:46:35 | 显示全部楼层
哈n0 发表于 2018-2-18 13:15
我是小白,有点不懂你最后一句话
请问什么是b字符串的isalpha
还有中文是为什么能用ASCⅡ码判断啊


我用的python3.5
字符串主要分为 str 和 bytes,(还有个bytearray是bytes的可变类型,暂时不太需要了解)
通过encode 和 decode 转换

上面的名词有不明白的,那你需要百度
str 和 bytes 这两个类都有isalpha()方法,我上面贴的文档就是这回事
并不是ASCII码能判断中文,
是用encode对中文编码,这样识别出来不是纯字母
你可以仔细看看文档的内容
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-2-19 20:35:58 | 显示全部楼层
solomonxian 发表于 2018-2-18 16:46
我用的python3.5
字符串主要分为 str 和 bytes,(还有个bytearray是bytes的可变类型,暂时不太需要了 ...

谢谢大佬
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-28 14:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表