关于数字
请问大佬能给我详细解释下unicode数字byte数字全角数字吗,去百度查了,没看明白。 本帖最后由 傻眼貓咪 于 2021-11-20 20:29 编辑Unicode
从历史演变而来,最初时,只有 ASCII 电报编码(共 128 个字符,7 位,其中包含英文大小写字母、数字、键盘上的基本标点符号和空字符等等)发布于 1963 年,随着时间,字符越来越多,128 个字符收录不够,所以出现了 EASCII(ASCII 的扩充版本,共 8 位 256 个字符)。但是世界各地电脑编码的进步,开始出现一个问题,那就是 256 个字符位扣除已用的剩下不多,根本不能将全中文字纳入其中(中文字符接近十万,大概 85000++ 个),更不用说世界所有符号纳入其中,所以就有了 Unicode 统一编码,也叫通用字元集 (UCS),截至 2021 年 9 月所收录字符已经达到 14 万之多(ASCII、EASCII、UTF-8、UTF-16、GB18030、还有很多很多都统一包含在内)
Byte 位元组
1 Byte = 8 bits(位元)
通常用作电脑资讯计量单位,不分资料型态
ASCII 字符:1 个字符 1 位元组(1 Byte),比如字符:"K" 位元组是 1001011(十进制:75),1001011 中的 1 和 0 表示位元 bit
全角字符 Full-width characters 和 半角字符Half-width characters
如上:ASCII 就是半角字符(1 个字符仅用 1 个位元组,共 8 元组,256 个字符)而 Unicode 为了能够储存世界各地字符,其中包含半角字符和全角字符(宽字符),中文字符就是全角字符(毕竟比英文字母笔画要多很多,电脑需要用到 2 个位元组存入)。一般电脑默认是半角,当读取中文字符时,所有字符都是一半一半分开读,所以变成乱码
不要将那莫复杂。
unicode是一个编码,就是规定什么数字对应什么字。
页:
[1]