不二如是 发表于 2022-8-23 10:19:55

Unicode 这么简单

本帖最后由 不二如是 于 2022-8-23 10:26 编辑



视频中涉及到的名词解释见下:

https://www.bilibili.com/video/BV1kD4y1z7ft

Unicode,统一码联盟官方中文名称为统一码,是计算机科学领域的业界标准。

它整理、编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字。


ASCII(发音: /ˈæski/ ASS-kee,American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。


字位(英语:grapheme)又称形素、字素,是最小的有意义书写符号单位;

此术语是由语音学里的“音位”(音素)类推到文字学的。

在拼音文字系统当中,“字位”是最小且数量最少的区别性单位,也是一个抽象单位。

例如:字位<a>,无论任何字体的字形是A,a,或是ɑ,都属于同一个字位,它们的意义都相同(同位异形)。

在象形文字系统当中,“字位”就是最小且有意义的区别性单位,中文即将同一个字的不同写法(正体字、简体字、二简字、异体字、新字形、旧字形、讹字、缺笔字等)计算为同一个字位,而不是分别计算为不同的字位。


代码点(Code Point):Unicode是属于编码字符集(CCS)的范围。 Unicode所做的事情就是将我们需要表示的字符表中的每个字符映射成一个数字,这个数字被称为相应字符的码点(code point)。


比特是英文 binary digit的缩写。比特是表示信息的最小单位,是二进制数的一位包含的信息或2个选项中特别指定1个的需要信息量。

一般来说,n比特的信息量可以表现出2的n次方种选择。


字节(Byte)是计算机信息技术用于计量存储容量的一种计量单位,也表示一些计算机编程语言中的数据类型和语言字符。

一个字节存储8位无符号数,储存的数值范围为0-255。




xxm8023 发表于 2022-8-23 12:06:54

原来如此,学废了

嘉岳呀 发表于 2022-8-23 12:45:42

原来如此,学废了

@不二如是 https://fishc.com.cn/thread-202936-1-1.html 能申精吗?

不二如是 发表于 2022-8-23 13:22:19

嘉岳呀 发表于 2022-8-23 12:45
原来如此,学废了

@不二如是 https://fishc.com.cn/thread-202936-1-1.html 能申精吗?

安排

嘉岳呀 发表于 2022-8-23 15:24:09

不二如是 发表于 2022-8-23 13:22
安排

谢谢~~~{:10_281:}{:10_281:}{:10_281:}

Jason茗 发表于 2022-8-28 22:36:23

原来如此,学废了

lxping 发表于 2022-11-12 11:37:07

原来如此,学废了

hellometa 发表于 2022-11-15 20:31:40

原来如此,学废了
页: [1]
查看完整版本: Unicode 这么简单