|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 不二如是 于 2022-8-23 10:26 编辑
视频中涉及到的名词解释见下:
Unicode,统一码联盟官方中文名称为统一码,是计算机科学领域的业界标准。
它整理、编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字。
ASCII(发音: /ˈæski/ ASS-kee[1],American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统。
字位(英语:grapheme)又称形素、字素,是最小的有意义书写符号单位;
此术语是由语音学里的“音位”(音素)类推到文字学的。
在拼音文字系统当中,“字位”是最小且数量最少的区别性单位,也是一个抽象单位。
例如:字位<a>,无论任何字体的字形是A,a,或是ɑ,都属于同一个字位,它们的意义都相同(同位异形)。
在象形文字系统当中,“字位”就是最小且有意义的区别性单位,中文即将同一个字的不同写法(正体字、简体字、二简字、异体字、新字形、旧字形、讹字、缺笔字等)计算为同一个字位,而不是分别计算为不同的字位。
代码点(Code Point):Unicode是属于编码字符集(CCS)的范围。 Unicode所做的事情就是将我们需要表示的字符表中的每个字符映射成一个数字,这个数字被称为相应字符的码点(code point)。
比特是英文 binary digit的缩写。比特是表示信息的最小单位,是二进制数的一位包含的信息或2个选项中特别指定1个的需要信息量。
一般来说,n比特的信息量可以表现出2的n次方种选择。
字节(Byte)是计算机信息技术用于计量存储容量的一种计量单位,也表示一些计算机编程语言中的数据类型和语言字符。
一个字节存储8位无符号数,储存的数值范围为0-255。
|
|