测字符串个数(中文字符
小甲鱼课后作业:用fgets函数输入字符,测字符个数个数
请问:
target += 2;
什么意思呀,不是指向下两个字符吧;
而且我用Xcode复制代码运行的结果也不对{:5_104:}
答案代码:
#include <stdio.h>
#define MAX 1024
int main()
{
char str;
char *target = str;
char ch;
int length = 0;
printf("请输入一个字符串:");
fgets(str, MAX, stdin);
while (1)
{
ch = *target++;
if (ch == '\0')
{
break;
}
if ((int)ch < 0)
{
target += 2;
}
length++;
}
printf("您总共输入了 %d 个字符!\n", length - 1);
return 0;
} 因为中文字符占两个字节,所以+=2 本帖最后由 jackz007 于 2020-12-17 11:48 编辑
在 Linux 系统下,中文字符采用 UTF-8 编码,每个中文字符占用 3 个字节,这一点与 Windows 不同,Windows 采用 GBK 编码,一个中文字符占用 2 个字节。
在本例中,当 ch < 0 是指字符编码值大于 0x7f (127),对于 char 型的变量而言,就会成为负值,采用 utf-8 编码的汉字的 3 个字节都是负值。本例代码便是根据这个特点来区分中英、文字符,从而完成统计的。
例如:"中国",GBK 编码为 D6 D0 B9 FA 一共占用了 4 个字节;UTF-8 编码为 E4 B8 AD E5 9B BD 总共占用了 6 个字节,而且,它们的共同特点是,几乎每个字节的编码都超过 7F(127),对于 signed char 来说,就是负值。 我输入“我要自己编程序”,运行结果也只“您总共输入了 4 个字符”
这可能是我们的编译器采用的字符集的原因,VC++ 6.0 默认为窄字节编码,vs2005、vs2008、vs2010、vs2012、vs2013、vs2015、vs2017 等默认都是Unicode编码,当然可以进行工程的设置从而进行编码的转换,从vs2013开始,如果要让工程从默认的Unicode编码转到窄字节编码,需要安装vs2013的多字节补丁才行!
风过无痕1989 发表于 2020-12-17 11:21
我输入“我要自己编程序”,运行结果也只“您总共输入了 4 个字符”
这可能是我们的编译器采用的字符集的 ...
字符编码属于系统底层 I/O,和操作系统架构相关,与软件无关。 jackz007 发表于 2020-12-17 11:38
字符编码属于系统底层 I/O,和操作系统架构相关,与软件无关。
字符编码属于系统底层 I/O,但我们可以选择所使用的字符集
页:
[1]