万千只cnm 发表于 2020-12-17 10:09:34

测字符串个数(中文字符

小甲鱼课后作业:
用fgets函数输入字符,测字符个数个数

请问:
target += 2;
什么意思呀,不是指向下两个字符吧;
而且我用Xcode复制代码运行的结果也不对{:5_104:}



答案代码:
#include <stdio.h>

#define MAX 1024

int main()
{
      char str;
      char *target = str;
      char ch;
      int length = 0;

      printf("请输入一个字符串:");
      fgets(str, MAX, stdin);

      while (1)
      {
                ch = *target++;
                if (ch == '\0')
                {
                        break;
                }
                if ((int)ch < 0)
                {
                        target += 2;
                }
                length++;
      }

      printf("您总共输入了 %d 个字符!\n", length - 1);

      return 0;
}

chxchxkkk 发表于 2020-12-17 10:29:54

因为中文字符占两个字节,所以+=2

jackz007 发表于 2020-12-17 10:48:34

本帖最后由 jackz007 于 2020-12-17 11:48 编辑

      在 Linux 系统下,中文字符采用 UTF-8 编码,每个中文字符占用 3 个字节,这一点与 Windows 不同,Windows 采用 GBK 编码,一个中文字符占用 2 个字节。
      在本例中,当 ch < 0 是指字符编码值大于 0x7f (127),对于 char 型的变量而言,就会成为负值,采用 utf-8 编码的汉字的 3 个字节都是负值。本例代码便是根据这个特点来区分中英、文字符,从而完成统计的。

   例如:"中国",GBK 编码为 D6 D0 B9 FA 一共占用了 4 个字节;UTF-8 编码为 E4 B8 AD E5 9B BD 总共占用了 6 个字节,而且,它们的共同特点是,几乎每个字节的编码都超过 7F(127),对于 signed char 来说,就是负值。

风过无痕1989 发表于 2020-12-17 11:21:25

我输入“我要自己编程序”,运行结果也只“您总共输入了 4 个字符”
这可能是我们的编译器采用的字符集的原因,VC++ 6.0 默认为窄字节编码,vs2005、vs2008、vs2010、vs2012、vs2013、vs2015、vs2017 等默认都是Unicode编码,当然可以进行工程的设置从而进行编码的转换,从vs2013开始,如果要让工程从默认的Unicode编码转到窄字节编码,需要安装vs2013的多字节补丁才行!

jackz007 发表于 2020-12-17 11:38:56

风过无痕1989 发表于 2020-12-17 11:21
我输入“我要自己编程序”,运行结果也只“您总共输入了 4 个字符”
这可能是我们的编译器采用的字符集的 ...

      字符编码属于系统底层 I/O,和操作系统架构相关,与软件无关。

风过无痕1989 发表于 2020-12-17 12:08:46

jackz007 发表于 2020-12-17 11:38
字符编码属于系统底层 I/O,和操作系统架构相关,与软件无关。

字符编码属于系统底层 I/O,但我们可以选择所使用的字符集
页: [1]
查看完整版本: 测字符串个数(中文字符