鱼C论坛

 找回密码
 立即注册
查看: 736|回复: 4

[已解决]指针移动字节

[复制链接]
发表于 2021-12-6 12:12:21 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 小亦003 于 2021-12-6 12:12 编辑

下面代码中的解释中为什么是中文字符时指针要向后移动两个字节???
  1. #include <stdio.h>

  2. int main()
  3. {
  4.         char str[] = "中";
  5.         int length, i;

  6.         length = sizeof(str) / sizeof(str[0]);

  7.         printf("length of str: %d\n", length);

  8.         for (i = 0; i < length; i++)
  9.         {
  10.                 printf("str[%d] = %d\n", i, str[i]);
  11.         }

  12.         return 0;
  13. }
复制代码
最佳答案
2021-12-6 12:57:26
本帖最后由 jackz007 于 2021-12-6 13:02 编辑
  1.                 ch = * target ++    ; // 赋值的时候 target = target + 1
  2. . . . . . .
  3.                 if ((int)ch < 0)
  4.                 {
  5.                         target += 2 ; // 当 ch 属于汉字字符时,target = target + 2
复制代码

        所以,当 ch 属于中文字符时,target 指针总共前进的是 3 个字节,而 ch 是英文字符时,target 指针只前进 1 个字节。

        这个代码只适合在 Linux 系统下,因为 Linux 系统采用 'UTF-8' 编码,每个汉字占用了 3 个字节,如果是在 Windows 下,中文版 Windows 采用的是 'GB2312' 编码,每个汉字占用的是 2 个字节,在 Windows 下你的代码必须修改
  1.                 if ((int)ch < 0)
  2.                 {
  3.                         target ++ ;  // 这里要修改
  4.                 }
复制代码

        否则,统计出来的结果肯定是错误的。
IMG_20211206_113012.jpg
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-12-6 12:12:22 | 显示全部楼层
#include <stdio.h>

#define MAX 1024

int main()
{
        char str[MAX];
        char *target = str;
        char ch;
        int length = 0;

        printf("请输入一个字符串:");
        fgets(str, MAX, stdin);

        while (1)
        {
                ch = *target++;
                if (ch == '\0')
                {
                        break;
                }
                if ((int)ch < 0)
                {
                        target += 2;
                }
                length++;
        }

        printf("您总共输入了 %d 个字符!\n", length - 1);

        return 0;
}
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-12-6 12:12:23 | 显示全部楼层
本帖最后由 小亦003 于 2021-12-6 12:02 编辑

为什么是移动2个字节?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-12-6 12:57:26 | 显示全部楼层    本楼为最佳答案   
本帖最后由 jackz007 于 2021-12-6 13:02 编辑
  1.                 ch = * target ++    ; // 赋值的时候 target = target + 1
  2. . . . . . .
  3.                 if ((int)ch < 0)
  4.                 {
  5.                         target += 2 ; // 当 ch 属于汉字字符时,target = target + 2
复制代码

        所以,当 ch 属于中文字符时,target 指针总共前进的是 3 个字节,而 ch 是英文字符时,target 指针只前进 1 个字节。

        这个代码只适合在 Linux 系统下,因为 Linux 系统采用 'UTF-8' 编码,每个汉字占用了 3 个字节,如果是在 Windows 下,中文版 Windows 采用的是 'GB2312' 编码,每个汉字占用的是 2 个字节,在 Windows 下你的代码必须修改
  1.                 if ((int)ch < 0)
  2.                 {
  3.                         target ++ ;  // 这里要修改
  4.                 }
复制代码

        否则,统计出来的结果肯定是错误的。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-12-6 14:33:20 | 显示全部楼层
jackz007 发表于 2021-12-6 12:57
所以,当 ch 属于中文字符时,target 指针总共前进的是 3 个字节,而 ch 是英文字符时,target  ...

感谢大佬
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-25 12:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表