|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
- #include <stdio.h>
- #define MAX 1024
- int main()
- {
- char str[MAX];
- char *target = str;
- char ch;
- int length = 0;
- printf("请输入一个字符串:");
- fgets(str, MAX, stdin);
- while (1)
- {
- ch = *target++;
- if (ch == '\0')
- {
- break;
- }
- if ((int)ch < 0)
- {
- target += 2;
- }
- length++;
- }
- printf("您总共输入了 %d 个字符!\n", length - 1);
- return 0;
- }
复制代码
上面的代码,如果输入的是四个汉子+三个字母,返回的是3
/*
请输入一个字符串:哈哈哈哈ddf
您总共输入了 3 个字符!
*/
请问这是怎么回事?
这段代码的作用是统计输入字符串的长度,但是在处理含有中文字符的字符串时会出现问题。
问题出在这行代码上:
if ((int)ch < 0)
这段代码的意思是判断字符ch是否是中文字符,因为中文字符的ASCII码是负数。然而,这种判断方式是错误的。
在C语言中,字符类型char是有符号类型,取值范围是-128到127。而中文字符的编码通常是使用多个字节表示的,所以在字符类型中,一个中文字符会被拆分成多个字节表示,其中的每个字节都是有符号的。
因此,当我们将一个中文字符赋值给字符类型变量ch时,ch的值会被解释成负数。但是,当我们将ch的值转换为整数类型(int)时,它会被解释为正数。这导致了if语句判断错误,导致统计字符长度的逻辑出现问题。
为了正确统计字符长度,我们可以使用宽字符类型wchar_t来表示字符,并使用宽字符输入输出函数wprintf和wscanf来处理中文字符。下面是修改后的代码:
#include <stdio.h>
#include <wchar.h>
#define MAX 1024
int main()
{
wchar_t str[MAX];
wchar_t *target = str;
wchar_t ch;
int length = 0;
wprintf(L"请输入一个字符串:");
fgetws(str, MAX, stdin);
while (1)
{
ch = *target++;
if (ch == L'\0')
{
break;
}
if ((int)ch < 0)
{
target += 2;
}
length++;
}
wprintf(L"您总共输入了 %d 个字符!\n", length - 1);
return 0;
}
这样修改后的代码可以正确统计包含中文字符的字符串的长度。
|
|