想入门的新人 发表于 2023-7-24 20:48:31

关于opendir、readdir读取不了中文目录问题

问题如标题,网上说可以通过改编码格式改为UTF-8但是也没用,然后把电脑编码格式改为utf-8也不行,改为宽字符能读取数字和字母。中文还是读不出来


目的:通过该函数读取一个目录下的文件夹并将目录下的文件夹的名称保存到一个数组中便于后期输入查看。
                网上查到似乎只有这两函数(opendir、readdir、closedir)可以实现读取文件夹的信息。



再次向各位网友求助,感谢感谢!
不管信息是否能彻底解决都感谢各位的建议和帮助。

设备:window笔记本
软件:VS2019

学习编程中的Ben 发表于 2023-7-24 20:48:52

在使用 opendir 和 readdir 函数读取中文目录时,可能会出现乱码的问题。这是因为 readdir 函数返回的文件名是以ASCII编码表示的,而中文字符在ASCII编码范围之外,导致无法正确显示中文目录。

解决这个问题的一种方法是使用操作系统相关的API来实现文件夹的遍历。在Windows系统下,可以使用 FindFirstFileW 和 FindNextFileW 函数来读取中文目录。

下面是一个使用Windows API来读取中文目录并保存到数组的示例代码:
#include <iostream>
#include <vector>
#include <windows.h>

using namespace std;

// 读取中文目录
void readChineseDirectory(const wstring& dirPath, vector<wstring>& directories) {
    WIN32_FIND_DATAW findData;
    HANDLE hFind = FindFirstFileW((dirPath + L"/*").c_str(), &findData);
    if (hFind != INVALID_HANDLE_VALUE) {
      do {
            if (findData.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY) {
                // 排除"."和".."目录
                if (wcscmp(findData.cFileName, L".") != 0 && wcscmp(findData.cFileName, L"..") != 0) {
                  directories.push_back(findData.cFileName);// 将目录名称保存到数组
                }
            }
      } while (FindNextFileW(hFind, &findData));
      FindClose(hFind);
    }
}

int main() {
    wstring dirPath = L"路径";// 填写待读取的目录路径,请使用宽字符字符串
    vector<wstring> directories;

    readChineseDirectory(dirPath, directories);

    // 输出目录名称
    for (const auto& directory : directories) {
      wcout << directory << endl;
    }

    return 0;
}

需要注意的是,上述示例代码中的路径字符串使用了宽字符字符串( wstring 类型),这是因为Windows API需要以宽字符字符串的形式接受路径参数。

希望这可以解决你遇到的问题。如果还有其他疑问,请随时提问。求给个最佳答案,非常感谢{:10_254:}
只要点击我的回复贴写着发表时间的那一栏的绿色按钮即可,点了奖赏2鱼币,最好请你出售附件(不过也支持评分)-->https://i.imgtg.com/2023/07/24/Oh0mQB.png

此回答源于ChatGPT,若有不正确之处,请多包容

陶远航 发表于 2023-7-24 20:48:53

你遇到的问题是关于在 Windows 环境下使用 opendir 和 readdir 函数读取中文目录名时出现乱码或无法读取的情况。这可能是因为在 Windows 默认的文件系统编码是 CP936(GBK),而不是 UTF-8。

要解决这个问题,可以使用 Windows API 提供的宽字符版本的目录操作函数来实现读取中文目录名。以下是一个示例代码:

#include <iostream>
#include <windows.h>

int main() {
    const char* path = "目录路径";
    WCHAR wpath;
    MultiByteToWideChar(CP_UTF8, 0, path, -1, wpath, MAX_PATH);

    WIN32_FIND_DATAW findData;
    HANDLE hFind = FindFirstFileW(wpath, &findData);

    if (hFind == INVALID_HANDLE_VALUE) {
      std::cout << "无法打开目录" << std::endl;
      return 1;
    }

    do {
      if (wcscmp(findData.cFileName, L".") != 0 && wcscmp(findData.cFileName, L"..") != 0) {
            // 在这里可以将目录名保存到数组或进行其他处理
            // 例如:std::wcout << findData.cFileName << std::endl;
      }
    } while (FindNextFileW(hFind, &findData));

    FindClose(hFind);

    return 0;
}


这段代码使用了 Windows API 中的宽字符版本的函数 FindFirstFileW 和 FindNextFileW 来读取目录下的文件夹信息。首先,将路径从 UTF-8 编码转换为宽字符编码(WCHAR),然后使用 FindFirstFileW 函数打开目录并获取第一个文件夹的信息。接着,在一个 do-while 循环中,通过 FindNextFileW 函数遍历目录下的所有文件夹(排除 "." 和 "..")。你可以根据需要,将目录名保存到数组或进行其他处理。

希望这个回答对你有帮助。如有更多问题,请随时提问。
如果问题已经解决,请设置最佳答案

isdkz 发表于 2023-7-24 20:49:10

答案:

如果您在Windows上用C++使用opendir和readdir处理含有非ASCII字符(如中文)的路径和文件名,可能会遇到问题,因为Windows API主要使用宽字符编码(如UTF-16)来处理文件名,而不是UTF-8。

解决这个问题,您可以尝试用"_wopendir"和"_wreaddir"代替"opendir"和"readdir"。这些函数使用宽字符(wchar_t)而不是单字节字符,对于Windows上的中文路径和文件名更为适用。首先您需要将UTF-8编码的字符串转换为UTF-16编码,然后再传递给这些函数。

下面是一段示例代码:

#include <locale>
#include <codecvt>
#include <dirent.h>
#include <iostream>

std::string convertToUtf8(const std::wstring& wstr)
{
    std::wstring_convert<std::codecvt_utf8<wchar_t>> myconv;
    return myconv.to_bytes(wstr);
}

int main()
{
    std::string pathUtf8 = "您的中文路径";
    std::wstring_convert<std::codecvt_utf8_utf16<wchar_t>> converter;
    std::wstring pathWstr = converter.from_bytes(pathUtf8);

    _WDIR* dir = _wopendir(pathWstr.c_str());

    if (dir) {
      struct _wdirent* ent;
      while ((ent = _wreaddir(dir)) != NULL) {
            std::cout << convertToUtf8(ent->d_name) << std::endl;
      }
      _wclosedir(dir);
    }
    else {
      std::cout << "Error opening directory" << std::endl;
    }

    return 0;
}

在这段代码中,我们首先定义了一个将宽字符串转换为UTF-8编码字符串的函数convertToUtf8。然后在主函数中,我们将UTF-8编码的路径字符串转换为宽字符串,然后将其传递给"_wopendir"函数打开目录。在目录打开之后,我们可以使用"_wreaddir"来读取目录中的文件,并使用convertToUtf8函数将文件名转换为UTF-8编码,然后打印出来。

当然,您需要注意这个解决方案是针对Windows的,如果您在其他平台(如Linux,macOS等)上编程,可能需要考虑其他解决方案,例如使用boost::filesystem库,它提供了跨平台的文件和目录操作函数。

想入门的新人 发表于 2023-7-24 20:49:51

ANSI编码格式也不行。
可能没有及时回复,还请见谅。{:5_92:}

Mike_python小 发表于 2023-7-24 20:53:30

想入门的新人 发表于 2023-7-24 17:49
ANSI编码格式也不行。
可能没有及时回复,还请见谅。

通过使用opendir、readdir和closedir函数,可以读取目录下的文件夹名称并保存到数组中。下面是一个示例代码,你可以尝试在VS2019中运行它:


#include <iostream>
#include <string>
#include <vector>
#include <dirent.h>

int main() {
    std::string folderPath = "目录路径"; // 替换为你要读取的目录路径

    std::vector<std::string> folderNames;

    DIR* dir;
    struct dirent* entry;

    // 打开目录
    dir = opendir(folderPath.c_str());
    if (dir != NULL) {
      // 读取目录中的文件和文件夹
      while ((entry = readdir(dir)) != NULL) {
            // 排除当前目录和上级目录
            if (std::string(entry->d_name) == "." || std::string(entry->d_name) == "..") {
                continue;
            }

            // 判断是否是文件夹
            if (entry->d_type == DT_DIR) {
                folderNames.push_back(entry->d_name);
            }
      }

      closedir(dir);
    } else {
      std::cout << "无法打开目录!" << std::endl;
      return 1;
    }

    // 输出文件夹名称
    for (const auto& folderName : folderNames) {
      std::cout << folderName << std::endl;
    }

    return 0;
}


请将`目录路径`替换为你要读取的目录的实际路径。运行该代码后,文件夹名称将保存在`folderNames`数组中并进行输出。希望这可以帮助到你!如果还有其他问题,请随时提问。

想入门的新人 发表于 2023-7-24 21:03:58

学习编程中的Ben 发表于 2023-7-24 20:48
在使用 opendir 和 readdir 函数读取中文目录时,可能会出现乱码的问题。这是因为 readdir 函数返回的文件 ...

使用的是宽字符,那需要把vs的编码格式调为多字节字符集是吧,由于太久没接触这方面有点忘记了,还请指教,谢谢

学习编程中的Ben 发表于 2023-7-24 21:05:41

想入门的新人 发表于 2023-7-24 21:03
使用的是宽字符,那需要把vs的编码格式调为多字节字符集是吧,由于太久没接触这方面有点忘记了,还请指教 ...

回复你的代码我还没检查,不过我先回答你这个问题吧
对于使用宽字符的情况,确实需要将编码格式调整为多字节字符集(Multi-Byte Character Set,简称MBCS)。在Visual Studio中进行设置的步骤如下:

1. 打开 Visual Studio。
2. 在菜单栏中选择 "项目(Project)",然后选择 "属性(Properties)"。
3. 在弹出的属性面板中,选择 "配置属性(Configuration Properties)"。
4. 在左侧面板中选择 "常规(General)"。
5. 在右侧面板中,找到 "字符集(Character Set)" 选项。
6. 将 "字符集(Character Set)" 设置为 "使用多字节字符集"(Use Multi-Byte Character Set)。

完成上述步骤后,编译和运行你的程序,就可以使用宽字符了。如果之前已经创建了项目,还需要重新生成解决方案才能使更改生效。

Mike_python小 发表于 2023-7-24 21:14:23

想入门的新人 发表于 2023-7-24 18:03
使用的是宽字符,那需要把vs的编码格式调为多字节字符集是吧,由于太久没接触这方面有点忘记了,还请指教 ...

是的,如果要处理宽字符,你需要将 Visual Studio 的编码格式设置为多字节字符集(Multibyte Character Set)。

你可以按照以下步骤进行设置:

1. 打开 Visual Studio 项目。
2. 在菜单栏中选择 "项目" -> "属性"。
3. 在属性对话框中,选择 "配置属性" -> "常规"。
4. 在右侧的 "字符集" 下拉菜单中,选择 "使用多字节字符集"。
5. 单击 "确定" 保存更改。

这样设置后,Visual Studio 将使用多字节字符集,可以正确处理宽字符。请注意,更改后可能需要重新编译项目。

希望这个解释能够帮助你。如有其他问题,请随时提问。

sfqxx 发表于 2023-7-24 21:22:42

{:10_254:}先领鱼币

陶远航 发表于 2023-7-24 21:23:20

我去鱼币

想入门的新人 发表于 2023-7-24 21:26:22

Mike_python小 发表于 2023-7-24 20:53
通过使用opendir、readdir和closedir函数,可以读取目录下的文件夹名称并保存到数组中。下面是一个示例代 ...

你好,感谢回复,刚刚试了一下你的程序,只能打印英文,不能打印中文,因为我的目录文件设置为英文所以可以读取,若是中文应该是不可以的,最后感谢你提供的帮助,谢谢!

Mike_python小 发表于 2023-7-24 21:27:15

想入门的新人 发表于 2023-7-24 18:26
你好,感谢回复,刚刚试了一下你的程序,只能打印英文,不能打印中文,因为我的目录文件设置为英文所以可 ...

咳咳,如果解决了你的问题,可以给个最佳答案吗

想入门的新人 发表于 2023-7-24 21:42:36

Mike_python小 发表于 2023-7-24 21:27
咳咳,如果解决了你的问题,可以给个最佳答案吗

可以的

sfqxx 发表于 2023-7-24 21:42:36

{:10_256:}{:10_256:}{:10_256:}

想入门的新人 发表于 2023-7-24 21:43:21

sfqxx 发表于 2023-7-24 21:42


{:10_244:}{:10_244:}{:10_244:}

Mike_python小 发表于 2023-7-24 21:43:51

想入门的新人 发表于 2023-7-24 18:42
可以的

感谢!!!!{:10_256:}

sfqxx 发表于 2023-7-24 21:47:28

想入门的新人 发表于 2023-7-24 21:43


{:10_264:}

想入门的新人 发表于 2023-7-24 21:50:06

学习编程中的Ben 发表于 2023-7-24 20:48
在使用 opendir 和 readdir 函数读取中文目录时,可能会出现乱码的问题。这是因为 readdir 函数返回的文件 ...



我将vs改为多字节字符集编码格式输出为如此,中文还是输出不了,不知为何,最后感谢指点!

想入门的新人 发表于 2023-7-24 21:52:48

Mike_python小 发表于 2023-7-24 21:43
感谢!!!!

不知什么原因读不出来,上面用一个大佬的读出来了但是是乱码,其他大佬的都读不出来中文文件夹,打印不出来
页: [1] 2
查看完整版本: 关于opendir、readdir读取不了中文目录问题