黑马程序员C语言教程:C++中GB2312字符串和UTF-8之间的转换

时间:2022-07-13 07:15:13 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。




传智播客C/C++培训专家:

C++GB2312字符串和UTF-8之间的转换

http://bbs.itcast.cn

分类: C/C++





在编程过程中需要对字符串进行不同的转换,特别是Gb2312Utf-8直接的转换。在几个开源的魔兽私服中,很多都是国外开发的,而暴雪为了能够兼容世界上的各个字符集也使用了UTF-8。在中国使用VSVS2005以上版本)开发基本都是使用Gb2312Unicode字符集,所以当在编程过程中就需要进行字符转换,这样才能兼容游戏,否则就是乱码。而在控制台显示字符串时,正好相反需要将UTF-8的字符串转换成Gb2312才能正常显示。

为了解决这个问题,转换如下;其实很多地方都可以使用到字符串的编码转换,代码如下:

//UTF-8GB2312的转换 char* U2G(const char* utf8) {

int len = MultiByteToWideChar(CP_UTF8, 0, utf8, -1, NULL, 0); wchar_t* wstr = new wchar_t[len+1]; memset(wstr, 0, len+1);

MultiByteToWideChar(CP_UTF8, 0, utf8, -1, wstr, len);

len = WideCharToMultiByte(CP_ACP, 0, wstr, -1, NULL, 0, NULL, NULL);

char* str = new char[len+1]; memset(str, 0, len+1);

WideCharToMultiByte(CP_ACP, 0, wstr, -1, str, len, NULL, NULL); if(wstr) delete[] wstr; return str; }

//GB2312UTF-8的转换 char* G2U(const char* gb2312)




{



int len = MultiByteToWideChar(CP_ACP, 0, gb2312, -1, NULL, 0); wchar_t* wstr = new wchar_t[len+1]; memset(wstr, 0, len+1);

MultiByteToWideChar(CP_ACP, 0, gb2312, -1, wstr, len);

len = WideCharToMultiByte(CP_UTF8, 0, wstr, -1, NULL, 0, NULL, NULL);

char* str = new char[len+1]; memset(str, 0, len+1);

WideCharToMultiByte(CP_UTF8, 0, wstr, -1, str, len, NULL, NULL); if(wstr) delete[] wstr; return str; }

无论是GB2312UTF-8的转换,还是UTF-8GB2312的转换,都需要注意的是在使用字符串后,需要删除字符串指针;这是因为以上两个方法返回的是字符串指针,如果没有删除将会内存泄漏,可别说我没提醒你哦。




本文来源:https://www.wddqw.com/doc/0e0632b750e79b89680203d8ce2f0066f53364cf.html