Unicode目前普遍采用的是UCS-2,它用两个字节來编码一个字符,
Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符,
Unicode目前普遍采用的是UCS-2,它用两个字节来编码一个字符, |
由于GB 2312-80只收录6763个汉字有不少汉字,如部分在GB 2312-80推出以后才简化的汉字(如“啰”)部分人名用字(如中国前总理朱镕基的“镕”字),台湾及香港使用的繁体字日语及朝鲜语汉字等,并未有收录在内于是厂商微软利用GB 2312-80未使用的编码空间,收录GB /fr并且使用UltraEdit验证)。
第三种验证法:在记事本里输入字符?,保存成任意名字,此时系统提示,有不认识的Unicode字符是否继续?如果点是保存再次打开后,就是一个"?"最有趣的是,这个问号被精确保存成英文字符里的问号即3F。看来记事本是在保存前做了转换至于转换过程不知道。。怎么探测出Unicode的不知道。
}
实现原理:直接弄一字库汉字後面紧接着相应的拼音,把要转换的字符串逐字跟字库匹配假设不是汉字直接返回,假设是汉字查找字库返回相应的拼音。
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。