QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2995|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。7 V: v; Z7 N0 l) g- [' O
0 v( ~5 M% v, D) \8 e
1.关于UNICODE+ Z& L/ G9 R& g- Y( Z
  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页
2 g2 J, m! m- U, v( H<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>
$ i/ T  @  n2 C+ q1 ^) e% A% \  z& N; {$ _4 p: P
2.为什么要使用UNICODE9 ?- g2 m: c! U# u3 H
  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型
1 H* w) ^# b2 Q$ L. h; D) N9 Z  q+ {+ ?; _, R3 _+ c
  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。
0 l4 b+ P$ H" D
, i$ e" N' a+ u* A  w6 Z  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。8 }/ |6 c& t$ O- Y1 y  x

- q; {1 }/ Z% K, i, L0 r! P" G3.如何使用UNICODE 2 R8 m/ r2 v( B1 p& M/ p  i5 P/ V
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:7 L: A" J, a' Y' z) n. y0 Q4 r

4 z7 \! d3 H2 j- m2 l$ }. F#ifdef UNICODE // r_winnt1 C9 A% R& y2 C
typedef WCHAR TCHAR, *PTCHAR;( L" Y6 s; [2 Z0 J
#else /* UNICODE */ // r_winnt2 W( o* D% i+ Z8 f2 |3 Y
typedef char TCHAR, *PTCHAR;8 ~* g! b+ U  z8 B% e  }
#endif /* !_TCHAR_DEFINED */# t! i" a1 W; l* b7 `; H' u. P

/ U' H7 I! `9 e; w# k上面的代码来自WINNT.H,我剔除了一些无关的部分。
/ @: K2 z! R, V  X; g1 b0 A: J! G# E现在一切都显而易见了。* ?0 ~4 K  W+ L) V
通过TCHAR,我们只需要这样一段代码:$ G- b& k9 E& J+ d+ x- [
TCHAR tStr[] = _T("t code");
9 g2 [" [! L# S$ iMessageBox(tStr);5 x) R, o- E- W# P4 z2 I
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。9 h; q" v7 R) q% C+ M( s

$ }( u; {2 I$ o4 G2)关于其他的处理# x- r& O# Y, }% v7 _
首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:
) r, X+ Y/ k9 W% o- |
( p6 J8 j4 ?0 \9 x  f, H: CCString *pFileName = new CString("c:\\tmpfile.txt");; C. P/ K! D+ D. ]
0 X& K4 ^2 {3 e7 C- N/ k3 p
#ifdef _UNICODE8 _) l2 d* r5 t- |; ~% F& Q1 D( ~

+ W6 v& A% J2 J4 gm_hFile = CreateFile(pFileName-&gt;AllocSysString(),
' j$ p& @; C7 }! I* uGENERIC_READ | GENERIC_WRITE,
, Z9 |3 \9 q( g" H+ oFILE_SHARE_READ,9 G+ @; ^' }5 [' ?) m* q
NULL,
% e0 X* k+ J7 o" i. XOPEN_EXISTING,
/ M3 o) J8 b  e- H, O; DFILE_ATTRIBUTE_NORMAL,
+ S9 ^; Q9 E" D; W& N5 ~NULL);
4 a* S$ d+ p) q; `#else
: Q  q4 Y" j0 W) O9 vm_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()), # z9 e2 e' A, W( C' Z/ i  j4 ]
GENERIC_READ | GENERIC_WRITE, 6 i$ y3 y; Q0 u* ]& E
FILE_SHARE_READ,
( o" r+ K! f5 D( X7 X, cNULL,3 [$ t" z& e, h- c. d3 M
OPEN_EXISTING,
% Q* ^+ ?: S( EFILE_ATTRIBUTE_NORMAL,
& a2 P2 j3 v: x3 ENULL);( W8 _5 n, a! J" n: T% d4 N
#endif8 H" R, W/ P7 f" S+ _1 H* S

$ h# c' R; m0 h: j) \; e+ D! j3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:
8 c7 O0 D2 H" U3 v3 xBSTR wcsStr = L"unicode";3 Q$ a3 p' m1 f
  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。1 K3 P5 H! x9 A7 O: l0 S! [8 ]
4 C$ K8 u: j3 s2 C
  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。 : Q: \5 N0 C+ o+ u0 S/ X; J( G4 e

* u, x  {8 Q- c+ U& i) N
# ]/ W2 j6 I, i! y' a# y3.编译器的设置:
4 ~0 ^: P3 q# h3 H: I$ k  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-12 20:53 , Processed in 0.434390 second(s), 52 queries .

回顶部