QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2996|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。
. u; _: L% H1 `- ?6 h! P3 w& }7 Q$ N8 E4 I9 E) x5 q
1.关于UNICODE+ m; m; B, ~; d
  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页7 A* J( j0 f2 o7 L( C, F1 n& P% S
<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>
: b, v- h8 P* K; k- P
2 v" ~; w/ R( D2.为什么要使用UNICODE
- Q3 n$ j5 O$ o0 `7 N  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型
, x6 ^/ K' Z" h. t3 r
$ B) A! Q1 p; L1 e8 V- {4 R9 _  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。. o  [4 d1 j2 o5 j
- L: d1 k3 d3 s1 ~  z+ y
  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。+ t$ d  k! a! B- p' x
  k# _9 l0 m3 U9 w2 M9 ?
3.如何使用UNICODE 3 o" b5 R2 x0 P) F
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:
4 q6 v7 a: F* G; t. t6 Q. `: D4 `2 [
; `# ^' `2 ?4 T' z: T#ifdef UNICODE // r_winnt
! `1 N  ^8 k* |+ U" Rtypedef WCHAR TCHAR, *PTCHAR;' n/ {) M" x& j+ c
#else /* UNICODE */ // r_winnt" }. `/ T9 j4 t6 G* @
typedef char TCHAR, *PTCHAR;$ j2 d+ \# F9 g0 a: }0 Z
#endif /* !_TCHAR_DEFINED */
2 `6 v  e  N/ X4 O. L/ A" [2 F0 Q" [* p" v' C$ a% l
上面的代码来自WINNT.H,我剔除了一些无关的部分。# ?8 b+ p6 ?$ ?( _8 A% z
现在一切都显而易见了。, D( V1 U/ c' X$ ]8 H
通过TCHAR,我们只需要这样一段代码:& c6 m3 U* z- C4 u; U5 R' N
TCHAR tStr[] = _T("t code");
% {) y# @) r' gMessageBox(tStr);0 i1 x+ R- m" x6 y+ ^
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。6 H$ i- x# M$ g, N7 @! Y

, G4 U* O* J8 T2 \% u3 l+ e2)关于其他的处理
7 M$ M( z8 |& D7 }2 o3 j! x1 G首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:! u. {- }3 V6 S6 l9 ]
* J# N; j1 C( ?$ C* `) N2 B9 \' \. L
CString *pFileName = new CString("c:\\tmpfile.txt");2 ^- x: v- L- B/ C, J7 M. A

/ g& P) p5 q! D5 a& {# d. S. d5 Z#ifdef _UNICODE
$ I: d8 Z& w6 Y  [0 @% o  W; @( \  S0 T( C6 ]9 f
m_hFile = CreateFile(pFileName-&gt;AllocSysString(), 5 i0 a* l) l$ K0 a
GENERIC_READ | GENERIC_WRITE, . P, H% G/ v3 J4 y: L9 }, i- J  a0 \6 E
FILE_SHARE_READ,; [: S" c, l$ X! e
NULL,
( V1 N4 T* r0 H+ w  |! G3 hOPEN_EXISTING,' j5 }& D7 h6 Z3 T8 b9 b3 z% v
FILE_ATTRIBUTE_NORMAL,
% K0 U. r% a! ]6 n$ ONULL);6 r3 \$ f+ @) E  G5 i, h' b
#else! P' |4 ], b8 }* i
m_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()), 4 G5 p  l2 I. C' n
GENERIC_READ | GENERIC_WRITE, 1 i' g* ]: E4 s! T( ]# u& W0 }" x
FILE_SHARE_READ,
/ x/ l2 _8 F. D! t8 A4 O, v7 }NULL,
. h6 ^$ t. x& U( w1 g) E( gOPEN_EXISTING,
+ v! d' C, A# f/ z# W: S/ V4 [FILE_ATTRIBUTE_NORMAL, 0 ^2 \4 V2 W4 P7 v" R
NULL);
4 ^7 {& W8 Z0 Y' x8 t9 b5 A  i( e#endif
# y3 S1 y- X1 w" S
- M* Q# K( w3 E! f  U/ Q1 U* I3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:
8 w. ~; t6 e2 ?BSTR wcsStr = L"unicode";
! B, S# A( R4 I. K/ I% q: _  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。
8 `0 ?* }" s+ E0 A; n+ R
9 M; A* w* r5 T/ u& m  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。 6 _2 Z1 w( N: u) _

. g5 U6 a7 Q- o5 H! Z, |* M6 `1 L3 k! t' i" {
3.编译器的设置:2 U* r0 l# i( h. a' ^+ [+ C, B+ v
  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-13 06:11 , Processed in 0.340775 second(s), 51 queries .

回顶部