QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2973|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。
& Y1 W7 K6 b* [! M
$ w! q  e4 l  Z7 S1.关于UNICODE5 T% m! T1 Q; o4 B
  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页
; I, r6 v2 @3 d5 x: n4 B<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>
( P& B/ w( W% y$ L" v: f7 s  G" o# b/ \: n$ S0 ?0 J9 ?
2.为什么要使用UNICODE
1 I( `2 }/ c$ B: ]. c* q& f1 R  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型. e# i3 s/ e) y5 q" w
- f/ a) i  `! u6 A) W' g, ~1 n
  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。. l  p: E# h- i, V

5 g5 K! j6 _! E' j9 E& v5 J/ [  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。6 m3 Q1 i9 s( \) j
' n: b8 d" j0 K) }
3.如何使用UNICODE ( C4 O. U# V( N! ~* y* E  d6 D! C
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:
0 a$ p; u" |5 Z% P) h9 E5 K3 b" [
, b, X) r: R3 |4 t2 X6 Y$ A#ifdef UNICODE // r_winnt% T" D! E" P3 D1 N4 N" V
typedef WCHAR TCHAR, *PTCHAR;6 Q/ \- K8 I8 e& K4 r
#else /* UNICODE */ // r_winnt
$ {& ?; a2 q/ t* Q" c7 itypedef char TCHAR, *PTCHAR;
+ [. |& \7 }# R, a+ q3 g#endif /* !_TCHAR_DEFINED */+ b6 N4 y1 r" J: n7 z
/ U6 S! }4 \6 G& n5 E2 D5 M% g2 r/ G8 I
上面的代码来自WINNT.H,我剔除了一些无关的部分。# f, }8 `2 L2 j& [% q7 r( I
现在一切都显而易见了。+ f6 S% L$ A% h3 u" E
通过TCHAR,我们只需要这样一段代码:0 }/ m! ^" \2 r* M/ S2 J
TCHAR tStr[] = _T("t code");8 D. E  y+ O  z& y2 [% z
MessageBox(tStr);  M) C2 b/ h: J* O  l% r# i
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。
+ J5 X% U& v, ?% w2 p) T7 |
% G7 S5 K% c7 q0 u4 x5 f2)关于其他的处理3 p9 S; }! J. Y  G( e6 |
首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:
. N: z( m' ^, v/ H
0 |/ F% I4 z! n3 t/ ]CString *pFileName = new CString("c:\\tmpfile.txt");
9 X( d- i3 l6 F
. u1 w+ ~% {: x  O9 y#ifdef _UNICODE
& Y: x# Q. x7 S# B8 L8 N
' k. D  J$ f& T/ A" O% wm_hFile = CreateFile(pFileName-&gt;AllocSysString(), ; H0 n; I5 N# H% N# Q8 t5 ]
GENERIC_READ | GENERIC_WRITE, 2 t$ p8 k4 c5 M, F  F. R1 K! N
FILE_SHARE_READ,6 X6 p/ M1 g; e, X: @
NULL,$ R) l- {  R9 o# H8 G
OPEN_EXISTING,# ?/ j3 h1 z5 D( E, O
FILE_ATTRIBUTE_NORMAL, " ^; M6 D) G: V) p2 m
NULL);4 M. A+ c& K) j; A' D% y
#else
& J0 u4 \  N' ~& l* ^5 P4 wm_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()), , N3 \  Y) n! Z( x, H
GENERIC_READ | GENERIC_WRITE,
1 ?1 g4 x$ b2 s& _FILE_SHARE_READ,) E" i  X, b: }8 l$ J
NULL,
9 l& W- Y7 Z  `# g/ COPEN_EXISTING,
2 I0 R7 O8 T1 ZFILE_ATTRIBUTE_NORMAL, 6 e( g' a# e  w+ a8 y4 |4 O4 ~
NULL);
" G1 I7 n$ e0 z2 P+ }9 l6 a% O0 v#endif- f9 Q) V/ s. P% |
' |/ J; x0 m$ q3 }6 M- V0 j
3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:
& l+ l6 q3 b, g" ~* B! ]BSTR wcsStr = L"unicode";6 r5 T8 c9 `8 s# t& U) c' |
  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。' t1 }0 {& q, ?  {% d) e/ m

4 {8 [) {7 l9 g4 }, I) z. ~9 k+ Z* H6 F  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。
. ?1 {3 q: @1 U' J, U: e3 H3 R# q0 }
; Q3 ^1 B: F% q: S9 a! a6 j: @0 r! r$ N; x
3.编译器的设置:) h1 W. Q  `; l  ]7 A; Z
  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-20 15:27 , Processed in 0.417873 second(s), 52 queries .

回顶部