QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2972|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。( i+ c( H6 b& s+ z9 o, D6 O. Y
7 f3 {: J" [: ^! c
1.关于UNICODE
% X! H. O0 ~: Z& g& Z3 ~  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页
" t+ V: Z* m6 q9 P<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>
+ B; \7 b- Z% l6 Z+ U' v/ R
( A6 ~& I( m  k& H# R: k- Q" {# a, q2.为什么要使用UNICODE: ~, z( {) u; r1 [
  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型5 }" s% Z" y! ^0 E

! N. [. z# n, p% U* P1 U) V, ]  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。
+ x* L9 m  c8 L" L; E: p2 h# \! ?% h7 j* v: V/ P
  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。
& a: l9 ?! D1 Z8 S) O+ j/ |, |- Z7 w) W- M4 `
3.如何使用UNICODE + j, q9 K; J3 Y: J- v! C
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:
2 e. `. o  \. _3 A+ J5 d
, x3 U* J7 R3 ~4 Q& F$ s#ifdef UNICODE // r_winnt
! e* u& ]1 L. ?/ z+ Ctypedef WCHAR TCHAR, *PTCHAR;4 Q" w" K# W! u8 a/ g
#else /* UNICODE */ // r_winnt- |7 ]3 X' C0 U7 `2 U+ w+ H
typedef char TCHAR, *PTCHAR;
0 A8 |3 d: N# C* N5 q#endif /* !_TCHAR_DEFINED */' C  T% A4 ?1 r* h+ i3 _

+ y, q" J* g' ]$ D. G  @5 P; N! [上面的代码来自WINNT.H,我剔除了一些无关的部分。
+ O/ w- X2 Z2 y6 O* v: X现在一切都显而易见了。! ~$ d- {0 q3 R# S/ D+ r
通过TCHAR,我们只需要这样一段代码:
& U+ N; P7 t  y0 STCHAR tStr[] = _T("t code");
4 e- }8 g7 ?" b" r" v/ IMessageBox(tStr);7 Y: p. X# i$ T% d. q2 h
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。% a5 K5 C9 ^4 i9 D  O7 G0 }
( F, B) I) |$ r% b/ `
2)关于其他的处理1 z% C% m& o/ B5 B
首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:% g0 w4 f0 r' W. b7 `- }
/ V, c5 a: O& P1 S' R- \3 @
CString *pFileName = new CString("c:\\tmpfile.txt");
$ _) J9 p1 m# v( r( W1 L
+ o. x7 N+ U2 h' H+ e#ifdef _UNICODE
; f* W/ L+ m# h! B4 c- V7 F5 T: c2 |
m_hFile = CreateFile(pFileName-&gt;AllocSysString(),
6 W4 t; T- L3 E$ }7 {GENERIC_READ | GENERIC_WRITE,
; X, i; x$ ?- t5 x3 q: QFILE_SHARE_READ,+ d, N6 y' P7 P- ]) O- [% _9 y
NULL,$ a* V& ~" X2 v2 X& a5 s+ V3 T5 H
OPEN_EXISTING,1 z! ^8 t. o# Y2 K( n
FILE_ATTRIBUTE_NORMAL,
+ }4 X$ Q8 i9 z8 s! W0 hNULL);
& t" R5 L( @) [- c+ {8 T* P#else
3 h! }- w/ ]! A) V" Om_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()),
5 C7 _* W' G+ g3 c5 sGENERIC_READ | GENERIC_WRITE,
/ Y2 y8 ~: H* b) D1 d, YFILE_SHARE_READ,  v, _" X: Y! L
NULL,
: v) E4 M# d3 _9 e' NOPEN_EXISTING,- v$ L  H$ S. A" P
FILE_ATTRIBUTE_NORMAL, . l& p: w/ d1 m0 y' F& L
NULL);
( G6 v2 Z8 }  x! h#endif8 l$ ?: e( c2 h$ b4 `* ^0 [0 J7 s. A
# k* {: G( p2 D
3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:
4 D! C& B; u: h0 G2 O9 t0 R; h$ GBSTR wcsStr = L"unicode";
4 @) u( E/ j& E6 ]0 e& G& d  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。
7 t% ?; o9 {6 @8 @8 d& j
% G) v1 c% i1 u/ @  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。 / I/ _( L6 ~$ Y$ Z4 f1 `9 q5 n9 i

) ]' |% U# O6 _! `
4 w2 \3 I% J' f; f3.编译器的设置:: q- H3 A1 O' H' k& v4 ?
  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-20 13:31 , Processed in 0.386950 second(s), 52 queries .

回顶部