QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2994|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。
! g* \* b2 j! T: ]( l
: K, x9 o0 U0 a5 Y7 `) c+ Q1.关于UNICODE2 V* o$ A3 D% q* L! T" i
  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页
9 `0 q' `. {+ Z7 |2 K7 X6 ^& v) y<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>
. b% }7 X0 n8 T9 ?( g+ `$ [! E5 r
2.为什么要使用UNICODE" F0 ]9 z6 P( ~2 v& G8 g% W" S
  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型4 x" @$ e, j1 H; a& C1 P" Z
! D$ `& Q2 X2 B! l( y+ @3 X# h& F
  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。
/ y% a. I( ]' E/ n' w+ p3 R: F5 j0 I9 C- Y. K
  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。$ T6 X( E% x6 \. U4 f5 b

' D/ I/ G1 K1 H9 o3 D/ L) v" z3.如何使用UNICODE - z# `- O; A+ L. C5 E, R6 s' t
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:
6 n& J) U! u. p3 ]- C+ R2 @3 _3 ]; ?) d6 T% a; U4 B
#ifdef UNICODE // r_winnt7 g  o/ J, ?3 ^2 ]0 }% V
typedef WCHAR TCHAR, *PTCHAR;6 Z4 w/ l& y! Q; C
#else /* UNICODE */ // r_winnt
# k1 `2 n, U+ V) ltypedef char TCHAR, *PTCHAR;/ d  K: h& q$ ]1 x9 H! V; T- P. T
#endif /* !_TCHAR_DEFINED */
, e8 H: w. N( E- v5 h
3 |' i+ V2 G* H% z3 B  Q) o* \: e上面的代码来自WINNT.H,我剔除了一些无关的部分。5 f( {! l) n3 H* B
现在一切都显而易见了。  a2 t3 l. ^1 t( ^' l7 M( T
通过TCHAR,我们只需要这样一段代码:( A* F& P$ d; A9 h7 b2 ^/ P6 ]: l
TCHAR tStr[] = _T("t code");
/ R" x# c' `0 uMessageBox(tStr);0 p) s; U1 g  b* J! q1 [: f- V4 r
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。, v; ~$ p1 C- a2 i- S% {

/ Q  |* Z% |; m0 U2)关于其他的处理
* k  W2 p$ u+ ^; _% F首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:
( `- x5 H+ l0 f* e5 Q' G' C7 O* y/ x7 l3 d% \1 h7 n+ b
CString *pFileName = new CString("c:\\tmpfile.txt");: n' R- a+ ~8 `5 x  T
0 w/ Q4 u7 e) w6 w- r, \
#ifdef _UNICODE" }' ~0 h& U" l( B! h0 O

$ o: {' C7 u/ X& im_hFile = CreateFile(pFileName-&gt;AllocSysString(),
4 @) J" k5 G- n6 y0 n. r  f9 w* dGENERIC_READ | GENERIC_WRITE, % O: ^# O5 s! s
FILE_SHARE_READ,
' ?1 j4 e6 k4 T: D3 D6 mNULL,: W9 [0 ^4 P: x+ ]( z5 K# r& V
OPEN_EXISTING,! }2 h' {5 N6 @5 `) \. ?! y9 i- A
FILE_ATTRIBUTE_NORMAL, ( c3 o$ T$ m: S% \  T
NULL);
2 M& U" t  G3 I: b6 ?7 t9 W#else/ D& Y) K5 z3 d, W8 L% [- X: W
m_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()),
6 @. c% x6 w% e! L# ?7 ~7 VGENERIC_READ | GENERIC_WRITE,
/ M% {2 R0 q; b! TFILE_SHARE_READ,' C9 x6 s! V3 ]$ i* }
NULL,& r% m; \5 U' _- |" K; w2 Z
OPEN_EXISTING,( I9 Z$ ^- ]' B/ g
FILE_ATTRIBUTE_NORMAL,
# f9 p' ]% I, g& Y) ?5 |NULL);. g" G+ p/ W' A& S: S+ U2 c7 c
#endif/ J1 i! T- q% g* N. Y* }* d

+ b# c( }5 ]/ w7 N3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:
! R' Q. f- B! M) X6 CBSTR wcsStr = L"unicode";
( f9 ~! g5 J; b, a2 K  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。* ^- r" w" N! A+ x9 n( D& y- |0 \  p
/ z5 ?1 `/ [5 e0 _5 L$ `
  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。 8 W/ Z) ]0 F$ Z& w# n1 h. F; i
9 C! q1 J  j/ {. K2 n

3 n$ k  Q6 [- y; B) U. E3 ^& w3.编译器的设置:
8 c; D2 B! P: V  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-11 20:53 , Processed in 0.523140 second(s), 51 queries .

回顶部