QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2979|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。6 C$ q1 x0 B; t, r2 }

) ^& a  h* N; @' R: l* N1.关于UNICODE2 L! {, |: X# }" q# w
  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页6 m! d  o9 G2 D/ k
<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>
- N) D5 V" G- D- N% d2 J" T6 a& t! [
. L6 l" h) V/ o0 @( Z' R6 b: V1 Q2.为什么要使用UNICODE$ e% W. P- @* F! j
  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型! J4 N' e* x. a8 i! k8 K( s

  m% z2 C. }+ @$ D  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。
3 w/ `# X* {7 z$ b- x. k( t
1 r2 H- A9 S3 U8 ^) r  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。
- H$ t) G- f, |# _2 K2 P2 H
/ E$ p6 `- B1 }  y" V% u  P3.如何使用UNICODE
$ ?- @9 V8 E  n0 M5 R  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:( O; H# Q7 r& }% L5 O1 I2 J- ^4 }
- P4 h: r* @8 a4 F
#ifdef UNICODE // r_winnt0 S6 O) v; @. T8 z4 l2 J" \
typedef WCHAR TCHAR, *PTCHAR;1 m/ p, a) t# W
#else /* UNICODE */ // r_winnt
' C. p$ }( e: c0 ]7 C, ktypedef char TCHAR, *PTCHAR;6 j3 J9 i* E7 k! ?$ y
#endif /* !_TCHAR_DEFINED */( E& v2 `: v; n- s3 U) _, a2 @) E

! L$ ^; @1 A* l上面的代码来自WINNT.H,我剔除了一些无关的部分。+ Q: U4 N$ u) Z' \
现在一切都显而易见了。
' J2 ~8 F, ~6 y6 H$ x+ X) i# r通过TCHAR,我们只需要这样一段代码:
: R' ~8 i, M/ L' w' j. o, [( WTCHAR tStr[] = _T("t code");
  ^0 }7 p( g# E( n$ fMessageBox(tStr);. {- v" C& B! q) X
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。9 Y2 j" w: H  ]: q7 s
* _  l& Z1 h( G4 B& L" q0 T7 m
2)关于其他的处理
7 F2 H; o5 {0 y. D+ W6 g2 ^! T首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:; z  w, a4 Z" T" _
% v# i) d# C# p# Q. r  p4 s
CString *pFileName = new CString("c:\\tmpfile.txt");
% O7 S( K6 V6 K* b7 n2 }4 D" I+ ~2 L
#ifdef _UNICODE
7 I* m* ]' \* f  j& ~: _5 T
7 r( q: `+ F5 e8 wm_hFile = CreateFile(pFileName-&gt;AllocSysString(), 1 [, k5 d' Z4 I1 |
GENERIC_READ | GENERIC_WRITE, " I& h9 K. c  M$ ~( j2 [
FILE_SHARE_READ,8 E0 N" x- o( _$ T( z% c% }3 r
NULL,' |: o5 A) j7 q' J9 c& W$ z  _- W
OPEN_EXISTING,
) Y/ i- B5 u+ c6 ^' x" A/ EFILE_ATTRIBUTE_NORMAL,
0 o" r' v' u5 `' XNULL);+ p* t7 d9 F2 E4 p
#else
9 W0 k/ h& L3 p% F5 v- Gm_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()),
8 [/ {. ?4 E6 jGENERIC_READ | GENERIC_WRITE, 3 _5 j# T: |7 m4 B
FILE_SHARE_READ,; @; H/ X3 W1 H& n' b
NULL,
) V1 U" E3 K: s8 |) w' bOPEN_EXISTING,/ y  s  T) s  E" @8 w4 D) V
FILE_ATTRIBUTE_NORMAL, ' F2 v, P. K3 L& y2 p, s9 ]
NULL);
9 N" j+ V4 @; ^& `- r, @#endif: L# F- V4 Y4 X3 {$ Y( j8 d

. d$ K* H1 q- R+ x1 ~% ]# [# z3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:  E7 l6 u$ K! |! Z6 _' l" \
BSTR wcsStr = L"unicode";( E- x- G7 z) b- J: W% R/ y4 Q
  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。
/ t7 {( M1 i8 A. v" b
( D1 G+ i, H* ]- J# L  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。
  T7 V4 M9 Y( W. d- v: [; O8 C8 r" o  t4 h" ]' U( v9 C

/ |5 a  N" J8 z+ Y) H3.编译器的设置:: H2 `& J3 A- E& G6 Y! l
  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-22 22:40 , Processed in 0.630678 second(s), 52 queries .

回顶部