QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2993|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |正序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。
% L4 q7 x! b7 Q* r" I  v
9 B' {6 ?" t* K; M1.关于UNICODE
+ E& B3 Q# d, W, h1 T  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页
# g2 v: S$ b% a2 _3 w<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>8 F9 K/ i. g* E7 ~# t' \) \

+ l3 v/ g' j4 X9 h$ m( h1 ^2.为什么要使用UNICODE1 [7 b' `  p% ?) W; F" k' i
  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型
# b$ u0 N& R0 W: |! ~6 U- d' q0 L5 ?0 r  L
  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。
1 D/ ^: X! t" E0 h; q" I3 t1 L& m, R( [) D( R) ?6 W
  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。+ B1 {- |" W% h% W9 H  q

3 k, v7 E7 Z2 e6 ~7 E+ a( V. v+ O3.如何使用UNICODE 2 ]4 W7 N/ \/ K( g2 v
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:7 M  ]  K, s9 V- k  Z
  f% X6 S6 Y" E6 A* {. J) m
#ifdef UNICODE // r_winnt
6 J  D) D. X1 h$ }typedef WCHAR TCHAR, *PTCHAR;2 e. t1 C+ r. M, A
#else /* UNICODE */ // r_winnt
$ `2 i& @4 E* ctypedef char TCHAR, *PTCHAR;. z: ~; g1 g% ]: ~+ X6 j' J7 C
#endif /* !_TCHAR_DEFINED */+ Z, I: o2 O: A/ T

, @. v& E; G! P# t上面的代码来自WINNT.H,我剔除了一些无关的部分。
) m, @" Q$ M9 U) D现在一切都显而易见了。
+ }2 \5 V; w' r$ m) _通过TCHAR,我们只需要这样一段代码:
4 {9 v- i8 ?9 b  bTCHAR tStr[] = _T("t code");8 U. f2 R  v, r2 d
MessageBox(tStr);
9 x$ e# z8 _8 N3 I& W( |就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。9 Z0 J( N" T2 m- D! D+ @1 Z
. W" K) `, k/ p. y, I" @2 p: q% c
2)关于其他的处理9 w7 F9 L4 ^; u! V8 w8 k7 W) W  O
首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:9 ]6 v1 u2 x6 d

9 s% T, m- G5 x! b2 nCString *pFileName = new CString("c:\\tmpfile.txt");% C9 @  O) d/ X9 P

* ?# m8 E% A( b9 S#ifdef _UNICODE3 ?/ c. z. E+ z/ a6 s

5 O6 W3 l" V) y( b/ Dm_hFile = CreateFile(pFileName-&gt;AllocSysString(), * F. P# ~; }, L# w% \  K4 v% R1 c
GENERIC_READ | GENERIC_WRITE,
0 J! W0 e* p& x& TFILE_SHARE_READ,- ]5 Y+ {4 [1 h' k- H
NULL,
5 p6 O' {+ e. b' ?$ |1 D4 G+ LOPEN_EXISTING,
, a7 F- a4 e2 u1 W" c3 X* [FILE_ATTRIBUTE_NORMAL, 0 E7 {& ?# a( H- E' n
NULL);! q: c, g3 n7 b
#else
2 N. W* D  j  U0 V2 zm_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()), 9 o/ {' d% V, B  P7 |+ n! c
GENERIC_READ | GENERIC_WRITE, , n7 z0 p" y; |1 u7 l! Y
FILE_SHARE_READ,2 L" z  s" h; r/ F7 C; X
NULL,
* v. e4 g: u6 n( [( LOPEN_EXISTING,
  z7 g! ^, {: U8 j% \* X( C+ R* l# I0 K/ `8 iFILE_ATTRIBUTE_NORMAL, ; Z6 ]$ `' Q* \# }+ k) B: |
NULL);
) V: D# C3 K: l5 u  j& K9 i2 `#endif4 Y: ~7 b) X. f3 @4 g

  v# Y5 C5 x' Z6 F3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:( {  Z1 ^8 ]3 B
BSTR wcsStr = L"unicode";; f6 T6 g; c2 D) z
  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。
" ?. @4 I3 |' |" Q9 T, w" X
: N& [) l: b- `  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。 9 J* l$ v, V8 M* ^4 T

4 V  x- g' v1 ]/ o0 \
, ], r$ x, G5 T5 D6 _# v3.编译器的设置:2 s; \7 `- T( P9 b% l, z& A1 _& P
  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-11 19:27 , Processed in 0.410465 second(s), 52 queries .

回顶部