QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2970|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。
) k4 w, _6 x" t/ x1 P; c9 i$ _) Y! y6 b7 A3 P$ B8 z, s
1.关于UNICODE
1 @& G9 |( W3 R! a* `7 N5 d' \  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页* y0 i' z" C2 C! V
<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>6 A* @/ \4 i# d. e& k, |. k" T

% b9 R- t! f" o; D2.为什么要使用UNICODE
' k, }2 c6 G+ B9 ~0 W& I5 C  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型
2 x* o' y/ V/ a6 b9 D0 J" y) B9 \7 ?8 W( R0 u8 I0 D  ?
  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。
! d# D$ J8 k& ]  _- x% A& q0 N
. I1 Z7 J) B1 u4 p4 \9 U3 S$ W  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。
1 ^3 G& t& _: e0 X: W- ?+ Z' u4 y4 g7 H
3.如何使用UNICODE
* Y; s% [; `2 s& R  p% b  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:
* q1 M" d6 f9 _& a
4 |4 d$ v5 x+ u+ E+ H#ifdef UNICODE // r_winnt- @4 ~3 H" s& k5 T. E2 b1 n/ }
typedef WCHAR TCHAR, *PTCHAR;3 }1 W9 W. m1 Y1 x/ `) K8 K
#else /* UNICODE */ // r_winnt
! |, q1 h. |5 ~3 Q$ o. x2 n- J; btypedef char TCHAR, *PTCHAR;7 c& {4 {7 ^4 u2 _
#endif /* !_TCHAR_DEFINED */) @# W  h$ m  a  y( j0 j

0 c) K& {" }1 J- M上面的代码来自WINNT.H,我剔除了一些无关的部分。" g: p. L1 `, W' |. u/ x( C
现在一切都显而易见了。$ H0 Y$ a! N5 x$ @$ w! U
通过TCHAR,我们只需要这样一段代码:
8 k8 M: h4 r) i3 {, tTCHAR tStr[] = _T("t code");4 e' T8 j9 p4 N7 i( K9 {2 M6 u
MessageBox(tStr);" p' U' w8 \  X8 r) l- x6 n
就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。- b8 x: Q# v4 ~7 K

" n! s# O$ ^) t2 Z4 e2)关于其他的处理
4 L7 r( e4 k  ~6 {+ R首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:
* }* E+ j* k5 c1 \( @- r, w. Z9 _0 s. j/ O8 f9 I+ O
CString *pFileName = new CString("c:\\tmpfile.txt");; t- ~. h0 L' k4 q& G4 a+ D

: ?' T/ z3 i. `1 A#ifdef _UNICODE9 C2 X7 O+ n: q
- ~5 O" b/ w' ~$ ], e/ R- h
m_hFile = CreateFile(pFileName-&gt;AllocSysString(), & i8 A" ~$ l$ G- h' n- q$ l1 y
GENERIC_READ | GENERIC_WRITE,
( f2 [5 J) A5 l1 K  M9 O1 _FILE_SHARE_READ,
1 h, v' Q0 ^- W+ z9 R+ |NULL,) P  G3 {4 C  [
OPEN_EXISTING,$ a1 Q+ p3 i0 U
FILE_ATTRIBUTE_NORMAL, ' b# Y! N( w$ C( y$ E0 Z
NULL);
; a& S: U; t! R3 D#else
1 L/ \8 v& [1 t% t: a( ]* |& ym_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()), ' h( ~* [6 f; E7 o5 g( o) u
GENERIC_READ | GENERIC_WRITE,
0 z" S( k7 b1 t  K# FFILE_SHARE_READ,
( H; L& J) [! G7 }$ {7 aNULL,4 [; B8 Q2 t# m6 [  a; t
OPEN_EXISTING,
1 }; J% F7 q+ W' a% _" YFILE_ATTRIBUTE_NORMAL,
/ T( F, J* }7 d, yNULL);
" Q. g1 a! P, h" z#endif( }% g5 Y" R  C1 Z( Q  |
) a; b9 G) N7 N/ z: F1 n! o% ?
3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:" N, j0 r! o% T3 H$ L, E
BSTR wcsStr = L"unicode";6 Z( G3 E/ B1 g4 G& ]" n7 ^0 R
  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。- F0 b( w# o: V) Q
$ g) G+ R0 _# M6 ~0 |: h
  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。
% |( l6 ^  p0 s' f& J0 k1 A& k1 \( y* q. h# ^% K
% {# F2 }" b0 m' i: z
3.编译器的设置:/ ~$ O$ Q' C% N( `* |
  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-4-20 06:15 , Processed in 0.514791 second(s), 52 queries .

回顶部