QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2991|回复: 0
打印 上一主题 下一主题

UNICODE编程介绍

[复制链接]
字体大小: 正常 放大
xShandow        

43

主题

1

听众

385

积分

升级  28.33%

该用户从未签到

国际赛参赛者

新人进步奖

跳转到指定楼层
1#
发表于 2004-6-4 09:06 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
<><FONT face=宋体>这是一个许多人(包括我自己)曾经或至今仍疑惑的问题(这里我们只讨论UTF-16,即双字节版本)。
9 {0 f; J0 @" i$ p7 @) m( e( B! r* g/ T) F! R3 R! |  A$ }
1.关于UNICODE
; {* f' b5 \1 L  首先,UNICODE主要使用的字符类型是WCHAR,定义是unsigned short。从定义我们可以看出这是一个双字节的类型,就是每一个字符占2个字节。这样的话,可以表示的字符类型就可以多达6万多。所有之前的ASCII码分布在0x0000-0x00ff之间,而汉字(包括big5)分布在0x4e00到0x9fff之间。整个unicode包含了几乎世界上所有的文字。关于UNICODE的细节,可以参看以下网页$ {; R$ z' x- K$ ^+ X1 G9 @3 @
<a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" >http://www.unicode.org/unicode/standard/translations/s-chinese.html</A><a href="http://www.unicode.org/unicode/standard/translations/s-chinese.html" target="_blank" ><FONT color=#000020></FONT></A>
7 R: b3 p  f* j+ U5 t; F& V1 m1 q* M" s! S
2.为什么要使用UNICODE
- O7 O$ B0 y. q; v  1) COM:在COM规范中,明确指定了必须使用UNICODE类型,这正是微软充分考虑了跨平台的结果。这也是为什么经常在COM中可以看到BSTR(WCHAR*)类型1 S) @) \7 ?3 m7 L  W' j

& K( G% a4 b. M- H# _* v" J( ?; V0 z  2)WIN2000和WINNT:在这两个平台中,默认的字符处理方式是UNICODE。即使你写了一个非UNICODE(multibyte)的程序,系统在执行的时候仍然会对你的字符进行一次转换,这样无疑浪费了CPU时间,使用UNICODE可以有效的提高程序的运行效率(仅使用于这两个平台)。当然将来的XP也会如此。' L4 ?. L' L( b+ O5 U
; U+ b, Q" f) [
  3)通用性:使用UNICODE可以使我们不在为汉字和英文字符的判断而烦恼(都是2个字节)。
$ Z) q7 I# c: x6 Y9 a0 x3 W
" `' G; g8 {% |$ u% B9 ~3.如何使用UNICODE / @, o$ T2 I* U# X, D3 {
  1)首先推荐的类型是TCHAR(通用字符类型)。当你定义了_UNICODE宏的时候,TCHAR就是WCHAR,当你没有定义这个宏的时候,TCHAR就是char,很不可思议吧,我们可以来看一下TCHAR的定义:$ q2 n0 Q6 Y* K2 h/ d
! m5 f8 {: b8 B2 }) m$ V7 O
#ifdef UNICODE // r_winnt  E& {$ x& Z2 d1 T; a/ R
typedef WCHAR TCHAR, *PTCHAR;
; n( |% p' p& F  w6 c( q8 r$ Y4 E#else /* UNICODE */ // r_winnt
' c7 [9 k; p0 h) T6 }typedef char TCHAR, *PTCHAR;
5 j' j( z. D& M6 {#endif /* !_TCHAR_DEFINED */1 I3 F$ M( |, S8 L+ i

! |2 A8 c, \$ ?- |( w7 `% ^上面的代码来自WINNT.H,我剔除了一些无关的部分。4 _: {% D! E- |% R9 {: I3 X9 e! L
现在一切都显而易见了。
5 K: c. M! P) I8 d通过TCHAR,我们只需要这样一段代码:
# G( ~/ _/ A; }TCHAR tStr[] = _T("t code");: s' K/ u7 J  U2 d, b! h4 I' A2 z% U
MessageBox(tStr);
$ c: o$ `0 A6 U* o就可以支持UNICODE和MULTIBYTE两种版本。_T宏的作用就是转换成TCHAR。( E1 m6 E- ^3 {# P, f9 ^

! Y# v3 ?1 X* A2)关于其他的处理
8 R* }- h# E/ C) P1 g7 b" C首先是常用的CString,它本身就支持UNICODE。下面的例子说明了用法:
/ |8 U" A" E4 f; _, X7 T. [4 G2 {$ m( j. m4 T
CString *pFileName = new CString("c:\\tmpfile.txt");
# c& `& Q: ~: d
) e$ y. U: l5 w  R2 t#ifdef _UNICODE
, y: F( D! ^1 [: t+ q  ?2 c9 ?( R; f5 Y% ]& p
m_hFile = CreateFile(pFileName-&gt;AllocSysString(),
1 H7 t8 w# Z: h% D$ |GENERIC_READ | GENERIC_WRITE,
" T  _, d' p; h! {4 q! K2 o5 K9 _FILE_SHARE_READ,
* o9 z' }6 |9 h; H8 ANULL,
; F( t' n; ^+ {4 o/ C! l% AOPEN_EXISTING,
1 y/ M6 _6 J4 ~- H9 e/ \FILE_ATTRIBUTE_NORMAL,
# f3 S/ s8 _9 E, `- w; WNULL);
0 z- a# X  i7 J; W# c#else% u; p+ U6 `1 N+ b, c' I/ m% Y
m_hFile = CreateFile(pFileName-&gt;GetBuffer(pFileName-&gt;GetLength()),
* y3 F4 t- h3 f5 L5 lGENERIC_READ | GENERIC_WRITE,
! Y/ V0 r5 x2 i( @FILE_SHARE_READ,' T, T, |3 O9 k# @/ I# f8 X+ M6 H. R
NULL,
( }0 @6 X' C  C$ a' tOPEN_EXISTING,, e# g4 G) r, s9 W& m! d
FILE_ATTRIBUTE_NORMAL,
" r$ ^) h( d8 w- p% |4 lNULL);
) H0 |" F9 x9 E5 |9 R#endif
6 X' y1 `/ k7 L# F. r, h" [- o$ U9 A2 y
3) 当我们在UNICODE方式中需要为一个字串常量赋值时可以使用L宏,如:
2 a+ V5 q+ _: N2 pBSTR wcsStr = L"unicode";6 x7 P: X# x" k1 R3 k9 S
  这样的附值很简便,但是,经过L宏处理后的字串一定是UNICODE,如果你把它赋给一个MULTIBYTE的字串,字符将可能会被截断。
0 m  o8 `- Q5 f( I* O: v$ y
* |; R1 w+ u: b& N8 `3 e  另外,VC还提供了一些函数如WideCharToMultiByte和MultiByteToWideChar还有另外的一些宏来支持转换。大家可以看MSDN。
! Y( e- D% x. @8 _9 y( M. F7 Z+ z. K5 E' q3 p+ M" [, A1 j$ r

4 L1 _% C) K" T7 E2 [' p9 ?6 S( b3.编译器的设置:: t4 @9 A2 \$ S' Y4 ^6 h
  首先我们需要在project-&gt;settings-&gt;C/C++的属性页中的Preprocessor中写入_UNICODE,然后在link属性页中Category中选择output,在Entry-Point symbol 中添加wWinMainCRTStartup,这样,我们的UNICODE工程便大功告成。</FONT></P>
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-11 10:16 , Processed in 0.441543 second(s), 52 queries .

回顶部