- 在线时间
- 0 小时
- 最后登录
- 2007-9-23
- 注册时间
- 2004-9-10
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 9975 点
- 威望
- 7 点
- 阅读权限
- 150
- 积分
- 4048
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1893
- 主题
- 823
- 精华
- 2
- 分享
- 0
- 好友
- 0

我的地盘我做主
该用户从未签到
 |
< >BCB3.0中让TRichEdit支持BIG5内码
" @; e9 w5 ~* S; ?" Z# F% v陈寒秋</P>/ H6 n$ e0 O/ ^* K) K: ^, h
< >大家好,现在的软件如:Foxmail等软件,都有显示GB内码和BIG5内码的功能。我经过一段时间的摸索,发现了实现这种功能的方法。现在就来介绍给大家。首先,要给大家介绍一下这两种内码:大家都知道英文的ASCII码是用一个字节来表示的,但中文因为文字数量太多,所以只能用两个字节来表示。实际上我们常见的文本文件中保存的就是每个汉字对应的内码,而汉字的内码就是该汉字在中文字库中的逻辑位置。在中文字库中,该逻辑位置存放了这个汉字的图像信息,有了这些图像信息,就可以显示该汉字了,当然在现在的Windows中这个显示的过程是由操作系统自动来完成的,我们不必去关心它。但是由于一些历史上的原因,汉字的内码方案有两种,我们大陆地区使用的是GB码,而台湾省却使用的是BIG5码。GB码文件中保存的是汉字相应的GB编码,BIG5码文件中保存的是汉字相应的BIG5编码。而两种内码又都对应于各自的字库文件,所以当我们使用GB内码的简体中文Windows来看BIG5内码的文件时,就会产生常说的乱码现象。
0 o5 t8 h* U: z 由于我们是要显示BIG5码的汉字,所以再介绍一下BIG5码的编码方案:每个汉字由两个字节构成,第一字节的范围从0X81-0XFE,第二个字节的范围分别为0X40-0X7E,0XA1-0XFE。好了,知道了汉字显示的原理和BIG5码的编码方案,就可以很容易让TRichEdit支持BIG5码了。
" h: t+ k; Q8 ? n4 W 第一步:找一个用于内码转换的码表文件。
4 r# O; j. g6 z, K! K8 U- F 我用的是CCDOS97里带的CCDOS.TAB,这个文件的大小为45840个字节。如果你没有这个文件,可以给我来信(<a href="mailtcnprogram@netease.com" target="_blank" >cnprogram@netease.com</A>)我会寄一个给你。当然你还可以根据BIG5码的编码方案自己做一个,这里就不多说了。
, L& o: x; @5 t3 o9 m9 B 第二步:把码表文件转换成数组文件。见下面的程序。+ ?4 z* S% K8 C5 H: l
用BCB建立一个控制台应用程序。把它存为TABTOHEX.BPR和TABTOHEX.CPP。然后在TABTOHEX.cpp中添加以下代码:
2 b: E- L4 h' a, Y& b0 M#pragma hdrstop5 ^4 L5 Q$ y- R+ x* ], i- F
#include <condefs.h>
8 A: s. {0 t+ _# c' i#include"stdio.h": @- Z( f4 N4 Z: N( Z8 E
#include"stdlib.h"
) ~4 D% @" _* p/ c# H" M2 C! E#pragma argsused @ H" f7 l5 p" T
int main(int argc, char **argv)
' y( I$ {) G% F{! Q7 `! ~+ T8 t9 F
FILE *tab;
' v+ c1 y& |0 g* O4 P# ` FILE *hex;
7 |* x7 Z, l W- g, c8 g int i=0;# }8 e8 B, {0 I: P
unsigned int ch;; P1 o" [$ Q! p
tab=fopen("ccdos.tab","rb");//打开CCDOS.TAB文件
5 j2 w6 |8 s8 _* X5 z hex=fopen("tab.h","wb"); O. b9 ^: G3 e) a. Q
fputs("unsigned char tab[45840]={",hex);
: q! A w! r* u3 X9 y fprintf(hex,"\n");9 X( U, G0 [+ C: m6 I8 Z" m2 j
for(i=0;i<45840;i++)( @! K- B) [: W# e5 a
{: g% D* E$ O9 g% h& |- X
if(i%20==0)
5 W: ?5 o3 J+ V+ G4 s {2 _( i, f, z) T8 v$ A
fprintf(hex,"\n");
# B. z" m. s$ o2 H }0 F6 f2 v2 r: f$ G" f( [' z2 C- y U
ch=fgetc(tab);
- ?6 I/ q9 V$ m& {1 g fprintf(hex,"0x%x\x2c",ch);//把码表文件转换为数组文件: ]3 y# [7 k8 j7 P3 ]) V C: X% _
}) E7 z# _) n& E0 @& O
fputs("0xff};",hex);$ Z: ^. a2 B/ Q0 T$ R r
fcloseall();
3 U" p/ {" F0 F3 ^, N return 0;
5 D, i5 O) i$ F: w& F# A% w4 F}
|' V' P2 C8 j; G然后编译并执行这个程序,得到TAB.H文件。
8 V( P6 z( w$ ]5 |0 i% D 第三步:在BCB3.0中新建一个标准的应用程序。添加一个TButton组件:Button1添加一个TRichEdit组件:RichEdit1适当调整它们的大小与位置。然后在Unit1.cpp中添加下面的代码:
3 e* [8 I& w, j' L% g2 S; v9 r3 P3 D) F#include <vcl.h>
8 q% ~: H; ~: ~; M/ T4 t#pragma hdrstop
% k; D H$ \% T#include "Unit1.h"
6 L I, R! K% H9 h& {#include"tab.h"//把头文件TAB.H包含在内# @; u# m1 \& R' b2 |
//-----------------------------------------------------------------/ i/ W z, {3 d- {
#pragma package(smart_init)! w% ~2 X! r+ W
#pragma resource "*.dfm"
: V" q9 _) H/ @ vTForm1 *Form1;7 J/ q! l$ i, d6 b) h
//------------------------------------------------------------------
( }8 n$ c# @, a& j% @ v6 W__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)- I( |& \6 G/ g# k3 t1 ^& V: k
{ g- J. C ^" @4 n/ ^1 G3 z a
}
5 ] x" U* N/ X6 w( F& \; X; m//------------------------------------------------------------------
$ A9 ^0 I. m, x$ }void __fastcall TForm1::FormCreate(TObject *Sender)
5 v# M1 n Q7 k% H5 f7 L" a{
5 D' n$ T0 O; M- j RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//读取一个BIG5码的文件,可自己的情况设定3 k% V' Q8 X6 t m p
}$ O& \- k Z4 q+ j! }) |
//-----------------------------------------------------------------
1 M. D& a/ h9 Y4 T* s; N- ovoid __fastcall TForm1::Button1Click(TObject *Sender)1 l' m/ @$ `4 F5 J" f! V3 l7 B+ y
{ U+ p) e# M/ d) [* Z4 g
unsigned long i,address;//把BIG5码转换为GB码
5 d% E5 U5 s5 M) U unsigned char ch1,ch2;
L* K( L6 W. f char *x;
; o! D/ q% l. I" F8 A x=RichEdit1->Lines->GetText();
7 Z; n( B% u; g7 `% [8 S" C i=0;& ~: B/ s6 J6 ?( d
while(x!='\0')
: P+ d; A# e, w& D" ~% I {
9 i8 c. |4 p' w& v' g9 d! G ch1=x;% [: ^& X4 [3 [" W/ t7 c; N z
if(ch1>=0xa1)+ G0 y$ c& ?# T3 Z- r
{
7 S, b% b5 o$ j2 u$ ~2 L: j ch2=x[i+1];: @5 d$ E K: B: G9 z
if(ch2>=0x40&&ch2<=0x7e)
& x% V7 x6 f( n' b. `" j4 t7 \ {
) M1 r/ l( G# p0 f0 G( q. Q address=ch1*314+ch2*2-33010;
7 _0 y% h H( j6 @ w x=tab[address];
6 i5 G5 U/ X. \" M' S x[i+1]=tab[address+1];9 @* I' m" }: Q2 k1 i5 a- C
}; S4 Y% i7 [* B4 V. U- c
if(ch2>=0xa1&&ch2<=0xfe)
! v0 t9 E2 t) n, e7 f# n9 F7 k1 @ {8 X) a' i) P& ~( ]+ y; }
address=ch1*314+ch2*2-33078;# A3 n" z# ?# R% C2 L
x=tab[address];7 u3 h) H* e" {
x[i+1]=tab[address+1];7 S/ W1 O9 B, H* O1 ~& c3 _0 v
}
" r- P* J6 x; N i+=2;
4 h, d7 p7 [ X2 A) d0 c }$ \0 {& H$ E+ X8 P8 K9 ?% D
else$ w: E# B0 J$ l6 M$ f3 K. p; e
i++;8 n3 s; Q' D+ ? z
}7 Z9 M# A$ R5 k$ `
RichEdit1->Lines->Text=x;
3 _( c$ o* L E; l RichEdit1->SetFocus();
6 x2 E5 `3 R; U) X# |% {; f RichEdit1->SelStart = 0;7 A9 v* ]; E. m- ~
}
- O% ]5 c' t \1 g3 z1 i2 U# W) Y 编译并执行它,首先你会看到RichEdit1中的BIG5码文件显示为乱码。按一下Button1,这时,你就会看到RichEdit1中的乱码变成了正常的汉字。好了,现在你自己编的软件也可以支持BIG5码了,是不是感觉更专业一些。GB->BIG5的转换方法也是类似的,有兴趣的朋友可以给我来信。最后,祝大家龙年愉快。本程序在WIN97,BCB3.0下编译通过。# k, S0 g4 m1 |8 n/ m2 f* I' _
</P> |
zan
|