- 在线时间
- 0 小时
- 最后登录
- 2007-9-23
- 注册时间
- 2004-9-10
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 9975 点
- 威望
- 7 点
- 阅读权限
- 150
- 积分
- 4048
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1893
- 主题
- 823
- 精华
- 2
- 分享
- 0
- 好友
- 0

我的地盘我做主
该用户从未签到
 |
< >BCB3.0中让TRichEdit支持BIG5内码
' f* @4 {; E2 F6 C/ m6 @/ ]陈寒秋</P>. \5 C. \: X8 U5 _1 u" p: J
< >大家好,现在的软件如:Foxmail等软件,都有显示GB内码和BIG5内码的功能。我经过一段时间的摸索,发现了实现这种功能的方法。现在就来介绍给大家。首先,要给大家介绍一下这两种内码:大家都知道英文的ASCII码是用一个字节来表示的,但中文因为文字数量太多,所以只能用两个字节来表示。实际上我们常见的文本文件中保存的就是每个汉字对应的内码,而汉字的内码就是该汉字在中文字库中的逻辑位置。在中文字库中,该逻辑位置存放了这个汉字的图像信息,有了这些图像信息,就可以显示该汉字了,当然在现在的Windows中这个显示的过程是由操作系统自动来完成的,我们不必去关心它。但是由于一些历史上的原因,汉字的内码方案有两种,我们大陆地区使用的是GB码,而台湾省却使用的是BIG5码。GB码文件中保存的是汉字相应的GB编码,BIG5码文件中保存的是汉字相应的BIG5编码。而两种内码又都对应于各自的字库文件,所以当我们使用GB内码的简体中文Windows来看BIG5内码的文件时,就会产生常说的乱码现象。3 u- E! P# ^1 g5 M1 [6 D
由于我们是要显示BIG5码的汉字,所以再介绍一下BIG5码的编码方案:每个汉字由两个字节构成,第一字节的范围从0X81-0XFE,第二个字节的范围分别为0X40-0X7E,0XA1-0XFE。好了,知道了汉字显示的原理和BIG5码的编码方案,就可以很容易让TRichEdit支持BIG5码了。
7 H' U5 J: O$ k# }8 a( L0 V 第一步:找一个用于内码转换的码表文件。
7 B' {$ u! l# w5 q, l2 N 我用的是CCDOS97里带的CCDOS.TAB,这个文件的大小为45840个字节。如果你没有这个文件,可以给我来信(<a href="mailtcnprogram@netease.com" target="_blank" >cnprogram@netease.com</A>)我会寄一个给你。当然你还可以根据BIG5码的编码方案自己做一个,这里就不多说了。; [/ Q7 L( O: N# X. A/ _* |' s3 o
第二步:把码表文件转换成数组文件。见下面的程序。1 }) R* h- C- X3 p) W5 a6 ^
用BCB建立一个控制台应用程序。把它存为TABTOHEX.BPR和TABTOHEX.CPP。然后在TABTOHEX.cpp中添加以下代码:
* J1 A* }& K8 ]& x& U }: M. U$ P#pragma hdrstop* R3 O9 O; d4 y
#include <condefs.h>9 k8 c" |! _6 a
#include"stdio.h"; x, C* m; C# c! j+ X1 F7 U6 d
#include"stdlib.h"9 L& Z# y9 U" D; i; R
#pragma argsused, E3 S5 g! D9 O+ p% U4 `$ Q: a9 R
int main(int argc, char **argv)
' I( V8 Y, g* {# j7 s/ d{
4 z* l/ }" ~; i9 L4 u4 { FILE *tab;9 U! Y+ x, [ K, U4 [4 F3 \
FILE *hex;
) y1 Q% Z* V/ {7 @% Q, m int i=0;. o$ i0 f, V, x( H
unsigned int ch;
1 g2 D8 G7 I: O$ ` tab=fopen("ccdos.tab","rb");//打开CCDOS.TAB文件
( v% p0 y: r# T+ M; d0 y7 O hex=fopen("tab.h","wb");
- [; q" p n, Z r' ~# W! A p fputs("unsigned char tab[45840]={",hex);) n7 s8 Y2 A/ C3 a/ J0 a; @
fprintf(hex,"\n");
# ?/ \9 q: n0 v" ~5 V for(i=0;i<45840;i++)0 Y% }# Y5 W+ ^" L
{
, B( t2 r' s- K: q if(i%20==0)
( F. h+ f4 D! e" [) I% F {
5 e \7 I2 p% H2 J" d fprintf(hex,"\n");9 }5 q2 A, J# j! r3 R
}
2 d$ c& Y# i3 k# i ch=fgetc(tab);
& M6 y$ R, \, F, N& v fprintf(hex,"0x%x\x2c",ch);//把码表文件转换为数组文件: N5 {4 z& ~. Z& E5 k* ?& A# H
}
' k. c' G$ M: ^8 _/ J1 h& y @ fputs("0xff};",hex);# {' [/ r* P1 z: [. H7 m$ I, }
fcloseall();
P3 E8 u2 d3 [1 ?( g9 O( T/ e1 u1 T return 0;
* D; R! y1 l5 R3 l4 H/ s g1 T}
6 L S0 ]" ~' m7 ~3 U* T/ S然后编译并执行这个程序,得到TAB.H文件。
6 q. M$ x7 `9 [" }! k3 ? 第三步:在BCB3.0中新建一个标准的应用程序。添加一个TButton组件:Button1添加一个TRichEdit组件:RichEdit1适当调整它们的大小与位置。然后在Unit1.cpp中添加下面的代码:4 N! a. |7 d2 l8 D- l% K! \
#include <vcl.h>0 e6 }* }" u% O' Y8 O- E
#pragma hdrstop' `9 t- w6 ?5 X* F& R* i* s
#include "Unit1.h"
4 s) M# r/ W; l7 j% w& d# h. m- f#include"tab.h"//把头文件TAB.H包含在内$ I: n( t9 _/ X& D: Q, ^; d
//-----------------------------------------------------------------1 E, l( a) w* ]$ @6 C7 @
#pragma package(smart_init)- g) o) v u" [) I0 U3 ]* j
#pragma resource "*.dfm"8 p$ E" W$ d# T# Q7 K5 v. s
TForm1 *Form1;0 H: R$ r1 \9 P( I, @! o \ M# W0 p
//------------------------------------------------------------------5 c0 B2 r' V& w# l0 G6 z# j/ Y
__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)2 P) { R" X) `+ y0 m& F
{6 U. m/ [7 _6 x- y) P( K
}
9 |7 ^% w' x! z" r( B$ `; h) V3 \% G//------------------------------------------------------------------) O+ o6 D( A2 G e; m- C3 j
void __fastcall TForm1::FormCreate(TObject *Sender)
5 R3 u; }6 i9 j7 d# P# ?" H{
* c0 v& E6 T& R) p& y* Z1 O4 R/ [ RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//读取一个BIG5码的文件,可自己的情况设定3 Q9 J. S4 p3 d5 B- B7 W
}7 a( i- Z$ S- I' ~: l# j
//-----------------------------------------------------------------
j+ _) q, A0 s. O* T. A/ m1 i: Xvoid __fastcall TForm1::Button1Click(TObject *Sender)
1 g5 Y) v( O- j# _+ A& H{; u+ p: w. ^: B
unsigned long i,address;//把BIG5码转换为GB码
+ e/ m" A1 f( f unsigned char ch1,ch2;5 ^) @3 [ a- n' q: X
char *x;4 n* R" n5 j0 o+ q$ p, @. ]
x=RichEdit1->Lines->GetText();6 O2 X: E m! U* x& z; _. E
i=0;
8 x5 ?0 D3 x/ {7 F$ B% _ while(x!='\0')+ L& N& V( F+ R! l2 `- ^, K' i4 v
{; b7 T& u9 C) r9 ~
ch1=x;
. l$ \) U) S- v+ X if(ch1>=0xa1)
5 G: {8 X" [2 q' S( J {! ~2 s/ A. }: ^* l; p
ch2=x[i+1];0 l6 |7 D4 w4 ^5 {% r/ p2 R
if(ch2>=0x40&&ch2<=0x7e)
2 f8 Y' K- L/ v, b, Z) M {
, l$ [% u& T$ Q7 t+ k. u address=ch1*314+ch2*2-33010;
6 m G! W5 ]! W' s: n' o- Y x=tab[address];' K" P j+ n; y9 U, Q8 I0 u
x[i+1]=tab[address+1];
: J3 e+ D/ a- c& o7 C }
) B& L: @4 X) \* [& e. A if(ch2>=0xa1&&ch2<=0xfe)
5 J5 u! H/ C4 _6 r {3 q( h$ L$ `: V0 s/ a
address=ch1*314+ch2*2-33078;4 M1 G1 w+ |8 d- z
x=tab[address];
) T% f4 t: J* [" M" G( v x[i+1]=tab[address+1];' K; ?$ e, U5 b2 U. j. x8 B% \
}0 c) x0 O; V( W- L
i+=2;
1 N) J+ T, y1 O0 v7 @) x }
: J/ N* ] P! S2 G+ Z else+ Z5 o! R. j1 t' S9 g
i++;
; p* O7 @+ v4 i G& X, X1 B }
8 G1 Z! n- w3 R* s2 d; S1 ~ RichEdit1->Lines->Text=x;+ @& j, L2 E7 V. F4 n" k ~
RichEdit1->SetFocus();" @8 i N: j D2 c
RichEdit1->SelStart = 0;$ d" u% E7 ~0 H; e ], y
}) |0 V4 \: @# w( |5 f, n) ~/ ~: P2 \
编译并执行它,首先你会看到RichEdit1中的BIG5码文件显示为乱码。按一下Button1,这时,你就会看到RichEdit1中的乱码变成了正常的汉字。好了,现在你自己编的软件也可以支持BIG5码了,是不是感觉更专业一些。GB->BIG5的转换方法也是类似的,有兴趣的朋友可以给我来信。最后,祝大家龙年愉快。本程序在WIN97,BCB3.0下编译通过。
& H& `# ?; N) c+ G</P> |
zan
|