- 在线时间
- 0 小时
- 最后登录
- 2007-9-23
- 注册时间
- 2004-9-10
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 9975 点
- 威望
- 7 点
- 阅读权限
- 150
- 积分
- 4048
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1893
- 主题
- 823
- 精华
- 2
- 分享
- 0
- 好友
- 0

我的地盘我做主
该用户从未签到
 |
< >BCB3.0中让TRichEdit支持BIG5内码+ |% {# W$ o$ s$ G7 A; a
陈寒秋</P>
/ V' a2 G% l c9 E, @9 _' F< >大家好,现在的软件如:Foxmail等软件,都有显示GB内码和BIG5内码的功能。我经过一段时间的摸索,发现了实现这种功能的方法。现在就来介绍给大家。首先,要给大家介绍一下这两种内码:大家都知道英文的ASCII码是用一个字节来表示的,但中文因为文字数量太多,所以只能用两个字节来表示。实际上我们常见的文本文件中保存的就是每个汉字对应的内码,而汉字的内码就是该汉字在中文字库中的逻辑位置。在中文字库中,该逻辑位置存放了这个汉字的图像信息,有了这些图像信息,就可以显示该汉字了,当然在现在的Windows中这个显示的过程是由操作系统自动来完成的,我们不必去关心它。但是由于一些历史上的原因,汉字的内码方案有两种,我们大陆地区使用的是GB码,而台湾省却使用的是BIG5码。GB码文件中保存的是汉字相应的GB编码,BIG5码文件中保存的是汉字相应的BIG5编码。而两种内码又都对应于各自的字库文件,所以当我们使用GB内码的简体中文Windows来看BIG5内码的文件时,就会产生常说的乱码现象。8 |* g5 [6 U. x3 Y; m5 } ~* n
由于我们是要显示BIG5码的汉字,所以再介绍一下BIG5码的编码方案:每个汉字由两个字节构成,第一字节的范围从0X81-0XFE,第二个字节的范围分别为0X40-0X7E,0XA1-0XFE。好了,知道了汉字显示的原理和BIG5码的编码方案,就可以很容易让TRichEdit支持BIG5码了。- f2 k, K$ A+ q1 U5 U# {
第一步:找一个用于内码转换的码表文件。9 N2 h4 a, i1 H5 t1 [4 @9 ~6 |
我用的是CCDOS97里带的CCDOS.TAB,这个文件的大小为45840个字节。如果你没有这个文件,可以给我来信(<a href="mailtcnprogram@netease.com" target="_blank" >cnprogram@netease.com</A>)我会寄一个给你。当然你还可以根据BIG5码的编码方案自己做一个,这里就不多说了。
) Y; M+ u, C; o' p 第二步:把码表文件转换成数组文件。见下面的程序。7 Y7 [+ e% J7 T+ {2 U
用BCB建立一个控制台应用程序。把它存为TABTOHEX.BPR和TABTOHEX.CPP。然后在TABTOHEX.cpp中添加以下代码:
$ O1 E7 ^& s6 R. w1 e1 d: S* K#pragma hdrstop' I7 S0 B' j- q. J2 p
#include <condefs.h>
# i3 O* I" O5 t#include"stdio.h"! G4 ]1 Q) `) Z& m2 ?
#include"stdlib.h"' O: w) i8 \/ L# B
#pragma argsused4 W; t, w8 D2 t8 r* o
int main(int argc, char **argv)
6 I7 N4 a, i% L) X* |" e{& |) V0 S% W# _7 e
FILE *tab;
2 K; ?/ F; ~# x FILE *hex;
$ U e' W6 [9 z3 [& g1 W int i=0;# ^$ A' m' X0 }# e
unsigned int ch;
4 K+ H& I; {6 A+ {1 z/ H c% o tab=fopen("ccdos.tab","rb");//打开CCDOS.TAB文件
6 P/ z. N/ K3 s# M hex=fopen("tab.h","wb");; ~. ]7 Y7 n& U9 c+ M& x
fputs("unsigned char tab[45840]={",hex);' c: p6 p( W$ H% y
fprintf(hex,"\n");
- J B0 f+ i0 M for(i=0;i<45840;i++)2 J- V1 a5 ^( G, c
{
7 ?/ e. E( e# X4 A0 t, c8 }: J if(i%20==0)
8 U' D |3 G, F! h {
% H% G& C4 l: p) Q' r) l fprintf(hex,"\n");
+ F; c# z# K6 I, ~/ w1 h- O }& I) u& ^) E Y( H3 [
ch=fgetc(tab);: k9 O. O) L) C
fprintf(hex,"0x%x\x2c",ch);//把码表文件转换为数组文件
" e9 Y$ B9 U8 i2 Q+ \9 f: M }! I$ H5 L' H! A: Z, @
fputs("0xff};",hex);
8 E) X1 H, n+ f( ]+ C fcloseall();
: N- O' v1 G% z, M$ j return 0;; S# r7 S' S+ }* M8 J
}( N8 q) D$ i% n9 O) T3 ?+ w4 L
然后编译并执行这个程序,得到TAB.H文件。
! h& V: \& H3 w2 q8 V- ~) F U 第三步:在BCB3.0中新建一个标准的应用程序。添加一个TButton组件:Button1添加一个TRichEdit组件:RichEdit1适当调整它们的大小与位置。然后在Unit1.cpp中添加下面的代码:
2 Z: `$ c: n0 \3 s#include <vcl.h>
1 p4 j" v& B5 }! ^9 n#pragma hdrstop
3 n# E0 g0 [, r3 n; G#include "Unit1.h"9 v T l$ j8 B b" T( j
#include"tab.h"//把头文件TAB.H包含在内 d% ^: O9 \' w4 I" P, T
//-----------------------------------------------------------------+ X# b' e- p1 V& ~, F) k
#pragma package(smart_init)' Y* n0 J: @) ]1 `# M
#pragma resource "*.dfm"
5 e6 _$ l0 {) Z1 {% G$ ?, I! qTForm1 *Form1;
7 `# H9 f* h P( j//------------------------------------------------------------------
9 B3 F U0 u' W: r9 C# `__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)9 S: u# l7 y8 N) B C: p
{
+ a6 ~4 N! [- u2 S/ A}* h8 n% F' u7 V8 j1 G
//------------------------------------------------------------------8 }5 L+ Y7 g* R' `* S
void __fastcall TForm1::FormCreate(TObject *Sender)
4 z1 ~+ J3 P+ i. I/ g/ D* L* l{2 q4 S5 S7 c1 Q5 n0 m' ~' }2 O9 k
RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//读取一个BIG5码的文件,可自己的情况设定" b& p* D g5 P3 e8 ]
}
$ F( }* t, n( Y9 l//-----------------------------------------------------------------; T( y8 `4 ~5 {* L
void __fastcall TForm1::Button1Click(TObject *Sender)- M: K+ o4 A* |) a" G
{& v0 }3 r% Y9 M
unsigned long i,address;//把BIG5码转换为GB码
& U6 n- y! x* H/ e+ y3 `( y8 ~: C unsigned char ch1,ch2;9 O+ u) t2 p, h; v! O
char *x;
: ?+ Z2 w$ ?8 e6 \% v$ u0 ~+ d x=RichEdit1->Lines->GetText();
2 R7 d# [+ k- h2 r; Q3 r i=0;+ M% [( Q4 m, z; V; p' o
while(x!='\0')$ o. r- s- z% }! ?7 ]. p, a- c+ c
{
; P" R, o" |4 y. k( c4 }6 `% e: N ch1=x;8 @) `/ P" A! q1 d2 g: F, p
if(ch1>=0xa1)
% s# o4 i8 l% e" |/ r {# ]* L& @4 m- }& x8 T
ch2=x[i+1];
- W7 Y# ?) |# H I, t$ ]( m9 D if(ch2>=0x40&&ch2<=0x7e)
8 \2 d% n( p0 P3 {7 ~ {1 \) f8 x' w7 Q+ X8 A/ V2 n- Y
address=ch1*314+ch2*2-33010;) o" W b5 S* B n+ l
x=tab[address];+ C8 y! c$ I4 B @6 w5 K+ ^7 N0 O" S
x[i+1]=tab[address+1];
! G6 b5 p: \$ p* \" k1 q }
' c; ^- A+ T3 N( Q8 b( U if(ch2>=0xa1&&ch2<=0xfe)4 I7 ?: t p7 O& T# T. G. u
{
3 i j( E* d0 A0 f. ` address=ch1*314+ch2*2-33078;
3 g9 S4 T% x0 ^ x=tab[address];
( X2 w2 `4 M" ~* j5 g) V0 V5 i/ @, W x[i+1]=tab[address+1];0 ]" {. o/ K1 r" {+ s
}
, ~2 D, |! R9 ?- C1 V: f' [ i+=2;
. j/ z6 U% L" j: Q" ^4 c7 _8 L5 V: f }
" j S& Y1 w; P# I S% M else' G$ O4 ^0 }5 h2 {) V
i++;; ]$ h0 t4 l& x0 \- s
}
) q `, Q4 l( S- E' R9 X, ^5 u W) N RichEdit1->Lines->Text=x;
" e3 D) x- L+ E7 U0 i RichEdit1->SetFocus();; m& V, p6 R7 w' }
RichEdit1->SelStart = 0;
- p! c5 E7 W7 \, N}
4 f. f1 s. L5 C& { 编译并执行它,首先你会看到RichEdit1中的BIG5码文件显示为乱码。按一下Button1,这时,你就会看到RichEdit1中的乱码变成了正常的汉字。好了,现在你自己编的软件也可以支持BIG5码了,是不是感觉更专业一些。GB->BIG5的转换方法也是类似的,有兴趣的朋友可以给我来信。最后,祝大家龙年愉快。本程序在WIN97,BCB3.0下编译通过。
9 a! U' M8 y. X( {# x; z</P> |
zan
|