- 在线时间
- 0 小时
- 最后登录
- 2007-9-23
- 注册时间
- 2004-9-10
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 9975 点
- 威望
- 7 点
- 阅读权限
- 150
- 积分
- 4048
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1893
- 主题
- 823
- 精华
- 2
- 分享
- 0
- 好友
- 0

我的地盘我做主
该用户从未签到
 |
< >BCB3.0中让TRichEdit支持BIG5内码
8 V7 q" \3 Z) k' W& L2 {6 ~陈寒秋</P>& Z, R2 @- b$ a
< >大家好,现在的软件如:Foxmail等软件,都有显示GB内码和BIG5内码的功能。我经过一段时间的摸索,发现了实现这种功能的方法。现在就来介绍给大家。首先,要给大家介绍一下这两种内码:大家都知道英文的ASCII码是用一个字节来表示的,但中文因为文字数量太多,所以只能用两个字节来表示。实际上我们常见的文本文件中保存的就是每个汉字对应的内码,而汉字的内码就是该汉字在中文字库中的逻辑位置。在中文字库中,该逻辑位置存放了这个汉字的图像信息,有了这些图像信息,就可以显示该汉字了,当然在现在的Windows中这个显示的过程是由操作系统自动来完成的,我们不必去关心它。但是由于一些历史上的原因,汉字的内码方案有两种,我们大陆地区使用的是GB码,而台湾省却使用的是BIG5码。GB码文件中保存的是汉字相应的GB编码,BIG5码文件中保存的是汉字相应的BIG5编码。而两种内码又都对应于各自的字库文件,所以当我们使用GB内码的简体中文Windows来看BIG5内码的文件时,就会产生常说的乱码现象。
& B% v# C6 B) N6 H t 由于我们是要显示BIG5码的汉字,所以再介绍一下BIG5码的编码方案:每个汉字由两个字节构成,第一字节的范围从0X81-0XFE,第二个字节的范围分别为0X40-0X7E,0XA1-0XFE。好了,知道了汉字显示的原理和BIG5码的编码方案,就可以很容易让TRichEdit支持BIG5码了。5 C9 ?5 e3 B. X
第一步:找一个用于内码转换的码表文件。. L( L- B* v4 d9 G' P7 @) o A r
我用的是CCDOS97里带的CCDOS.TAB,这个文件的大小为45840个字节。如果你没有这个文件,可以给我来信(<a href="mailtcnprogram@netease.com" target="_blank" >cnprogram@netease.com</A>)我会寄一个给你。当然你还可以根据BIG5码的编码方案自己做一个,这里就不多说了。7 ~/ a& i, U0 A* r
第二步:把码表文件转换成数组文件。见下面的程序。: h( h, p$ s# d& E2 E | X Q2 s) |
用BCB建立一个控制台应用程序。把它存为TABTOHEX.BPR和TABTOHEX.CPP。然后在TABTOHEX.cpp中添加以下代码:$ M& p8 p M$ f/ p
#pragma hdrstop, p& B& f) h9 v; y5 Z U
#include <condefs.h>0 h# V! v$ b# v& w* H: a
#include"stdio.h"
+ C( w q" ~' B4 n- ~' N#include"stdlib.h"
! d6 Q* ]9 O6 P#pragma argsused
- ~" E. `! Z" x9 n! k4 Cint main(int argc, char **argv), h8 _9 {1 J: T
{/ i% G2 C* N# z2 t% |" P
FILE *tab;! W( B! N- b8 C4 ]
FILE *hex;) t8 P& q1 K% W. w2 ~* y7 I v
int i=0;
8 T2 v6 e' i. b( T unsigned int ch;
4 @! }* E" X0 b+ Q' Y0 b tab=fopen("ccdos.tab","rb");//打开CCDOS.TAB文件. d8 D% w8 {6 {! v4 }8 L
hex=fopen("tab.h","wb");" x; f5 C4 Z- G- I$ S/ Y! V
fputs("unsigned char tab[45840]={",hex);- @4 W# S3 b9 C W3 o7 x" y
fprintf(hex,"\n"); w7 Q7 \; Y( h; Z# G& M9 Y! l
for(i=0;i<45840;i++)
4 b. V- ^* c- b- ] G) f& e {/ {. s% f& I$ I; I, e3 \
if(i%20==0)8 x& Z; i% K7 M- w
{9 }/ V) f& R9 e$ Q% c9 P. d U
fprintf(hex,"\n");
, w8 A* v& G p" x+ \ }
+ i4 D7 P+ ]+ D T, q: J' ? ch=fgetc(tab);( K5 g/ `& I- {) U5 N( g9 r
fprintf(hex,"0x%x\x2c",ch);//把码表文件转换为数组文件 J6 K& a4 `! Q9 x& I
}* a& k2 Q# g( H. d; B% T8 f4 X
fputs("0xff};",hex);
/ F/ P5 w' p( n. ?, t fcloseall();, Z7 p, d6 T' F6 t, z0 E5 s# H
return 0;. o! ~' R8 B o
}
8 H" u$ j* n/ n: R% t$ _9 g然后编译并执行这个程序,得到TAB.H文件。
, o5 ?& Q u" V8 d) b 第三步:在BCB3.0中新建一个标准的应用程序。添加一个TButton组件:Button1添加一个TRichEdit组件:RichEdit1适当调整它们的大小与位置。然后在Unit1.cpp中添加下面的代码:: y2 |3 q: A+ w& z- M
#include <vcl.h>
. r9 a, v* O4 K" D+ H& I#pragma hdrstop
. P6 \* `1 M) a4 s6 N#include "Unit1.h"$ h. R" v# i7 a5 H$ e" g
#include"tab.h"//把头文件TAB.H包含在内
' ^. b: D9 R5 w# I( S" b//-----------------------------------------------------------------% [! K! r: d9 h# }& R, T
#pragma package(smart_init)9 u! e8 j/ H0 `* n8 }- ?
#pragma resource "*.dfm"
7 G. m5 T: @% i$ e7 v0 q' x2 pTForm1 *Form1;
; B" A* K1 v% o S2 X' A0 j+ r: _//------------------------------------------------------------------
1 u2 a2 O+ @8 Z__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)7 X4 _0 B+ {7 v9 k) f( U
{# R0 A( z1 e C6 A6 c! i
}# ]+ b2 ^& }% B& n. ?# m! B! s
//------------------------------------------------------------------
5 ?0 t7 R# _" z; e3 ^. f Avoid __fastcall TForm1::FormCreate(TObject *Sender); }# X2 D m. g0 q* J! ]
{/ a' _5 A; W+ S; O
RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//读取一个BIG5码的文件,可自己的情况设定
8 U3 f7 n; x, S2 m) e2 i}
( D5 O# {4 @+ f0 S/ `) q//-----------------------------------------------------------------
4 A* w+ J8 s3 W5 B; z# E/ ?void __fastcall TForm1::Button1Click(TObject *Sender)8 d# n0 n1 Y7 o7 b$ }6 ~: _8 ?
{
* w0 \# e& ^2 k) R* l8 ^" l unsigned long i,address;//把BIG5码转换为GB码" ^5 W0 i; [; l3 E) w: [
unsigned char ch1,ch2;+ B6 a6 \) `6 c- u$ c
char *x;
2 ^0 O3 k- [( ~+ e }6 V x=RichEdit1->Lines->GetText();
! P2 @! G+ U) P9 x i=0;; q/ I; D1 g* ~7 ^$ b6 x0 G: [ t
while(x!='\0')
. R( G" M' v& Z {2 f" @+ t6 b, Y- c4 m# q, ?, e
ch1=x;# u) k9 a2 Q8 R1 O% [& S
if(ch1>=0xa1)2 t& U8 o! B. {# l; O/ o
{2 E; B- |8 t9 z$ a& \% P
ch2=x[i+1];% C$ R; E! a2 h3 @5 L
if(ch2>=0x40&&ch2<=0x7e)/ y4 T" R7 _; m8 i- ]
{
n0 q' ^3 j Y$ a& ? address=ch1*314+ch2*2-33010;' Z2 M8 j' U% v
x=tab[address];
3 E4 q9 n1 t6 Z. B u+ l x[i+1]=tab[address+1];
5 Y+ c8 y# s2 `' y0 r }
# @4 b0 I9 T- @7 ?1 g# t if(ch2>=0xa1&&ch2<=0xfe)8 f3 c: N x( r& O
{
7 z3 L" K1 Y1 i2 ^4 E6 ~7 { address=ch1*314+ch2*2-33078;4 w9 P, d* o' ?
x=tab[address];
1 b( S5 T$ Q6 u& t" e% f% F# r x[i+1]=tab[address+1];4 P! C8 h$ i: W* i! h
}
" u1 z. t8 f3 V! S8 { i+=2;; d2 m/ X: K5 |* l' d1 F
} h' V* Z4 ~0 ]. x/ x& ^( Y
else
( h4 ^. w1 v1 Q3 ^ i++;4 |/ ]* r* v& A2 A" ]% e: R
}
% M/ o5 ~: M; r9 Q) D- G1 v RichEdit1->Lines->Text=x;/ L0 D8 h! R6 P, ~0 r
RichEdit1->SetFocus();
+ O0 Y; H: o) q1 V RichEdit1->SelStart = 0;% P/ g: ^, ]5 e
}
- i- m* _4 Y1 M% t6 u/ d& b 编译并执行它,首先你会看到RichEdit1中的BIG5码文件显示为乱码。按一下Button1,这时,你就会看到RichEdit1中的乱码变成了正常的汉字。好了,现在你自己编的软件也可以支持BIG5码了,是不是感觉更专业一些。GB->BIG5的转换方法也是类似的,有兴趣的朋友可以给我来信。最后,祝大家龙年愉快。本程序在WIN97,BCB3.0下编译通过。
( ^2 }9 V0 d" w8 W( R, c! m</P> |
zan
|