- 在线时间
- 0 小时
- 最后登录
- 2007-9-23
- 注册时间
- 2004-9-10
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 9975 点
- 威望
- 7 点
- 阅读权限
- 150
- 积分
- 4048
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1893
- 主题
- 823
- 精华
- 2
- 分享
- 0
- 好友
- 0

我的地盘我做主
该用户从未签到
 |
< >BCB3.0中让TRichEdit支持BIG5内码
8 m$ H. Q1 ?9 r1 k s陈寒秋</P>+ ?; l1 }' _. h1 [5 z6 ^
< >大家好,现在的软件如:Foxmail等软件,都有显示GB内码和BIG5内码的功能。我经过一段时间的摸索,发现了实现这种功能的方法。现在就来介绍给大家。首先,要给大家介绍一下这两种内码:大家都知道英文的ASCII码是用一个字节来表示的,但中文因为文字数量太多,所以只能用两个字节来表示。实际上我们常见的文本文件中保存的就是每个汉字对应的内码,而汉字的内码就是该汉字在中文字库中的逻辑位置。在中文字库中,该逻辑位置存放了这个汉字的图像信息,有了这些图像信息,就可以显示该汉字了,当然在现在的Windows中这个显示的过程是由操作系统自动来完成的,我们不必去关心它。但是由于一些历史上的原因,汉字的内码方案有两种,我们大陆地区使用的是GB码,而台湾省却使用的是BIG5码。GB码文件中保存的是汉字相应的GB编码,BIG5码文件中保存的是汉字相应的BIG5编码。而两种内码又都对应于各自的字库文件,所以当我们使用GB内码的简体中文Windows来看BIG5内码的文件时,就会产生常说的乱码现象。
7 u! }8 M( o5 {" C 由于我们是要显示BIG5码的汉字,所以再介绍一下BIG5码的编码方案:每个汉字由两个字节构成,第一字节的范围从0X81-0XFE,第二个字节的范围分别为0X40-0X7E,0XA1-0XFE。好了,知道了汉字显示的原理和BIG5码的编码方案,就可以很容易让TRichEdit支持BIG5码了。
2 Q) H8 Q' ~% r0 p 第一步:找一个用于内码转换的码表文件。
; n3 h4 c! P# e+ V- Q' q+ Q: C 我用的是CCDOS97里带的CCDOS.TAB,这个文件的大小为45840个字节。如果你没有这个文件,可以给我来信(<a href="mailtcnprogram@netease.com" target="_blank" >cnprogram@netease.com</A>)我会寄一个给你。当然你还可以根据BIG5码的编码方案自己做一个,这里就不多说了。' y4 W! l7 R1 w& {
第二步:把码表文件转换成数组文件。见下面的程序。2 K" k9 z% W) o" s2 N# x- E5 I3 g3 i
用BCB建立一个控制台应用程序。把它存为TABTOHEX.BPR和TABTOHEX.CPP。然后在TABTOHEX.cpp中添加以下代码:
3 a/ Z i$ B1 k& b#pragma hdrstop
+ X; t! E- P& ]) n, m+ }) i! q3 U1 r; P#include <condefs.h>
3 X5 D0 L3 d1 A; }8 G0 H# W#include"stdio.h"# N$ K0 L+ y* P7 q d
#include"stdlib.h": G# B8 N/ B# ^! x
#pragma argsused
W0 j' I: u D s" {int main(int argc, char **argv)
; Q" D- W- g, I7 q9 a+ V{
: G- t2 p7 j& `# s8 ~# u FILE *tab;0 @7 g9 ^- E7 R$ L0 S! N t
FILE *hex;1 m! j" ~, M' k. c# p' Z
int i=0;- h7 @5 _9 K3 R8 A1 T$ S v/ {$ G$ R" i
unsigned int ch;
, [- U! Z* O4 D+ {0 A! J; m tab=fopen("ccdos.tab","rb");//打开CCDOS.TAB文件, ]% ~8 ?8 y' H6 u" V9 Q. X& C
hex=fopen("tab.h","wb");2 f8 [, g `5 d- }6 p
fputs("unsigned char tab[45840]={",hex);0 l+ Y; B0 l, I! E( O' r
fprintf(hex,"\n");; h1 z! K2 _! V8 {
for(i=0;i<45840;i++)* a! T0 J8 I- \/ I6 h7 e
{
2 p* f# Z; n: R5 L1 ?0 \ if(i%20==0)
, c R/ C# B+ t {
2 X4 u" o4 @* s* {1 `! h0 \ fprintf(hex,"\n");
; u; e8 a+ y: L$ h g# K }1 T# [: }- }/ z" `
ch=fgetc(tab);8 l3 V6 w0 C- L9 o/ n
fprintf(hex,"0x%x\x2c",ch);//把码表文件转换为数组文件
" X' P9 f$ s" {4 ` }
$ k6 L4 x8 g) U fputs("0xff};",hex);
9 F5 A$ t4 i% a9 d9 q0 W! p! X6 j fcloseall();
: A" _; e* n2 D9 @5 R# j return 0;
5 Q' E( c3 ` v5 u3 U}6 o/ m+ P' w( h y0 O5 T! L5 r
然后编译并执行这个程序,得到TAB.H文件。
& {, k% j- X @9 a3 X+ n9 G8 E* d 第三步:在BCB3.0中新建一个标准的应用程序。添加一个TButton组件:Button1添加一个TRichEdit组件:RichEdit1适当调整它们的大小与位置。然后在Unit1.cpp中添加下面的代码:& E2 F! n. f1 W* \
#include <vcl.h>! P4 `$ D5 i7 V! k E; d& q
#pragma hdrstop
- r4 h) z1 |8 E. V#include "Unit1.h". W+ @' u% v* T/ p
#include"tab.h"//把头文件TAB.H包含在内
8 i" c% H2 o$ L9 j" P//-----------------------------------------------------------------6 F1 T& w! {* X! ^
#pragma package(smart_init)
5 b6 }) m& x6 U#pragma resource "*.dfm"/ q6 V: ^% O* ]: X
TForm1 *Form1;
3 z( q+ t g0 k9 F% T0 M# Z- f9 E//------------------------------------------------------------------: B" [8 |& t% [7 F: D
__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)
4 f0 O7 m& P+ Z4 W{
3 Z/ j. X: J) E/ ?/ t3 W1 X- w}0 p4 N9 B6 N) g% A0 \. H
//------------------------------------------------------------------3 e* D3 o, G+ t6 x6 }* v u
void __fastcall TForm1::FormCreate(TObject *Sender)5 }, G6 N" s3 x: \+ }5 q
{7 B/ r/ c; H4 u2 Z% J. b+ ]1 H
RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//读取一个BIG5码的文件,可自己的情况设定
3 l1 G6 V5 M+ Y" O! R- w; J}
0 C! ?( x% u) K, ~, g: v4 m: U! [# r//-----------------------------------------------------------------
& L+ K, @) G+ L3 D/ V0 T# a2 nvoid __fastcall TForm1::Button1Click(TObject *Sender)( Q9 V: C. k0 V
{
8 i) M0 s& Z" U3 @- B0 [ T3 n9 ? unsigned long i,address;//把BIG5码转换为GB码
. Y5 S+ z% w; }. [% X1 b0 A- I unsigned char ch1,ch2;
/ @) E1 E% ]# S6 I x$ g# N4 r char *x;! E I' p' {9 Y" a, A4 X) X
x=RichEdit1->Lines->GetText();
1 a* h- I5 p+ _! z- v; T, i i=0;- Z/ v' P* W6 U( O3 M
while(x!='\0')
. S' f9 U3 m; E/ p" Q) N/ X3 k { s* M1 E! y0 m) f& I, A8 B6 v
ch1=x;
! R! o( j# i* ` if(ch1>=0xa1)
& K' K) s, _1 ?. | {
5 H6 j) g; a$ M) z ch2=x[i+1];/ T. d! {+ E" f9 J; z6 y
if(ch2>=0x40&&ch2<=0x7e)
$ J7 w& _* ~ l% Z/ I7 v2 ]; F: t {
4 W7 {3 c% g5 c7 X' p address=ch1*314+ch2*2-33010;
6 a5 I0 h. |* x' { @1 K x=tab[address];
s e- H/ {/ g8 x6 g8 P* j x[i+1]=tab[address+1];, u1 U7 h7 F3 R( D
}
6 ~( J1 o- x. e+ X: F: e: X if(ch2>=0xa1&&ch2<=0xfe)
! Z$ ~2 d$ @5 r/ c" z! Q' o5 V) I {
6 J% I0 G* h. @1 _7 L0 J address=ch1*314+ch2*2-33078;
" i5 a* K3 |0 m) \- s1 c x=tab[address];( f4 d- a& T6 j0 }0 |, i6 _
x[i+1]=tab[address+1];" S/ s6 w/ ^ y6 K1 o3 Z" U
}, o6 k( z d% Y; G9 O7 B/ V8 ]
i+=2;
- q; s, z: M& F. N! x4 K }
, Z) A k* Z. |! Q) X; E$ f% _ else- b7 ]1 Y% P- H/ V: L
i++;) d4 b5 c9 K8 u0 @8 l$ u
}
7 y( y' c8 k5 p) d RichEdit1->Lines->Text=x;/ H: s; M, y8 f8 J) Z. [
RichEdit1->SetFocus();
9 t5 K2 B$ U, ?2 ] RichEdit1->SelStart = 0;
+ j$ h& r2 v- ?1 c3 u) {}
' O9 Q( u8 p- r 编译并执行它,首先你会看到RichEdit1中的BIG5码文件显示为乱码。按一下Button1,这时,你就会看到RichEdit1中的乱码变成了正常的汉字。好了,现在你自己编的软件也可以支持BIG5码了,是不是感觉更专业一些。GB->BIG5的转换方法也是类似的,有兴趣的朋友可以给我来信。最后,祝大家龙年愉快。本程序在WIN97,BCB3.0下编译通过。 F: t3 ~9 W# q" v& _- ^
</P> |
zan
|