- 在线时间
- 0 小时
- 最后登录
- 2007-9-23
- 注册时间
- 2004-9-10
- 听众数
- 3
- 收听数
- 0
- 能力
- 0 分
- 体力
- 9975 点
- 威望
- 7 点
- 阅读权限
- 150
- 积分
- 4048
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 1893
- 主题
- 823
- 精华
- 2
- 分享
- 0
- 好友
- 0

我的地盘我做主
该用户从未签到
 |
< >BCB3.0中让TRichEdit支持BIG5内码
" X D3 L" X8 w5 y陈寒秋</P>. `6 P5 N' h( x
< >大家好,现在的软件如:Foxmail等软件,都有显示GB内码和BIG5内码的功能。我经过一段时间的摸索,发现了实现这种功能的方法。现在就来介绍给大家。首先,要给大家介绍一下这两种内码:大家都知道英文的ASCII码是用一个字节来表示的,但中文因为文字数量太多,所以只能用两个字节来表示。实际上我们常见的文本文件中保存的就是每个汉字对应的内码,而汉字的内码就是该汉字在中文字库中的逻辑位置。在中文字库中,该逻辑位置存放了这个汉字的图像信息,有了这些图像信息,就可以显示该汉字了,当然在现在的Windows中这个显示的过程是由操作系统自动来完成的,我们不必去关心它。但是由于一些历史上的原因,汉字的内码方案有两种,我们大陆地区使用的是GB码,而台湾省却使用的是BIG5码。GB码文件中保存的是汉字相应的GB编码,BIG5码文件中保存的是汉字相应的BIG5编码。而两种内码又都对应于各自的字库文件,所以当我们使用GB内码的简体中文Windows来看BIG5内码的文件时,就会产生常说的乱码现象。
; p/ t6 a2 \$ J- t4 f! ? 由于我们是要显示BIG5码的汉字,所以再介绍一下BIG5码的编码方案:每个汉字由两个字节构成,第一字节的范围从0X81-0XFE,第二个字节的范围分别为0X40-0X7E,0XA1-0XFE。好了,知道了汉字显示的原理和BIG5码的编码方案,就可以很容易让TRichEdit支持BIG5码了。
$ ~( B z" L- F8 C 第一步:找一个用于内码转换的码表文件。
# K% h5 o/ |9 N |- b0 R0 n% ` 我用的是CCDOS97里带的CCDOS.TAB,这个文件的大小为45840个字节。如果你没有这个文件,可以给我来信(<a href="mailtcnprogram@netease.com" target="_blank" >cnprogram@netease.com</A>)我会寄一个给你。当然你还可以根据BIG5码的编码方案自己做一个,这里就不多说了。2 t# A! v6 X, q6 V% A( m. X1 t# ?) [
第二步:把码表文件转换成数组文件。见下面的程序。
5 G1 y# k0 }. F 用BCB建立一个控制台应用程序。把它存为TABTOHEX.BPR和TABTOHEX.CPP。然后在TABTOHEX.cpp中添加以下代码:! W. p) w! M$ ~# Y H- c
#pragma hdrstop5 k- D/ p( F* O& `
#include <condefs.h>6 n1 |; e: T& _# m1 A0 a
#include"stdio.h"
: w# X0 R3 M7 S+ k- K. Q: q#include"stdlib.h"
" a' q) D* j0 [. g( {' m4 m3 {#pragma argsused
& T: [4 `, Y, N5 R: P' Z6 Aint main(int argc, char **argv)
) _" S" l# G8 z# c* G{
o/ k+ G4 O1 M5 l [0 ^7 l8 ?0 l FILE *tab;6 K! |; K5 p9 T( Y1 I0 V
FILE *hex;3 U2 W& U" w& I) V
int i=0;) V; f5 c+ Z) z
unsigned int ch;3 `- L1 O0 _. i) h( s' n
tab=fopen("ccdos.tab","rb");//打开CCDOS.TAB文件& o( ?: G& y _( c% t) {
hex=fopen("tab.h","wb");
2 J: Z* y1 \3 r% Z% y fputs("unsigned char tab[45840]={",hex);
# Y8 e! Q8 s) ^ @0 A" O" o( J fprintf(hex,"\n");
" l4 F/ K$ s( d! x9 G8 _- _ for(i=0;i<45840;i++)7 R4 X1 }( n6 S' K) @
{) B; D& M8 p' x4 u! L
if(i%20==0)# {" {3 N& d6 ]6 }2 v
{ [7 _) [6 n3 ]- E
fprintf(hex,"\n");
" J+ `/ J7 m! B, v }
$ K5 p4 {& g' r7 E ch=fgetc(tab);
0 b, C1 a: O( S5 M0 ]: n) }( W fprintf(hex,"0x%x\x2c",ch);//把码表文件转换为数组文件9 ?8 [5 ^2 x# }. W3 g3 I$ d
}
, Z+ {3 j `/ ?8 [- Q fputs("0xff};",hex);4 {0 A& F7 Q8 E* [& J5 l
fcloseall();
' v9 o; ]; S& |, W9 k( p return 0;5 [9 h$ H7 C8 s1 y$ I, I' i% f" q. R7 i
}
% v6 K/ u: u' N8 V3 M1 m% q7 ?然后编译并执行这个程序,得到TAB.H文件。
" G9 b8 F. O! V* {; x& T, b8 c% G 第三步:在BCB3.0中新建一个标准的应用程序。添加一个TButton组件:Button1添加一个TRichEdit组件:RichEdit1适当调整它们的大小与位置。然后在Unit1.cpp中添加下面的代码:' H* [8 T+ p9 X
#include <vcl.h>
3 I; U E* P- b6 ^+ u#pragma hdrstop& o& K! z% F3 V! \! F; F/ e
#include "Unit1.h"5 x, T9 k; D* _; T8 O1 P
#include"tab.h"//把头文件TAB.H包含在内+ i6 n6 p4 ~5 M$ M1 z- h
//-----------------------------------------------------------------
/ c7 b5 X9 F1 w& W/ {( Y#pragma package(smart_init)
: r T$ S: y, {! u; {: L#pragma resource "*.dfm"- x6 W4 _2 o% `4 D
TForm1 *Form1;6 b1 J, x \+ v/ \; Q- q% {
//------------------------------------------------------------------7 T. d- J, b8 J j8 k% i6 Z
__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)
( c6 ~2 r7 k# C& i) o8 N{
! b' A* W% ]/ H4 F! }# S/ T}
. Q3 n9 `( C# S* U4 r//------------------------------------------------------------------# X. g4 I. P6 O
void __fastcall TForm1::FormCreate(TObject *Sender)
6 m) ^$ _) p. E: i$ A$ P$ t{
0 p7 C/ K% f( q RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//读取一个BIG5码的文件,可自己的情况设定5 A$ I0 E' c, _/ ^* e
}
) y5 j6 k& J, D4 N* E7 K//------------------------------------------------------------------ E. N' t8 @/ r. H; }
void __fastcall TForm1::Button1Click(TObject *Sender)4 }5 ]9 x; F* V) J
{7 X, k6 y3 v7 |2 p& q
unsigned long i,address;//把BIG5码转换为GB码2 D0 G2 }1 k. G0 X4 @
unsigned char ch1,ch2; j; P' }: P9 m/ z$ h
char *x;1 E1 c) Y. M8 u' u* J
x=RichEdit1->Lines->GetText();, w# f8 M+ X$ z$ w2 J1 m
i=0;) F5 U* ?' j; v8 x5 y
while(x!='\0')
; x @5 {5 e, j) p. ]. n {! }7 a7 v- M1 l, ~
ch1=x; G6 F5 s K; x/ V/ O+ D
if(ch1>=0xa1)3 t1 E4 R" I9 c, U$ c
{
% T6 y5 `* X6 F6 m ch2=x[i+1];
" }( `' i$ r7 J" T: D' F) j4 Y2 i if(ch2>=0x40&&ch2<=0x7e)
: v* M3 A8 H$ R) q O4 P' ~ {5 Z. `1 l0 [$ T' d' Z
address=ch1*314+ch2*2-33010;" E) v6 Z, x& F5 C, |8 {
x=tab[address];7 G: s+ g8 s3 s3 l- ?8 ~4 s) i% D
x[i+1]=tab[address+1];
0 a( `" |3 j1 T$ P3 [& Z }
' x/ ?; O; r& p if(ch2>=0xa1&&ch2<=0xfe)6 Y: J- w% B, p* \/ w* i
{
( z: |/ y) q7 u& [/ r+ h0 j address=ch1*314+ch2*2-33078;0 Z4 n: |" w2 z' i7 K4 V
x=tab[address];
5 I) _& c* i; _4 o) @ x[i+1]=tab[address+1]; ?* a3 M1 f1 S: o4 F
}
1 e9 o( S1 @2 W- \2 z/ H i+=2;
; B1 s$ M2 u- j; d1 k& ^! n5 q }
. h4 G2 \' _1 Y$ l, q else) m$ X8 W8 m W4 P7 M
i++;
7 s; ?0 B: O e4 `$ u }8 U+ i) Z- g4 q0 o6 t3 g7 v2 M6 Y
RichEdit1->Lines->Text=x;# d! B9 S K1 ]# F; Y" Y8 f. r
RichEdit1->SetFocus();) N0 z+ g- L3 O
RichEdit1->SelStart = 0;
1 v5 W" n5 x+ l) C}$ _2 M% H0 c9 d* C
编译并执行它,首先你会看到RichEdit1中的BIG5码文件显示为乱码。按一下Button1,这时,你就会看到RichEdit1中的乱码变成了正常的汉字。好了,现在你自己编的软件也可以支持BIG5码了,是不是感觉更专业一些。GB->BIG5的转换方法也是类似的,有兴趣的朋友可以给我来信。最后,祝大家龙年愉快。本程序在WIN97,BCB3.0下编译通过。7 z) h, w/ r' d) p0 g4 e& J, E
</P> |
zan
|