数学建模社区-数学中国

标题: [转载]COFF文件格式(2) [打印本页]

作者: Blackbird    时间: 2005-9-17 13:59
标题: [转载]COFF文件格式(2)
<><STRONG>重要声明:本文乃转载自其他社区,由于在下无法获得任何有关作者和出处的信息,所以不能在此登出,恳请作者原谅,并希望知情者能告知在下。本着资源的共享的精神,在下深信作者不会拒绝在下的转载行为。同时强烈BS数学中国的下载系统,它不但不能及时给予他人需要的帮助,还浪费了他人大量的时间,仅仅是为了获得无聊的点数,而且遗憾的是,那些点数并不能保证你真能获得帮助!</STRONG></P>* D6 e4 F# O+ n
<>文件头<br>    文件头,自然是从文件的0偏移处开始,它的结构很简单。用C的结构描述如下:<br>typedef struct {<br>  unsigned short usMagic;  // 魔法数字<br>  unsigned short usNumSec;  // 段落(Section)数<br>  unsigned long  ulTime;  // 时间戳<br>  unsigned long  ulSymbolOffset;  // 符号表偏移<br>  unsigned long  ulNumSymbol;  // 符号数<br>  unsigned short usOptHdrSZ;  // 可选头长度<br>  unsigned short usFlags;  // 文件标记<br>} FILEHDR;<br>    结构中usMagic成员是一个魔法数字(Magic Number),在I386平台上的COFF文件中它的值为0x014c。如果COFF文件头中魔法数字不为0x014c,那就不用看了,这不是一个I386平台的COFF文件。其实这就是一个平台标识。<br>    第二个成员usNumSec是一个无符号短整型,它用来描述段落的数量。段落头(Section Header)的数目就是它。<br>    ulTime成员是一个时间戳,它用来描述COFF文件的建立时间。当COFF文件为一个可执行文件时,这个时间戳经常用来当做一个加密用的比对标识。<br>    ulSymbolOffset是符号表在文件中的偏移量,这是一个绝对偏移量,要从文件头开始计数。在COFF文件的其它节中,也存在这种偏移量,它们都是绝对偏移量。<br>    ulNumSymbol成员给出了符号表中符号记录的数量。<br>    usOptHdrSZ是可选头的长度,通常它为0。而可选头的类型也是从这个长度得知的,针对不同的长度,我们就要选择不同的处理方式。<br>    usFlag是COFF文件的属性标记,它标识了COFF文件的类型,COFF文件中所保存的数据等等信息。</P>
3 k" {5 l# I% ?9 Z" e<>具体数值和说明请见下表:</P>6 k7 i* y, n3 J0 E9 Y; m
<>
: D& a$ ~# x1 M4 i<TABLE borderColor=#cccccc cellSpacing=2 cellPadding=2 width="100%" align=center bgColor=#ffffff border=1>% l5 S& @  S2 t! h

6 M5 \/ y$ z% S! s4 R<TR>
' k# e5 M$ T" R8 L7 M0 J; h: |) {<TD>2 h4 I/ Z; ]  A
<>值</P></TD>! e) f3 O0 o1 h$ Y  N2 C  j$ A6 L5 ?
<TD>- }  h. a" G  h7 g" N' V
<>名称</P></TD>
* v/ z% D" r; `# h7 z<TD>' C0 G' E. Y& Q- K% c
<>说明</P></TD>
, E$ T8 r, r2 C2 P3 |<TR>
8 Z: c% ?; [! h8 Z<TD>$ J4 `. t3 W" R4 N: \
<>0x0001</P></TD>. g  l2 |1 P# @% C! s
<TD># M8 S# J: f! q7 |$ {
<>F_RELFLG  </P></TD>
" x4 C3 b& ~& Y5 H<TD>! k# g1 P% Z7 X( z2 P
<>无重定位信息标记。这个标记指出COFF文件中没有重定位信息。通常在目标文件中这个标记们为0,在可执行文件中为1。</P></TD>% y! n$ P/ {7 Q4 P1 h
<TR>
1 t( N0 y. w5 ]0 x3 u<TD>
. _7 ~- |3 y$ G- j<>0x0002</P></TD>
% p- o+ K1 C* r<TD>& `- t! O! ~$ E; N
<>F_EXEC</P></TD>
# o" O$ C0 D* O4 ?8 u<TD>* v) ~; k2 {6 ?3 M( I3 K- \' l1 e
<>可执行标记。这个标记指出 COFF</FONT> 文件中所有符号已经解析, COFF</FONT> 文件应该被认为是可执行文件。</P></TD>
- e' o2 l' {3 a) H7 a<TR>
: h8 Q9 I% i2 t4 d. H<TD># ^$ J$ q+ \2 R$ f' @. ]
<>0x0004</P></TD>
& C# P" U: {) L2 Y  z4 m( j  D3 m  T<TD>6 ^2 R6 u! y# |; s! Q* P0 j" ]
<>F_LNNO</P></TD>
$ ]1 y! V$ Y3 G<TD>
. X4 N' z% C: H  I$ J<>可执行标记。这个标记指出 COFF</FONT> 文件中所有符号已经解析, COFF</FONT> 文件应该被认为是可执行文件。</P></TD>
& U$ b2 D) B/ k# ~: `( i3 c# v4 c# x<TR># `0 z. i6 G( y6 P
<TD>1 q, f1 n0 S2 r, t. _  h
<>0x0008</P></TD>
" S* s; o' E+ i, j1 q  Z<TD>0 f! [  d( w4 F) F- i
<>F_LSYMS</P></TD>* \& I; l7 P3 e: H' O2 J) m. d
<TD>/ j  q8 ~8 \8 _7 [7 z
<>文件中的符号信息已经被去掉。</P></TD>
. k9 ]$ d& L, o<TR>* i% o6 S& D% ~+ V$ g" ?
<TD>. P8 r8 e/ F  f0 t6 H$ i
<>0x0100</P></TD>. ?/ |  Q  f3 y, x, K2 s
<TD>$ D) {$ q8 r% g5 Z5 Y! A' R' K
<>F_AR32WR</P></TD>
1 s9 A9 g+ F! z0 J- q0 U- m5 j<TD>) c% x) V. O- B4 ?& Y) U, z/ H
<>些标记指出文件是 32 位的 Little-Endian COFF文件。</P></TD></TR></TABLE></P>
8 D1 H$ K* i/ C0 M" Q6 E<>注:Little-Endian,记不得它的中文名称了。它是指数据的排列方式。比如:十六进制的0x1234以Little-Endian方式在内存中的顺序为0x34 0x12。与之相反的是Big-Endian,这种方式下,在内存中的顺序是0x12 0x34。<br>这个表的内容并不全面,但在目标文件中,常用的也就只有这些。其它的标记我将在以后介绍PE格式时给出。<br>可选头<br>    可选头接在文件头的后面,也就是从COFF文件的0x0014偏移处开始。长度可以为0。不同长度的可选头,其结构也不同。标准的可选头长度为24或28字节,通常是28啦。这里我就只介绍长度为28的可选头。(因为这种头的长度是自定义的,不同的人定义的结果就不一样,我只能选一种最常用的头来介绍,别的我也不知道)<br>这种头的结构如下:<br>typedef struct {<br>  unsigned short usMagic;  // 魔法数字<br>  unsigned short usVersion;  // 版本标识<br>  unsigned long  ulTextSize;  // 正文(text)段大小<br>  unsigned long  ulInitDataSZ;  // 已初始化数据段大小<br>  unsigned long  ulUninitDataSZ;  // 未初始化数据段大小<br>  unsigned long  ulEntry;  // 入口点<br>  unsigned long  ulTextBase;  // 正文段基址<br>  unsigned long  ulDataBase;  // 数据段基址(在PE32中才有)<br>} OPTHDR;<br>    第一个成员usMagic还是魔法数字,不过这回它的值应该为0x010b或0x0107。当值为0x010b时,说明COFF文件是一个一般的可执行文件;当值为,0x0107时,COFF则为一个ROM镜像文件。<br>    usVersion是COFF文件的版本,ulTextSize是这个可执行COFF的正文段长度,ulInitDataSZ和ulUninitDataSZ分别为已初始化数据段和未初始化数据段的长度。<br>    ulEntry是程序的入口点,也就是COFF载入内存时正文段的位置(EIP寄存器的值),当COFF文件是一个动态库时,入口点也就是动态库的入口函数。<br>    ulTextBase是正文段的基址。<br>    ulDataBase是数据段基址。<br>    其实在这些成员中,只要注意usMagic和ulEntry就可以了。</P>( d0 c) Q! D+ Z  u# m0 j
[此贴子已经被作者于2005-9-17 14:50:44编辑过]

作者: cupidvenus    时间: 2005-9-23 13:27
学习




欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5