竞赛:| 全国大学生数模竞赛 | 全国研究生数模竞赛 | 全国大学生电工数模竞赛 | 美国"MCM/ICM" 竞赛 |
 资讯:| 数学理论 | 交叉学科 | 基础教育 | 考研数学 | 学术动态 | 编程交流 | 网络安全 | 经验技巧 |
 下载:| 数 学 篇 | 算 法 篇 | 建 模 篇 | 编 程 篇 | 数 据 篇 | 软 件 篇 | 考 研 篇 | 交叉学科 |
 视频:| 大学数学 | 大学英语 | 计 算 机 | 法律课程 | 政治课程 | 经济管理 | 数学建模 | 高考数学 |
 功能:| 矩阵论坛 | 学校协会 | 挑 战 赛 | 人才招聘 | 数学问吧 | "MC"理工浏览器 | "MCQ"即时通讯 |

 
会员中心
社区论坛
加入收藏
联系我们
您现在的位置: 数学中国 >> 资讯无限 >> 计算机技术 >> 编程交流 >> 正文
【字体:           ★★★
 
COM组件设计与应用
作者:佚名    文章来源:本站原创    点击数:    更新时间:2006-10-26

COM组件设计与应用(三)
数据类型

作者:杨老师

一、前言
  上回书介绍了GUIDCLSIDIID和接口的概念。本回的重点是介绍 COM 中的数据类型。咋还不介绍组件程序的设计步骤呀?咳......别着急,别着急!孔子曰:饭要一口一口地吃;老子语:心急吃不了热豆腐,孙子云:走一步看一步吧” ...... 先掌握必要的知识,将来写起程序来才会得心应手也:-)
  走入正题之前,请大家牢牢记住一条原则:COM 组件是运行在分布式环境中的。比如,你写了一个组件程序(DLLEXE),那么使用者可能是在本机的某个进程内加载组件(INPROC_SERVER);也可能是从另一个进程中调用组件的进程(LOCAL_SERVER);也可能是在这台计算机上调用地球那边计算机上的组件(REMOTE_SERVER)。所以在理解和设计的时候,要时时刻刻想起这句话。快!拿出小本本,记下来!


二、HRESULT 函数返回值
  每个人在做程序设计的时候,都有他们各自的哲学思想。拿函数返回值来说,就有好多种形式。
 

函数

返回值

返回值信息

double sin(double)

浮点数值

计算正玄值

BOOL DeleteFile(LPCTSTR)

布尔值

文件删除是否成功。如失败,需要GetLastError()才能取得失败原因

void * malloc(size_t)

内存指针

内存申请,如果失败,返回空指针 NULL

LONG RegDeleteKey(HKEY,LPCTSTR)

整数

删除注册表项。0表示成功,非0失败,同时这个值就反映了失败的原因

UINT DragQueryFile(HDROP,UINT,LPTSTR,UINT)

整数

取得拖放文件信息。以不同的参数调用,则返回不同的含义:
一会儿表示文件个数,一会儿表示文件名长度,一会儿表示字符长度

......  ......

...

......  ......

  如此纷繁复杂的返回值,如此含义多变的返回值,使得大家在学习和使用的过程中,增加了额外的困难。好了,COM 的设计规范终于对他们进行了统一。组件API及接口指针中,除了IUnknown::AddRef()IUnknown::Release()两个函数外,其它所有的函数,都以 HRESULT 作为返回值。大家想象一个组件的接口函数比如叫Add(),完成2个整数的加法运算,在C语言中,我们可以如下定义:

      long Add( long n1, long n2 )

      {

          return n1 + n2;

      }

  还记得刚才我们说的原则吗?COM 组件是运行在分布式环境中的。也就是说,这个函数可能运行在地球另一边的计算机上,既然运行在那么遥远的地方,就有可能出现服务器关机、网络掉线、运行超时、对方不在服务区......等异常。于是,这个加法函数,除了需要返回运算结果以外,还应该返回一个值------函数是否被正常执行了。

      HRESULT Add( long n1, long n2, long *pSum )

      {

          *pSum = n1 + n2;

          return S_OK;

      }

  如果函数正常执行,则返回 S_OK,同时真正的函数运行结果则通过参数指针返回。如果遇到了异常情况,则COM系统经过判断,会返回相应的错误值。常见的返回值有:
 

HRESULT

含义

S_OK

0x00000000

成功

S_FALSE

0x00000001

函数成功执行完成,但返回时出现错误

E_INVALIDARG

0x80070057

参数有错误

E_OUTOFMEMORY

0x8007000E

内存申请错误

E_UNEXPECTED

0x8000FFFF

未知的异常

E_NOTIMPL

0x80004001

未实现功能

E_FAIL

0x80004005

没有详细说明的错误。一般需要取得 Rich Error 错误信息(1)

E_POINTER

0x80004003

无效的指针

E_HANDLE

0x80070006

无效的句柄

E_ABORT

0x80004004

终止操作

E_ACCESSDENIED

0x80070005

访问被拒绝

E_NOINTERFACE

0x80004002

不支持接口


图一、HRESULT 的结构

  HRESULT 其实是一个双字节的值,其最高位(bit)如果是0表示成功,1表示错误。具体参见 MSDN "Structure of COM Error Codes"说明。我们在程序中如果需要判断返回值,则可以使用比较运算符号;switch开关语句;也可以使用VC提供的宏:

      HRESULT hr = 调用组件函数;

      if( SUCCEEDED( hr ) ){...} // 如果成功

      ......

      if( FAILED( hr ) ){...} // 如果失败

      ......

三、UNICODE
  计算机发明后,为了在计算机中表示字符,人们制定了一种编码,叫ASCII码。ASCII码由一个字节中的7(bit)表示,范围是0x00 - 0x7F 128个字符。他们以为这128个数字就足够表示abcd....ABCD....1234 这些字符了。
  咳......说英语的人就是!后来他们突然发现,如果需要按照表格方式打印这些字符的时候,缺少了制表符。于是又扩展了ASCII的定义,使用一个字节的全部8(bit)来表示字符了,这就叫扩展ASCII码。范围是0x00 - 0xFF 256个字符。
  咳......说中文的人就是聪明!中国人利用连续2个扩展ASCII码的扩展区域(0xA0以后)来表示一个汉字,该方法的标准叫GB-2312。后来,日文、韩文、阿拉伯文、台湾繁体(BIG-5......都使用类似的方法扩展了本地字符集的定义,现在统一称为 MBCS 字符集(多字节字符集)。这个方法是有缺陷的,因为各个国家地区定义的字符集有交集,因此使用GB-2312的软件,就不能在BIG-5的环境下运行(显示乱码),反之亦然。
  咳......说英语的人终于变聪明一些了。为了把全世界人民所有的所有的文字符号都统一进行编码,于是制定了UNICODE标准字符集。UNICODE 使用2个字节表示一个字符(unsigned shor intWCHAR_wchar_tOLECHAR)。这下终于好啦,全世界任何一个地区的软件,可以不用修改地就能在另一个地区运行了。虽然我用 IE 浏览日本网站,显示出我不认识的日文文字,但至少不会是乱码了。UNICODE 的范围是 0x0000 - 0xFFFF 6万多个字符,其中光汉字就占用了4万多个。嘿嘿,中国人赚大发了:0)
  在程序中使用各种字符集的方法:

      const char * p = "Hello"; // 使用 ASCII 字符集

      const char * p = "你好"; // 使用 MBCS 字符集,由于 MBCS 完全兼容 ASCII,多数情况下,我们并不严格区分他们

      LPCSTR p = "Hello,你好"; // 意义同上

     

      const WCHAR * p = L"Hello,你好"; // 使用 UNICODE 字符集

      LPCOLESTR p = L"Hello,你好"; // 意义同上

     

      // 如果预定义了_UNICODE,则表示使用UNICODE字符集;如果定义了_MBCS,则表示使用 MBCS

      const TCHAR * p = _T("Hello,你好");

      LPCTSTR p = _T("Hello,你好"); // 意义同上

  在上面的例子中,T是非常有意思的一个符号(TCHARLPCTSTRLPTSTR_T()_TEXT()...),它表示使用一种中间类型,既不明确表示使用 MBCS,也不明确表示使用 UNICODE。那到底使用哪种字符集那?嘿嘿......编译的时候决定吧。设置条件编译的方式是:VC6中,"Project\Settings...\C/C++卡片 Preprocessor definitions" 中添加或修改 _MBCS_UNICODEVC.NET中,"项目\属性\配置属性\常规\字符集"然后用组合窗进行选择。使用 T 类型,是非常好的习惯,严重推荐!

四、BSTR
  COM 中除了使用一些简单标准的数据类型外(注2),字符串类型需要特别重点地说明一下。还记得原则吗?COM 组件是运行在分布式环境中的。通俗地说,你不能直接把一个内存指针直接作为参数传递给COM函数。你想想,系统需要把这块内存的内容传递到地球另一 的计算机上,因此,我至少需要知道你这块内存的尺寸吧?不然让我如何传递呀?传递多少字节呀?!而字符串又是非常常用的一种类型,因此 COM 设计者引入了 BASIC 中字符串类型的表示方式---BSTRBSTR 其实是一个指针类型,它的内存结构是:(输入程序片段 BSTR p = ::SysAllocString(L"Hello,你好");断点执行,然后观察p的内存)



图二、BSTR 内存结构

  BSTR 是一个指向 UNICODE 字符串的指针,且 BSTR