12 / 2 页下一页

查看: 10028|回复: 19

[B题] 一种新型的网络层心跳探测方案

[复制链接]

字体大小: 正常放大

huashi3483

1253 主题	443 听众	-516 积分

复兴中华数学头子

TA的每日心情

	开心 2011-9-26 17:31

签到天数: 3 天

[LV.2]偶尔看看I

自我介绍: 数学中国网站（www.madio.cn）是目前中国最大的数学建模交流社区

群组: 越狱吧

群组: 湖南工业大学数学建模同盟会

群组: 四川农业大学数学建模协会

群组: 重庆交通大学数学建模协会

群组: 中国矿业大学数学建模协会

电梯直达

1^#

发表于 2010-4-16 20:00 |只看该作者 |倒序浏览

|招呼Ta 关注Ta |邮箱已经成功绑定

贾娟，汪斌强时间:2008年02月25日

摘要：针对路由器高可用性系统中心跳探测模块的常见问题，提出一套新型基于网络层自动调频的心跳探测方案。该方案采用双心跳线，结合动态调节探测周期的方法，并在网络层中实现。
关键词：高可用性心跳网络层

计算机网络已经成为现代社会生产和生活的基础设施，而核心路由器作为网络的关键结点，能否保证服务的可靠性和稳定性是一个极为重要的问题。核心路由器一般承担着骨干网的运营，如果发生致命故障，将导致大面积网络的瘫痪，造成的直接经济损失也是巨大的。
　　一般的解决方法是采用双机热备的主从切换方式，如CISCO的HRSP协议所介绍的一种方法，由一台active路由器和standby路由器组来承担高可靠性。而本文讨论的是核心路由器如何解决主备主控板的切换来保证高可靠性的问题。这样就产生了一个问题，即如何设计一种及时且准确的探测机制来发现主控板故障，这是能否实现主备切换的基础。
本文就已有的心跳（Heartbeat）探测机制存在的优点和不足进行讨论，并设计了一种基于网络层的可自动调频心跳保障模型。
1 Heartbeat介绍
　　Heartbeat网络是故障发生时系统间的通信通道。简单地说，系统通过心跳网络进行周期性的问候信息交流。系统在正常情况下，备用处理器发送信息询问主用处理器的健康状况，主用处理器同样发送心跳探测包来确定备用处理器是否随时处于等待状态。如果备用处理器在限定的周期内未收到主用处理器的探测包，则表明主用处理器发生故障，它会自动接管主用处理器的IP地址和各种应用服务，成为新的主用处理器。当失效处理器恢复正常后，重新发状态信息给新的主用处理器，要求其成为备用处理器。
　　现有的心跳网络连接方式多借助于RS232串行线路和以太网方式。由于心跳网络相对于整个网络所传输的数据量要小，但对其可靠性要求很高，即零丢包率，否则连续的数据丢失会引起对方处理器误认为其宕机。因以太网价格低廉、应用广泛、不需要特殊的电缆和硬件设备，所以通常被推荐用来实现心跳网络。此外其他网络介质也没有其传输可靠性高。对于传输大量数据流的情况，推荐使用快速传输网络，但是心跳数据信息相对较小，现有Heartbeat探测主要存在以下问题。
　　(1) 硬件问题造成的误判
主从双处理器的设计目的是为了避免SPOF（单点故障）造成停机。而心跳线同样可以成为SPOF。当处理器收不到对方的心跳信息时，故障原因分为两种，一种是主处理器软硬件的故障；另一种可能是心跳线路自身的故障。对于前一种情况确实应该触发主备切换措施，而第二种情况可能会造成系统误判而进行主备切换，主备处理器切换必然要造成路由器短时间的异常工作，所以确定故障的原因比较困难。
　 (2) 心跳周期难以设定
作为判断故障的心跳模块自身必须可靠稳定，所以一般设计比较简单。而心跳周期长度一般采用人为设置，但是这个周期是否合理？即是否可以及时发现故障，且其发送探测的频率过高又不会造成多余的系统负担。以上两个相互制约的因素都是高可用性要考虑的问题。
在实际应用中，心跳网络一般处于变化的请求服务中，如果系统采用固定心跳周期，有可能弱化系统的可用性;如果周期过短，处理器需要频繁处理心跳探测数据，影响了系统的效率；如果周期过长，在故障发生时，从处理器可能没有及时发现探测心跳未到达而延误触发主备切换模块，造成的网络瘫痪更与高可用性的要求背道而驰。
(3) 心跳链路采用套接字以TCP/UDP方式的传输机制造成较大的时延
作为对实时性和可靠性有双重要求的心跳链路，多数方案都在应用层利用SOCKET以UDP或TCP报文方式实现心跳协议。其中UDP报文比TCP报文简短，正好符合心跳协议的要求。由于UDP没有拥塞控制，所以心跳网络如果出现拥塞，UDP会丢弃一些数据包，但不会影响处理器发送心跳的速率，同时也带来不可靠传输的问题。如果网络在拥塞情况下会丢失一些数据包，这对于零丢包率的心跳检测将造成很大影响。
　　在传输速率问题上，无论对于TCP还是UDP的套接字，实现方式都在应用层实现，即心跳报文要经过传输层、内核及接口，并受到应用层任务切换的影响，这样会导致切换时间长达数秒，难以满足实时性的要求。
　　在可靠性问题上，如果是单对心跳网络，则可以对探测包进行编号，并利用判别机制裁决。忽略收到非连续编号的数据包的情况，判断因为心跳网络拥塞所致，而不影响心跳信任级别的周期。但如果采用双心跳线网络，在两条链路上同时出现拥塞情况的可能性较小，因而避免了由于不可靠传输造成的误判。
2 自动调频双心跳保障模型设计方案
根据上述在心跳探测技术中出现的问题，笔者提出一种基于网络层的自动调频双心跳保障方案。此方案流程如图1，图中的报文类型见表1。

在路由器启动后，两块处理器均属于初始状态，这时尚未确定active和standby。首先仅在一条心跳线上启动主备协商机制。要求主备协商机制要简约，因为在这里没有必要设计复杂的算法选出主用。因而采取比较两处理板IP地址大小的判决方法，通过互发心跳探测报文，比较IP ADDR值，较小的为主处理器，进入active状态；较大的为备用处理器，进入standby状态。
在确定了主备用地位的同时，向对方通告自己的身份。这时启动双心跳线，备用一方发送心跳探测报文监控主用的工作是否正常；主用收到探测报文进行回复。备用在工作时要根据主用发送回复的周期值，计算出系统最合适的心跳探测频率，后文将详细介绍。为了避免由于心跳线发生故障造成的误判，如果备用只收到来自一条心跳线的回复报文，则由故障判别机制来确认主用工作正常。
报文类型：00为主备协商报文，DATA域携带处理器IP地址；01为主备确定报文，DATA域携带裁决结果；10为心跳探测报文，standby→active，要求active给确认；11为心跳回应报文，active→standby，告诉standby自己正常。
2．1 双心跳网络探测机制及故障辨别机制
　　分别由两个进程各自控制两条心跳线路上的心跳数据发送，由故障判别机制判断处理器的工作状态。例如，若从处理器收到来自两条链路的心跳信息，则判断主处理器为正常工作状态；若从处理器只收到一条链路上的心跳信息，则判断主处理器工作正常，且心跳线故障，不触发主备切换模块；若从处理器未收到任意一条线路的心跳信息，则判断主处理器失效，触发主备切换模块。此设计虽然增加了实现的复杂性，但却解决了实际工程中接口松动等问题造成的系统误判和不必要的消耗。双心跳网络探测机制如图2所示。

在功能实现上，故障判别机制和传统定时器的作用是相同的。对于传统定时器方式：在处理器未收到对方的心跳信息时，启动定时器，在所设置的时间内仍没有收到信息，判断为处理器失效，这时由于等待deadline可能已经延误了主备切换的时间。
由于本方案采取冗余心跳网络，对于一条心跳链路来说，如果处理器未收到心跳信息，则进入故障判别模式，询问另一条心跳线是否收到心跳信息；如果结果一致，则迅速启动主备切换。这样可以减少不必要的等待时间，也可以避免由于线路拥塞造成的误判。
2．2 分级的自适应周期设计
针对心跳周期难以设定的问题，采用了一种自适应周期的设计。其原理是：首先设定高、中、低三种心跳信任级别的周期:1s、3s、5s。心跳频率调节原理如图3所示，通过最近发生的N次心跳求其平均值Tr与三个级别相比较，以确定其下一阶段采用的心跳频率。这样可以根据实际网络运行的情况实现高可用性。

2．3 基于网络层的心跳传输机制设计
由于以往的心跳传输基本采用TCP或UDP方式，在实现中必须遵从TCP/IP协议信息处理的层次流程，使实时性的要求无法保证。为了缩短处理时经过的层次，设计了一种基于网络层的心跳传输方式。
　　心跳模块工作层次结构图如图4所示。心跳模块与上层应用完全分隔开，它处于链路层和网络层。通过在链路层对帧头的类型字段的检查，区分出心跳报文与IP报文。如果是IP报文，则送入上层协议栈；如果是心跳报文，则进入心跳报文队列，并触发一个中断，通告心跳模块进行处理。以往通过应用层的心跳信息必须通过插口层再到应用层进行处理，这个过程要经过路由、选径、报文确认等一对一地心跳传输中所不必要的步骤，增加了网络的开销，更降低了传输效率。

　　以上设计的方案在ACR路由器的主控支撑软件主备切换模块中，已成为心跳探测机制工作中关键的一环。实践证明，此方案不仅在发现故障上实现了最低延迟，同时将误判率降至最低，为主备切换做好了基础性工作。从而为保证系统可靠性提供了前提。但在实现时增加了系统的复杂性，因此如何设计一个高效、准确且实用的心跳协议仍是双机热备系统设计中需认真考虑的关键问题之一。
参考文献
# x6 Q: A& b. q* j% e8 B* D[1] 尹康凯，王明伟，李善平.高可用性机群中多个节点的心跳模型研究.计算机工程,2005.
[2] David Patterson,Aaron Brown, Pete Broadwell. Recovery oriented computing(ROC): motivation,definition,techniques,and case STUDIES[R].Technical Report CSD-02-1175,UC Berkeley,2002.
[3] Sameer Srivastava. Redundancy management for network devices. 2003. IEEE
[4] Evan Marcus,Hal Stern. 高可用性系统设计.北京：清华大学出版社，2005.
[5] John L H, David A P. Computer architecture: A quantitative approach[M].北京：机械工业出版社, 2002.

zan

转播0 淘帖0 分享0 收藏0 支持1 反对0 微信

数学中国网站是以数学中国社区为主体的综合性学术社区，下分建模、编程、学术理论、工程应用等版块。从2003年11月建站以来一直致力于数学建模的普及和推广工作，目前已经发展成国内会员最多，资源最丰富，流量最大的数学建模网络平台。我们始终秉承服务大众的理念，坚持资源共享、共同进步的原则，努力营造出严肃、认真、务实、合作的学术氛围，为中国数学的发展做出应有的贡献。

使用道具举报