ftp201heartbeat提示检测到自身失效但找不到备 机,不释放资源,ftp202heartbeat日志提示检测到主机 失效并接管资源;drbd状态显示两机都为第一资源,没 有备用资源;状态恢复后提示脑裂(Split—Brain),数据 同步失效;测试过程中服务器中断服务40秒。 5脑裂及恢复 在主备机失去联系的情况下(4.4描述的情况),主 机DRBD继续保持Primary状态,而备机heartbeat检 测到主机失效后接管资源会将DRBD状态转换为Pri— mary,当主备机重建联系后就会报告脑裂 (Split—Brain)。DRBD的脑裂是数据不一致状态的提 示,由于DRBD的数据流是从Primary到Secondary,两 个状态Primary的DRBD意味着两个Primary都可能 有数据修改,DRBD不知该以那个Primary的数据为标 准,在这种情况下需要指定以某个Primary为准,另外 一 个放弃修改的数据成为Secondary: (1)drbdadmsecondaryr0 (2)drbdadm———discard—my-dataconnectr0 (3)drbdadmconnectr0 前两条命令在备机上运行,最后一条命令在主机 上运行,命令1先将该服务器的DRBD状态修改为 Secondary,命令2确认放弃修改的数据,命令3确认该 服务器为数据源并把数据向另一台服务器同步。 如果主备机在失去联系的情况下,两机又都能同 时向外提供服务,则出现heartbeat脑裂,这是两台服 务器以相同的服务地址向客户机提供服务器,导致网 络严重混乱。本文中两台服务器不仅通过专用网线以 广播方式交换心跳,还通过服务网络以单播方式交换 心跳,如果发生主备机失去联系的情况,则也不能对客 户机提供服务,所以不会出现heartbeat脑裂。 6结束语 该方案在保证两台服务器之间的数据同步的基础 上解决了服务器单点故障威胁,仅在服务网络和心跳 线同时失效的情况下会发生服务中断,其它故障发生 时都能在极短时间内(/b于60秒)恢复服务,在发生中 断后也能在保证数据一致的前提下手动恢复服务器的 运行。本文提出的模型优点明显,费用低廉,适合在低 成本的环境下实施。我院使用该方案已近一年时间,再 没有遇到因FⅡ,服务器停机故障造成RIS、EMR系统 不可用故障。 |