返回
顶部

远程容灾解决方案

xx医院核心业务系统容灾改造解决方案

 

 

一、前言

您为什么要构建不间断的业务系统?

随着社会的发展和科技的进步,IT 系统架构也变得越来越复杂和相互关联,企业越来越依赖于数据处理来进行业务运营,对IT系统的依赖性也随之增加。IT 系统的可用性直接决定着业务的可用性。宕机会给企业带来生产力和销售等方面的损失,如果宕机频繁发生,还可能影响到企业的信誉。 同时,企业的数据信息亦是企业最宝贵的财富之一,一旦数据由于某种原因丢失,就有可能造成整个组织在运营上的极大不便和经济损失。如果核心数据丢失,严重时完全有可能造成整个企业的瘫痪。所以保证企业的业务连续运营及数据处理的高可靠性和高可用性,就成为所有 IT 人员在建设IT基础架构中首先要考虑的问题。然而,企业的IT系统正存在以下风险及挑战:

用户需要实时应用与访问机密、关键数据,向企业的服务提出更高的要求;

无法预知的IT硬件设备的损坏,造成数据丢失或业务的突然中断;

难以避免系统人员由于误操作造成的意外宕机或关键数据的丢失;

手段频多的黑客攻击、病毒入侵、垃圾邮件、网络与系统的漏洞,造成网络瘫痪、系统崩溃;

传统的双机热备份技术存在存储单点故障风险,存储故障将导致业务中断或数据丢失;

行业与政府的标准与法规的不断变化,进一步增加了企业的压力与成本。

因此,我们需要建立和加强企业的数据及业务恢复计划,以便在发生系统故障后仍然能够保证数据的7X24小时的连续访问,保障业务的连续运行,从而实现系统高可用性,让您的企业从容管理风险,同时提高服务水平 及客户满意度。

 

二、现状分析

 

XX医院目前部署有多套核心业务系统,分别运行在IBM小型机和PC服务器上,小型机和PC服务器均使用了高可用集群模式且数据存储在磁盘阵列外,。以现有的IT架构支撑XX医院的信息化运营,目前能适应业务增长及系统高可用,但数据安全及业务系统的高等级可用性存在一定的隐患。从拓扑图上能清晰的看到,整个架构具有一些隐患,具体体现为以下几点:

基于两台IBM P550小型机的HIS系统和基于IBM X3850X5服务器的LIS与PACS系统均通过高可用集群软件实现了主机间的故障切换,具有一定的高可用性,但在集群架构中磁盘阵列存在单点故障,一旦磁盘阵列损坏或故障,数据将会有不可用和丢失(丢失程度依据备份策略和备份时间而言)的可能性;

服务器都采用了传统应用集群部署方式,实现了一定的高可用和负载均衡。但是试想,当数据库或业务系统以及服务器硬件、机房等由于种种原因出现问题,甚至灾难或宕机。此时,业务系统也随之停顿,这种情况给医院带来的经济和信誉的损失是非常巨大的。因此,在一切正常的时候就必须使用一种合适的灾备方案,防患于未然;

我公司根据XX医院目前的IT架构现状进行深入分析和考虑以后的长远规划,特制定一个结合XX医院实际情况的容灾解决方案供各位领导参考。

 

三、容灾方案

 

 

通过IBM 小型机AIX操作系统中的LVM功能建立双存储的镜像关系,保证在不中断业务的前提下完成数据的完整镜像备份,并能在迅速恢复系统。类似于将2套存储做了一个RAID1,从而有效的进行了数据保护做到了双服务器双存储的全冗余,消除了存储单点故障。同时利用EMC MirrorView进行基于存储硬件级的实时数据同步,在容灾机房里再搭建一套与现有HIS同样的软件环境,若主设备出现问题不能正常工作则可以手动将HIS在容灾端启动,从而快速的恢复业务,将对业务的影响降到最低。

HIS、LIS和PACS系统数据则通过基于EMC存储的远程容灾软件--EMC MirrorView进行基于存储硬件级的实时数据同步。EMC MirrorView 可确保数据在发生系统和站点故障时受到保护。它利用 EMC VNX存储系统的强大威力,提供同步和异步远程镜像功能。无论是在本地还是在全球范围内镜像数据,MirrorView 均可提供在发生停机事件时保护最关键数据的灾难恢复功能。

如果按照传统的应用部署方式,一个应用一台服务器的话,需要部署多台服务器,以后每增加一台应用系统就需要增加一台物理服务器。在容灾机房利用现在最流行的VMWARE服务器虚拟化技术,将1台服务器虚拟成多台服务器使用,实现数据中心机房的环保节能同时减少未来在服务器硬件上的投入。利用VMware对服务器进行整合,并最大限度的利用服务器硬件资源。以后万一要增加新的测试服务器或者老的业务系统及特殊软件由于现有硬件不兼容无法迁移安装或者有业务系统急于上马但等待审批新的服务器周期又太长等等原因,都可以利用VMWARE的服务器虚拟化技术迅速的解决。

3.1. 优点

1)实现业务快速回复、数据零丢失

双服务器和磁盘存储系统,免费集成LVM(LVM 技术是 AIX 操作系统中的缺省技术,只需要少量的实施费用),全面实现数据高可用性; 

零停机时间,业务不中断。无论是生产磁盘阵列还是灾备磁盘阵列发生问题,都不会应用停顿,也不会导致业务中断。

跨磁盘阵列镜像还可以通过调整读写机制,提高系统的读写性能。

完整的、自动的本地数据保护方案,能满足数据长期保存的需求,为面向灾备的解决方案

极大提高了数据的安全性和业务的连续性,消除了存储系统的单点故障。

对于HIS、LIS和PACS系统则需人工干预,在容灾端设置服务IP后手动将业务系统启动,此过程也只需要10~30分钟即可完成,而且数据基本上与生产系统的一致。

跨磁盘阵列镜像一旦发生灾难,修复后,跨阵列的可以实现增量的数据同步,而不需要重新同步所有数据,对系统的影响极小。

存储系统对在有限距离内执行同步远程镜像,从而提供完整灾难恢复,而不会造成数据丢失

2)利用VMWARE服务器虚拟化技术大大降低TCO

利用VMWARE虚拟化技术,通过服务器整合,控制和减少物理服务器的数量,明显提高每个物理服务器及其CPU的资源利用率,从而降低硬件成本。

降低运营和维护成本, 包括数据中心空间、机柜、网线,耗电量,冷气空调和人力成本等。

3)利用VMWARE服务器虚拟化技术提高运营效率

加快新服务器和应用的部署,大大降低服务器重建和应用加载时间。

主动地提前规划资源增长,这样对客户和应用的需求响应快速,不需要象以前那样,需要长时间的采购流程,然后进行尝试。

不需要象以前那样,硬件维护需要数天/周的变更管理准备和1~3小时维护窗口,现在可以进行快速的硬件维护和升级。

节省了资金投入,在预算紧张无法及时购买新的服务器但又需要增加新的业务系统时,只需在VMWARE虚拟系统中增加一个虚拟服务器像平时在物理服务器上安装新系统即可。

4)旧硬件和操作系统的投资保护

不再担心旧系统的兼容性,维护和升级等一系列问题。

VMware vSphere 虚拟化软件大大提高了服务器的灵活性和利用率;降低运行成本和管理成本。

3.2. 缺点

前期费用投入较多,需要购买服务器虚拟化软件—Vmware VSphere、新的服务器、新的小型机、新的容灾存储、建设新的容灾小机房、铺设新的裸光纤;

小型机的AIX LVM镜像技术需要2套存储,可以使同品牌的也可以是异构不同品牌的的,建议使用同品牌同结构的存储以保证性能和稳定性。

系统管理员需要学习VMWARE服务器虚拟化及EMC MirrorView 的一些管理维护知识

对现有IT架构需做一些小改动,需要对IT架构做一些规划调整(比如网络规划及设置)。

需要铺设新的裸光纤进行存储数据传输,同时对光缆的质量要求较高

需要多方的配合(应用系统厂商、系统管理员、机房管理员、集成服务商)

3.3. 实施难易度:较容易

1)最核心的HIS系统采用IBM小型机AIX系统的LVM方案,用户不必改变现有环境,也不存在数据集中迁移的问题,而且业务系统保持实时在线即可完成同步操作;但需要停HA集群进行一下LVM的信息同步即可正常集群自动切换。

2)不存在系统接管、应用重新启动等问题,可以实现系统的平滑过渡而不中断业务;

3)对于基于EMC MirrorView技术的容灾需要在新的容灾存储上对存储空间重新规划配置然后再同步数据

4)对于同步后的LIS和PACS系统数据需要在VMWARE虚拟化环境中重新安装配置从而能在主机房的系统出现问题时能正常启用容灾端的LIS和PACS系统。

3.4. 需要购买设备

新的EMX容灾存储、EMC存储容灾软件包、新的IBM高配置服务器、新的SAN交换机、VMware服务器虚拟化软件、新的容灾机房设备、铺设新的裸光纤、建设新的小机房(如果没有的话)

3.5. 推荐指数 :5颗星