返回
顶部

IT融合管理解决方案

1 项目需求分析

1.1项目背景

一般来说,国内的大型企事业单位的IT运维管理主要面临以下问题:

缺乏统一的网络管理平台

作为网络管理员,必须有效地了解网络中数据传输是否正常、服务器以及网络设备是否过载运行、局域网内部以及局域网与互联网的连接是否正常、局域网是否受到非法者的攻击、用户之间的数据传输是否正常等等,同时,在遇到网络时断时续、网络内部用户不能正常上网等网络故障时,必须能快速定位故障点并将其排除。由于网络之间的数据传输的不透明性,没有统一的网络管理平台,管理手段落后,网络管理人员很难及时准确完成上述要求。

服务器使用率低,缺乏有效统计数据作为依据来提高利用率

由于前些年网络和服务器使用意识的局限性,客户购买了大量的服务器来支撑新上马的业务服务,但在实际使用的过程中,相当一部分的服务器处于空闲状态,运维人员一直想着手解决服务器使用率低的问题,但因缺乏详细的统计数据而无从下手。

网络性能得不到充分发挥

由于没有网络性能方面的管理工具,网管人员缺乏对网络进行有效的调整和优化的依据。

如果没有一个有效而集中的工具进行管理和分析网络的运行趋势,找到隐藏的性能瓶颈,为网络系统管理的长期规划提供数字依据。将难以保证网络及各项业务应用在日后顺利运行。

机房动环设备亟待形成统一运维机制

目前机房所有动力环境设备都各自为政,温湿度探头,UPS等设备都无法及时的将状态和告警通知到相关运维人员。将其环境内的动力环境设备也同网络设备一样统一纳入运维机制,进行集中运维管控,告警,也是一个亟待解决的问题。

为即将建设的监控大屏系统提供全面但灵活的运维状态展现

客户计划在机房部署一套大屏系统用于整体运维的展现,让运维部门随时能够通过大屏快速了解运维整体状态,并达到运维部门需要的展示功能。

1.2管理需求

通过对目前IT系统环境和管理现状的分析,我们需要建设一套统一的网络和业务系统监控平台,这个平台应该包括以下的管理需求:

一步到位的搭建起先进的,符合客户业务需求的业务系统运维平台。建设统一、集中的管理体系,统一的数据处理,统一的告警平台。并通过统一的展现界面进行展现。

统一的中文界面,在实现技术成熟、先进,并具有较强的集成性和可扩充性的管理平台的同时要求易于使用和维护。

浏览器管理方式,提供多人同时通过浏览器就能轻松完成运维系统内全部工作。

以业务的角度将传统的技术设备的管理整合到基于业务的管理平台上来,不仅能完成对设备监控的需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈,预测业务发展趋势和稳定性。

实现对某种业务的服务水平管理。通过业务服务管理,可以对某种业务在过去一段时间内的运行状况有一个总体的评价和衡量。

实现IT资源管理和业务系统的关联,可以从业务的视角进行IT管理。当某台主机或者应用发生问题、产生告警时,系统管理员可以在第一时间发现该设备影响了哪个应用的正常运行。

解放人力,依靠智能化技术化的管理手段,快速定位故障,缩短故障发现时间,降低故障发生率,降低维护成本,并同时提高维护效率。

以丰富的报表方式统计现有设备的运行情况,为整合服务器资源提高设备利用率做出决策辅助。

对主机系统资源的占用比较少的情况下,实现对各种服务器(Linux、AIX、Windows2003等)监控管理。包括主机硬件、操作系统、文件系统、进程和应用等。主机监控的重点是对操作系统关键指标,如CPU、内存、进程、文件系统等进行全面的监控管理,要求不仅能够在状态改变或性能指标超越门限值时生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数据,以形成统计分析报表。

各种数据库(Oracle,Sqlserver等)监控管理,包括数据库的重要配置参数以及运行状况的监控。主要关注数据库的关键指标,如SGA使用率、表空间占用情况、锁竞争和使用情况、缓冲区命中率等。

其它应用的监控管理。比如IIS,Tomcat,Weblogic监控,重点保证服务的可用性和性能。

系统的自管理,包括系统自身的备份机制等,包括角色管理,权限视图管理,资源管理等。

2 业务运维管理平台解决方案概述

2.1系统平台构成

本技术方案建议书在充分分析客户IT管理系统技术需求的基础上,建议采用华胜天成科技股份有限公司的KoolPoint作为IT系统管理和业务运维支撑平台。

基于KoolPoint产品的业务运维管理平台解决方案是通过基础架构管理、应用管理、业务服务管理等多种先进管理功能,助力客户建立基于ITIL理念,立足客户核心服务的业务运维管理平台系统,实现自动高效低成本管理。

通过对客户业务运维管理平台系统功能分析的基础上,本方案建议采用KoolPoint产品以下功能模块:

  • 业务服务管理
  • 主机监控
  • 网络监控
  • 应用系统监控
  • 报告报表管理
  • 统一报警(邮件、手机短信)

2.2系统技术架构

基于KoolPoint产品的业务运维管理平台解决方案的技术架构拥有以下几方面的特性:

由于Java能轻易支持跨平台,KoolPoint可以Windows Server 2003 Enterprise SP2、Windows Server 2008 R2 Enterprise平台上运行。

基于Java 2 Enterprise Edition(J2EE)开发,符合现在受欢迎的主流技术。KoolPoint可以在Tomca的Java容器上运行。

采用标准Java Database Connectivity (JDBC), 支持广大的数据库,如MySQL、 Oracle 9i/10g等。

支持国际标准协议,如HTTP、HTTPS、JMX、SNMP、JDBC、Telnet、SSH、WMI等。

 

 

酷点的产品架构分为五个层次:

被监控层 –被监控资源包括主机、网络设备、数据库、中间件、存储、业务、机房、虚拟化/云、光传输、IP语音、软交换、安全等。

云平台 – 云计算环境上架设业务运维管理平台。

业务运维管理平台 – 通过4大引擎(资源自动发现、数据采集分析、数据关联、数据挖掘)将基础管理模块、业务服务管理、业务可持续性管理、容量管理、可用性管理有效整合。并提供各类专业工具以及整合第三方监控软件。  

IT运维管理层 –基于ITIL的最佳实践经验,帮助用户提高运维管理质量、效率。

统一展现层 – 直观、灵活Portlet;Dashboard;专业报表;VM可视化(Visualized Management)统一展现运维数据

2.3 系统部署架构

在本方案中,根据对客户IT系统现状的分析,建议采用以下的部署方式:

 

 

KoolPoint可以将所有组件集中部署在单台性能足够的服务器上,在本方案就建议先期采用该种方式部署。于此同时,Koolpoint具有分布式体系结构,可以将管理功能靠近被管资源,减少管理服务器通过广域网对整个网络进行轮询的检查,这在当网络不断发展,结构变得复杂的时候能防止由于管理给网络造成过多的负荷,保证正常应用的运行。

KoolPoint功能的模块化结构,保证了管理平台本身具有良好的功能扩展性。KoolPoint的分布式部属架构,保证了管理平台管理节点的良好可扩展性。

2.4平台承载需求 

序号

产品名称

配置及性能说明

数量

备注

1

KoolPoint 7.6.0

2*3.0GHz四核CPU 16GB内存; 146G硬盘以上;(含操作系统windows2003server sp2windows2008server r2

1

负责承载整个系统

3 业务运维管理平台解决方案详述

3.1网络设备管理

koolpoint的产品支持市场上大部分网络,安全,负载均衡设备,对极少不能支持的设备,现场实施人员可以使用模型开发工具,完成监控资源的二次开发。充分满足客户对于网络设备监控的需求。

网络设备监控支持全面:

 

 

通过对客户网络管理功能的需求分析,本方案通过Moch Network Focus从性能管理和可用性管理两个方面完成对于客户网络设备的管理。

性能管理通过Moch Network Focus自动定时轮询采集被管网元的性能数据,以图形的方式展现性能指标,并可根据用户需求来定义监测指标,可监测的性能指标有

  • 设备的CPU负载;
  • 设备的内存利用率;
  • 设备接口丢包率和错包率;
  • 设备接口的利用率;
  • 设备的端口流量;
  • 指定链路的延迟、可用带宽

Mocha Network Focus可用性管理通过SNMP和ICMP两种方式探测被管网元可用性状态、网络链路连通情况、设备之间的延时情况,并可通过监视指定链路的延迟、可用带宽来分析网络流量的瓶颈。

3.1.1网络拓扑发现

Mocha Network Focus(网络拓扑管理)能够快速的发现客户中二层和三层的网络设备,并根据发现设备之间的关系自动生成全局的二层或三层的网络拓扑结构图。KoolPoint自动发现时使用ICMP、SNMP(V1/V2/V3)、HSRP等网络协议和技术。网络管理人员能够看到整个运营网络系统的网络拓扑结构,包括各个分布地区的子网、各个子网之间的网络连接关系、及其每一子网上的资源。经过网络拓扑结构的生成后,可以在拓扑图上看到整个网络的拓扑结构图,并能直观地看到各个资源的状态变化。

当网络中的结构发生变化时,自动发现引擎能够迅速的发现并及时调整网络的拓扑结构图,保证了与实际网络状态的一致。

Mocha Network Focus可以自动发现以下信息:

  • 第二层和第三层网络设备
  • 网络协议,包括TCP/IP、Ethernet等
  • 设备包含信息(如卡、端口、接口、IP 和MAC)
  • 设备之间的物理和逻辑关系
  • 设备连接信息(如电缆、中继、网络连接和VLAN)

当自动发现完全网设备后,系统会自动绘制出全网的二层和三册拓扑链路,并自动根据网元类型以不同的图标展现,如下图所示:

在网络拓扑图上提供系统网络设备快照功能,点击设备即可在右下角的快照中查看所选中的设备的CPU和内存的近一时段的相关信息。同时点击快照,可以查看此设备的快照信息、下联物理设备和设备的物理信息。

同时针对每个设备提供下联设备的物理位置图,可以帮助管理员直观的了解到下联设备的具体状态。

 

通过对网络节点状态的轮询,Mocha Network Focus可以实时监控客户网络中所有资源的状态。拓扑图上所显示的各被管对象图标的左下角均会有一个状态灯来代表该网元当前的状态,如绿色表示用户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误,设备与设备之间的链路如果出现中断也会以红颜色提示。

3.1.2网络设备发现

在进行网络管理之前首先需要开启各个被监控网元的SNMP协议,并设置好SNMP Community。然后按照网元类型进行设备发现,如下图所示输入资源的IP地址以及SNMP Community:

 

3.1.3监控策略管理

在自动发现所有被管理网元后,可以通过定义监控策略来配置监控的频度、性能故障报警条件、故障告警的发送方式。本方案提供了方便快捷的批量设置方式,可批量设置多个网元的监控策略,只需要创建一个策略就可以同时赋予给多个被监控网元。如果某个网元的重要性较高,可以单独为该网元创建策略。

 

通过上述举例可以看到该策略应用于一个被监控网元,在指标定义中可以定义监控的指标项,进行指标超标的阈值设置及监控频度设定等。

 

 

在报警定义中定义报警产生的条件,报警发送的方式,接收人员角色等。

 

4 KoolPoint方案特色及优势

4.1开放的体系架构

KoolPoint灵活的管理体系,可以方便的实现与第三方管理产品的集成和整合。它提供了丰富的API开放接口,可以完全满足开发和与其它系统集成的需求。

4.2单一代理,资源占用少

KoolPoint代理软件MRAM进行系统管理时,采用单一代理程序的工作方式,只需一个代理程序即可实现多种管理,而不需要每一个管理功能运行一个代理程序。这种单一代理程序的工作模式,减少了系统管理对服务器的资源占用。

4.3安全的管理系统

KoolPoint充分考虑用户在安全方面的关切,采取众多措施来保证系统的安全性,包括:

 

 

  • 登录时间、登录用户失败次数限制。
  • 管理信息在KoolPoint各个组件之间传输时全部采用SSH加密保护。
  • 对数据库中的用户名、密码等敏感信息,全部采用不可反解的MD5加密存储。
  • KoolPoint采用严格的权限控制机制,细致划分了每个用户的管理范围和权限。

 

 

4.4灵活的权限控制

KoolPoint提供灵活、有效的权限控制,支持分级、分权的用户管理,支持设置用户角色和用户组。KoolPoint的系统管理员权限跟用户权限完全分开,管理员只有管理的权限没有使用权限,用户只有使用权限没有管理功能。不同的用户有不同的页面权限和资源权限,不同的用户不仅看到的页面可以完全不同,页面内的内容也可以完全不同。

4.5使用与维护简单

KoolPoint产品的全部为B/S架构,界面统一,使用门槛低,容易上手且维护简单,可以大大提高系统管理员的工作效率,降低维护工作量,降低培训成本和周期。

4.6良好的扩展性

KoolPoint全部采用模块化的功能结构,保证了管理平台本身具有良好的功能扩展性。KoolPoint的分布式部属架构,保证了管理平台管理节点的良好可扩展性。

5 相关成功案例

5.1客户收益和评价 

通过 Koolpoint 的实施和使用: 

自动巡检的无人值守管理 

Koolpoint 自动每隔一定时间对关键设备、主机的性能资源以及关键应用进程的运行状态和核心信息服务的可用性进行不间断的监视和判断。 

一旦发现所监视的对象出现性能异常或者存在不安全行为等紧急情况,Koolpoint 系统将根据预先设定的告警通知方式立即向不同的远程管理人员发送监视异常通知,如果管理员不能快速到达现场解决问题,还可以通过 Koolpoint 无线接入方式直接登录到 Koolpoint系统中来快速处理问题,从而实现真正意义上机房无人值守管理。 

从用户角度出发,切实为用户解决实际问题。 

Koolpoint通过网络拓扑帮助用户梳理网络环境,准确掌握局域网和广域网的互联情况,当链路不通或者发生切换时,迅速找出网络中存在问题的网络设备,触发告警,并通过网络拓扑图展现。   

摩卡软件切实的从用户的实际情况出发,本着以客户为中心的企业价值观,为用户解决了实际问题,得到了用户的好评。