IT故障管理:知错就改,不及有备无患

2019-04-16 03:56栏目:ca888圈外

IT故障管理:亡羊补牢,不如未雨绸缪

随着BYOD、云计算、大数据等新一代IT技术的发展,企业信息化应用变得更加得心应手,但IT运维管理的压力似乎并没有减轻,反而面临更大的挑战。对于IT运维主管来说,一场IT重大事故的发生,不仅会让部门员工士气低落,更容易让上层领导怀疑IT部门的领导力和执行力。因此,针对IT故障管理,更多希望改善自身状况的IT部门,开始选择主动性的事前管理模式,而非被动式的亡羊补牢。

英雄难过“故障关”

IT在很多时候都会充当幕后英雄的角色,可如今的职场生存环境,对心脏不强健的运维主管来说则是一个噩梦。

一方面,作为公司的最高管理者,他们希望IT的能力越来越强大,变成无形的力量,因为IT能消除公司内部的摩擦,并且削减每笔交易的成本。另一方面,你永远不要相信他们可以做到绝对的平衡,如果重大的系统故障给整体收益带来了影响,公司就会强调这个原因,强调公司发展受到了IT的拖累。

ca888会员登录,那么,IT故障是否能够彻底消除呢?答案是否定的。任何系统都有出现故障的时候,它可能发生在IT资产生命周期的任何一个时段,包括了硬件、软件和不可抗的自然因素。为此,企业必须要为自身定义一个可以接受的故障管理目标,将IT基础设施故障对业务的影响减到最小,并防止与这些错误相关的事故再度发生。

如果单从故障管理的目标来看,人们力求找到引发事故的根源,然后才着手改善或纠正该情况。“这种做法固然无错,但却没有行走在IT运维管理最佳的流程上。

对此,北塔软件表示:“故障管理的流程具有被动和主动两个方面。被动方面是作为对一个或多个事故的反应而解决问题,而主动的“故障管理”是指在事故发生前确定并解决问题和已知错误。所以说,即使你现在‘救火’的事情再忙、再多,也应当去思考,并且马上行动起来,因为这种工作状态非但不能给IT部门带来改变,反而陷入一个恶性循环当中。

“两步走”实现未雨绸缪

如今,企业的IT架构被多种新兴技术改造,并与业务深度融为一体。这带来了极度复杂的管理机制和故障发生机率,迫使IT部门不能满足于传统的故障识别及修复工作,而需要走在问题的前面。

未雨绸缪的益处世人皆知,但又要从何入手呢?针对这个问题,北塔软件建议用户采用如下两个步骤实现“质变”:

◆ 第一步:基础设施监控“泛化”

之前,由于网络的庞大和后续累加,你可能无法知道IT系统中每个关键应用承载设备在哪里,甚至不知道这些设备连接的应用在哪个端口上。这时的IT运维管理就等于“盲人摸象”,连最基本的“救火”都无法实现。所以,在这个阶段,便需要利用具备手动或自动发现功能的运维工具,迅速搜索整个网络内的所有节点,实现整个网络的真实物理拓扑图,实时反映出整个网络的运行状态。

需要注意的是,在云计算或虚拟化运行环境中,传统的运维工具已经无力支撑这个目标。此时,用户可以采用北塔BTIM等具备自动感知虚拟和物理环境的新一代运维平台,将虚拟交换机和虚拟机以“实体连接”的形式存在于监控场景中,自动追踪数据和虚拟机漂移后的性能指标。

◆ 第二步:业务管理“透明化”

一套业务系统的可用性,取决于每个基础设施对象之间的配合和稳定,但之前的基础监控数据对于整套业务系统又能起到什么帮助呢?

在完成全网监控的目标后,用户可以利用北塔BTIM自动对监控数据从业务角度归类整合,让所有业务关键参数醒目地投射到业务架构上,实时反映业务运行情况。业务视图的构建,可以对外向业务部门,对内给自身管理都提供透明化管理,能够非常清晰地反应出业务系统的健康指标。而透明化的监控业务系统运行起来之后,能够事前发现可能引起系统宕机故障,或者访问质量无法保障的问题,把可能发生故障的隐患消除在萌芽状态。

IT运维要给创新“留时间”

主动运维、事前运维,这些具体工作实际上都在围绕着“预防性检查(PM)”展开,旨在提高系统的可用性、稳定性。而IT部门的价值若想进一步体现,就不能总围绕“救火员”的角色。因此,未雨绸缪的最终目的还是解放人力。

对此,北塔软件表示:“追求IT创新不仅需要灵感,更要时间。用户还可以利用北塔BTIM中的‘业务仿真、自动巡检’等功能替代人力操作,主动找出可能会影响系统可用性和性能降低的原因。在这个平台上,看似是一张简单的业务管理门户图,但却可以紧密联合并改善IT与业务部门之间的关系,在沟通中激发IT创新的灵感。”

随着BYOD、云计算、大数据等新一代IT技术的发展,企业信息化应用变得更加得心应手,但IT运维管理...

IT运维管理在中国已经有着多年的发展历史,从最初的网络管理到现阶段的IT服务管理,更加远大的目标是业务服务管理。就国内绝大多数用户来着,其网络规模、信息化发展水平决定了还处于管理初级阶段,即IT基础设施的监控,管理好IT系统才能为了流程化地IT管理以及同业务相结合的管理打下基础和提供数据,而相对于这些用户,信息化程度较高的电信、金融、国家部委等机构的信息化程度却是发展迅速的,已经到了必须要实施流程化管理的阶段,因此如何满足用户的持续性发展IT管理需求,同时能够落地BSM理念,打造中国先进的BSM管理实践,用户和IT运维厂商都在摸索中前进着。

在国家“创新驱动”发展战略指引下,各个行业利用IT技术创新变革的情形四处涌现,虚拟化、云计算和大数据应用水平持续提升,自主可控的IT生态环境逐步完善。针对 “国产化”、“虚拟化”、“业务管理”等全新运维需求,以北塔软件为代表的国内IT运维厂商紧抓创新机遇,围绕用户应用需求构建新一代运维产品的功能,从而推动了广大企业用户运维服务水平的持续领先。

天玑科技全力打造IT资源管控平台

在国家“创新驱动”发展战略指引下,各个行业利用IT技术创新变革的情形四处涌现,虚拟化、云计算和大数据应用水平持续提升,自主可控的IT生态环境逐步完善。针对 “国产化”、“虚拟化”、“业务管理”等全新运维需求,以天玑科技为代表的国内IT运维厂商紧抓创新机遇,围绕用户应用需求构建新一代运维产品的功能,从而推动了广大企业用户运维服务水平的持续领先。

市场研究机构Gartner调查发现,在导致IT基础设施出现故障的原因中,源自技术或产品方面的因素其实只占了 20%,而因为运维管理方面的原因则占到80%,可见IT系统运维及管理是相当重要的。企业每年对IT部门投资都不少,但是得到的效益却没有体现,问题仍然时常发生,感觉好像所有的投入都打了水漂。

企业的IT运维部门是一个吃力不讨好的部门,因为IT运维就是在后台默默地保证信息系统的正常运行,只有在问题发生的时候才想到还有IT部门的存在。这种现象是由于IT运维管理还处于传统模式,即无相应的运维监控软件或者是仅仅单独使用某项监控软件而没有联合使用。这种传统的IT运维管理是被动的管理,是孤岛式的管理,是与业务应用没有联动的管理。

天玑IT资源管控平台是一套从IT基础设施到应用、从应用到业务、从监控到运维的自动化、集中化、全方位的智能监控、综合运维管理软件。

基于web的集中管理模式,遵循面向对象的设计结构,融合了网络、服务器、存储、数据库、中间件、应用、业务系统等各种被管对象的统一监控管理。只需简单配置,即可高准确率的自动发现需要监控的网络设备、服务器等被管对象。以拓扑图为中心,主动轮询网络设备、服务器、服务、应用等被管对象的运行状态、性能指标、配置指标,发现设备或业务系统隐患,即时告警,保障业务正常运转。对网络设备、服务器和服务的可用性、性能指标数据进行分析处理,为用户呈现直观易于理解的图表,发现问题及时运维,并记录运维日志。提高客户的IT管理效率、通过告警提醒和性能数据分析,确保被管对象和业务系统的正常运行。

功能特点:

- 统一资源管理:支持网络设备、服务器、中间件、数据库等多种被管资源,采用一致的监控和展示方式,降低管理复杂度。

- 网络拓扑发现:支持自动网络拓扑发现。

- 分布式性能数据采集:支持分布式采集大型网络的性能数据。

- 高频网络链路监控:高频率监控关键网络链路。

- 可扩展的体系架构:支持被管资源、采集方式、性能指标扩展,所需满足应用。

应用场景:

- 网络监控:帮助企业掌握整个网络的拓扑结构,跟踪网路设备、链路的运行状态及性能。及时发现和定位故障。保障网络的正常、高效地运行,为企业上层支撑系统提供健壮的网络环境。

- 系统管理:帮助企业掌握服务器、中间件、数据库等IT支撑软硬件系统的运行状态、性能。及时发现和定位它们的故障。保障这些系统正常高效地运行,为企业上层应用提供健壮的基础服务。

- 机房管理:机房动力环境是整个IT系统正常运行的基础。需要时刻掌握机房的温度、湿度、油、水、烟等情况,为IT系统提供一个稳定的基础环境。

- 综合运维:大中型企业面临系统多而杂、业务地域分布广泛的特点、需要统一的手段、集中管理各种设备、掌握它们的状态和性能、及时返现和定位问题。并能按照预定的响应机制和管理流程处理各种服务请求和故障。

在国家创新驱动发展战略指引下,各个行业利用IT技术创新变革的情形四处涌现,虚拟化、云计算和大数...

北塔软件作为业界的专业IT运维管理软件和服务提供商,成立八年来专注为中国用户解决实际运维难题。面向用户现阶段的业务管理需要,北塔软件于近期隆重推出了其全新的IT运维管理软件,基于BSM的IT综合管理平台—北塔BTIMBetasoft Integrated Management)。北塔BTIM是以业务价值管理为核心,强调企业对IT的全方位管理,并集北塔软件多年IT管理实践精髓于一体的综合管理系统。

全面国产化的“推力”

三层架构 彰显业务管理思路

“棱镜门”事件给蓬勃发展的中国信息化进程敲响了警钟。由于信息泄密的风险威胁并未消除,涉及国内公众信息或是行业机密的业务,必须挑选自主可控的硬件和软件产品,以保证国家的信息主权与信息安全。为了加速打造自控可控的IT产业链,我国政府在芯片、主机技术、网络设备、操作系统、数据库、中间件等多个领域进行了行业扶持,并在采购政策上调整力度非常之大。因此,许多用户原有的IT运维平台开始在两个方向调整:运维对象国产化和运维产品国产化。

在设计之初,北塔软件就认为真正落地的BSM管理工具应该从企业IT业务服务管理角度出发,切合行业的新技术,融合业务管理与IT管理,采用符合ITIL理念的思路,形成一套紧密贴合业务的综合一体化协同管理平台,管理平台通过直观的事前管理呈现、先进的根源因定位和智能联动分析,为用户IT管理提供全面综合管理解决方案。

对此,行内专业人士认为:“在关键系统以及核心领域中使用的国外产品,像是深埋在我国信息化系统中的“遥控炸弹”,给我国信息安全带来很大的隐患。“IT基础设施管理专家北塔软件则认为:”IT运维管理软件在企业网络架构中拥有绝对的超级权利,它可以在底层监控和收集网络中的所有信息,即使发生数据泄露,用户也很难发觉。另外,IT运维管理软件本身也会有升级,一旦厂商触及或接管运维系统的管理权,用户则很难保障核心数据不会造成泄露。“

版权声明:本文由ca888发布于ca888圈外,转载请注明出处:IT故障管理:知错就改,不及有备无患