端到端APM应用性能的管理观,服务保障变革IT运营

来源:http://www.smjxgs.com 作者:服务器&运维 人气:175 发布时间:2019-08-14
摘要:如我们所知,行业观察家一直在抱怨 IT管理。他们预言高科技孤岛的优势、毫无意义的讨论会议以及表现不佳的应用性能,将会为故障排除带来阻碍并导致用户投诉升级。虽然IT运营经

如我们所知,行业观察家一直在抱怨 IT 管理。他们预言高科技孤岛的优势、毫无意义的讨论会议以及表现不佳的应用性能,将会为故障排除带来阻碍并导致用户投诉升级。虽然IT运营经理想将重点放在为终端用户或客户提升服务,然而类似于虚拟化、云计算和移动性等技术已经迫使其必须更快地采取服务保障策略。

如何高效运营it项目呢?成为很多it项目管理者经常被问到的话题,也是需要其认真思考问题。倘若你it项目效率没办法提升,上级领导和客户对您的it团队不是很满意,不妨看看一些it项目管理者是如何通过这五步如何高效运营it项目呢?

ITIL实践解读:端到端APM应用性能的管理观(1)

问题和事件管理是 APM 的两个核心 ITIL信息技术基础架构库,简称 ITIL)流程。事件管理Incident Management)是当IT 出现问题的时候解决它们,作为对服务质量降低的一种响应。事件管理的目标是恢复服务,对业务造成尽可能小的影响。问题管理Problem Management)强调识别和消除问题的根源。它通过改变服务和 APM 解决方案,增加了服务质量改进的概念。

端到端应用性能管理End-to-end Application Performance Management,简称APM)指的是 一种 IT 服务方法,包括识别、区分优先次序以及解决影响业务应用的性能和可用性问题。APM 正在变得越来越重要,因为终端用户依赖日益复杂的应用来实现关键业务交易。应用性能低下将降低生产力,影响客户满意度,并有损 IT 声誉,进而导致成本攀升、收入减少、IT 变得效率低下——这些问题通常比可用性问题更加严重。

传统的监测解决方案通常无法识别和解决应用 性能问题的根源。事实上,最近在终端用户体验监测、依赖性映射和相关性方面的最新进展,已让 IT 运行经理能够更有效地监测和解决不满足服务水平的问题。这些技术帮助提高对整个网络、服务器分布式和大型主机)和其它应用层的可视性,借助技术分析因果 关系,从业务的角度确定哪些响应该优先进行。实际上,即使基础架构测量指标仍然提供主要的故障和容量数据,强调重点也已从基础架构测量指标变成了业务测量 指标。

我们将撰写一系列应用性能管理最佳实施的文章,从问题和事件管理的视角剖析 APM。

本文将首先概括地讲述 APM 设计、实施和运营的基本要素,将端到端 APM作为一个流程来进行探讨。

一、APM 设计

APM 解决方案通常是作为草根、基础架构监测实践开始的,由IT 机构的某个独立业务部门实施,缺乏一致的目标。例如,网络团队可能要部署一个开源网络工具,以获得基础网络的可视性,而web 服务器团队则可能会从一个主流的服务器厂商那里部署一个服务器监测工具。然而,自上而下地设计一个 APM 方案要切合实际得多。使用这种方法,您先设想结果,然后将它应用于您选择的解决方案组件。

您如何着手开始呢?在 ITIL 的世界里,最终支持服务级别协议service level agreement,简称 SLA)的运行级别目标operational level target,简称OLT)是一个好的起点;这些将已经解决了预期的业务产出和成本限制,并且应该实现一个高水平的设计。不与 ITIL 相关?您仍然能够采用适合您需求的部分最佳实施。从与业务部门讨论、理解业务目标开始,确定 APM 预算,使用对应用交付基础架构的理解和它的性能敏感性,并草拟一个方案。您很可能想把这个作为一个练习,测试什么可能会出错,尽可能广泛地扩展范围;成本 和其它的实际考虑将很快专注于这一设计。您当然不会是第一个采取这种方法的人,您可充分利用与供应商的关系、用户群和咨询合作伙伴,来理解类似尝试可能会 有的成功和失败。

公司高层提供的资源支持和参与对于任何 APM 项目的成功都是至关重要的,因为这将要求来自多个 IT 部门的积极支持。更重要的是,这些部门对于项目的业务价值要有一致的理解,因为他们每个都可能会面对新的企业可视性他们在高管仪表板上的测试指标),对 某些东西失去控制应对问题的新流程),或者放弃一个最受欢迎的工具。开始一个小型的 APM 项目,选择一个战略性的应用,为业务所有者和 IT 机构阐明价值,大多数机构将会从中受益。这样一个项目的成功,将能够被一个更全面、收益更明显的解决方案利用。

然而,我们大 多数人并不是从临时拼凑开始设计 APM 解决方案;我们已经拥有许多一直服务于我们的目的的基础架构工具。那么,是什么将一系列“结合平台的”platform-aligned)工具转变成 APM 解决方案的呢?尽管对于这个问题可能会有许多技术回答,但是,这里有两个最重要的主题:

·业务一致性business alignment)。全新的主要设计目标仍然应该从注重业务产出开始。对业务来说,重要的将是终端用户的体验——这个可通过性能和可用性进行测量。

·相关性和故障隔离correlation and fault isolation)。对根源的可视性,是将基础架构提升至 APM、真正理解基础架构测量指标如何影响业务生产力的关键。

很 容易明白诸如终端用户体验end-user experience,简称 EUE)和基础架构测量指标等业务相关的测量指标的相关性为何如此重要。将终端用户体验到的性能问题与基础架构测量指标结合起来,隔离主要的根源,这能让 IT 小组快速准确地专注于问题的起源,同时避免对不相关的组件采取行动。通过适当的阈值调整,这为持续业务改进奠定了基础。同样地,通过 EUE 的相关性,以及受影响的用户数量和所在位置、每天交易的次数和业务价值,可以找到问题对业务的影响。

通过一系列基础架构工具 构建 APM 解决方案,会带来集成和相关性方面的挑战;您需要对主要的单一供应商single-vendor)解决方案进行评估权衡,因为供应商和定制化的多供应商 multi-vendor)解决方案构建和交付了集成。对于更小一些的部署,定制化的解决方案可能会更省钱,但是对于较大的实施,可扩展性和维护方面的 考虑将会迅速改变价格。

在设计流程里,保持对终端用户交易响应时间的专注很重要。这有两个原因。第一,性能分析和问题解决是 为更好的了解以业务为导向的环境并提出重要意见。尽管在传统上,基础架构测量指标是满足事件和问题管理的数据,但是,这些基础测量指标和它们的阈值驱动警 报在没有业务相关性的情况下能够变得几乎毫无意义。例如,对于一个 2 M 广域网连接来说,75% 的利用率究竟是好还是坏呢?一个被报告的交易性能问题是由 SAN 里长度为 8 的测量磁盘阵列引起的吗?当应用的性能降级时,这些组件级的测量还将总会被突出?其次,从对业务影响的角度来说,IT 能够优先对事件作出响应是有价值的,它代表了向业务一致性迈出的重要一步。

同样重要的是,与技术和 IT 资源的成本相关的设计限制。许多 APM 项目不成功,是因为缺少关注和支持,因为无法维持这一解决方案、无法适应基础架构的变化并无法定义基于真实世界反馈的流程。

) 问题和事件管理是 APM 的两个核心 ITIL信息技术基础架构库,简称 ITIL)流程。事件管理Incident...

作为具有超过35年经验的IT 管理软件和解决方案专家,CA Technologies提出以下五个简单步骤,从而让IT经理远离困扰、让IT管理方式高效运营、让应用性能得到优化并最终让终端用户和客户感到满足。

改变心态推进IT

1、改变心态,推进IT

大多数的 IT 项目初始都涉及到一个思维转变或者文化转换。对于大多数

大多数的IT项目初始都涉及到一个思维转变或者文化转换。对于大多数 IT而言,根据不同的域,以往的成果都可以通过服务器响应时间或者网络正常运行时间统计数据来进行衡量。而在现如今的动态环境中,终端用户(无论是内部还是外部客户)的体验和交付的IT服务才是衡量成果的标准。这就意味着 IT 不仅仅需要像以往那样监控整体服务的各个组成部分,还要专注于那些组成部分如何支持服务,服务又如何满足客户需求。

IT而言,根据不同的域,以往的成果都可以通过服务器响应时间或者网络正常运行时间统计数据来进行衡量。而在现如今的动态环境中,终端用户(无论是内部还是外部客户)的体验和交付的IT服务才是衡量成果的标准。这就意味着

2、集成现有IT工具

IT 不仅仅需要像以往那样监控整体服务的各个组成部分,还要专注于那些组成部分如何支持服务,服务又如何满足客户需求。

下一步就是要集成服务管理生命周期和监控工具的视角。集成以往那些单独的工具,并且调整他们使其为服务目标而服务,这将是技术上的一大挑战。然而当 IT企业做出如此决定之后,并不是所有的工具都可以轻易过渡到服务保障模式。

集成现有IT工具

业务需要的不仅仅是一个有红绿指示灯的仪表来指出是否存在问题。 IT运营需要鉴定服务并将这些服务塑造为这样一种模式,支持服务的底层应用和基础设施组件的任何变化都能够接近实时地自动更新。这就保证了运营可以更容易地追查来源或找到问题,从而减少宕机时间,提升终端用户体验和最终结果。

下一步就是要集成服务管理生命周期和监控工具的视角。集成以往那些单独的工具,并且调整他们使其为服务目标而服务,这将是技术上的一大挑战。然而当 IT

3、优先考虑补救措施

企业做出如此决定之后,并不是所有的工具都可以轻易过渡到服务保障模式。

一旦企业明白某个问题会影响到谁以及如何影响他们,就可以开始寻找解决方案了。一个客户也许愿意在更新他的联系人信息时稍等片刻,然而如果让他在登录过程中也等待相同的时间,这就足以让他直接寻找别的提供商了。IT的最终目的就是要将终端用户交易体验和业务成果联系在一起。

业务需要的不仅仅是一个有红绿指示灯的仪表来指出是否存在问题。IT

4、合理使用资源

运营需要鉴定服务并将这些服务塑造为这样一种模式,支持服务的底层应用和基础设施组件的任何变化都能够接近实时地自动更新。这就保证了运营可以更容易地追查来源或找到问题,从而减少宕机时间,提升终端用户体验和最终结果。

与此同时,一个有效的服务保障模式能够允许企业更有效地查看和规划交易,以更好地了解 IT 和业务的需求。之后,企业便能够以最佳的组合方式为程序分配资源,包括硬件、带宽和网络能力,而不是过高或过低地供应资源。

优先考虑补救措施

一个很好的案例是一个国际食品制造公司已经让服务保障融入了其全球运营当中。这家公司的目标是每七年实现翻倍增长,因此需要更好地掌控各区域从交易活动到网络性能的各项表现。其IT团队领导表示:“显然,我们不希望过度购买那些我们并不需要的能力、基础设施和带宽。我们的目标是希望能够预估能力并进行预测性购买,所以我们添加此系统并不算迟。”

一旦企业明白某个问题会影响到谁以及如何影响他们,就可以开始寻找解决方案了。一个客户也许愿意在更新他的联系人信息时稍等片刻,然而如果让他在登录过程中也等待相同的时间,这就足以让他直接寻找别的提供商了。IT的最终目的就是要将终端用户交易体验和业务成果联系在一起。

5、不断调整

合理使用资源

为IT管理采用服务保障措施并不是一个一次性的IT项目。这将是一个不断提供增量收益的持续性过程,而IT运营经理必须要决定他们想从哪里开始。如果所需的最终结果是提升终端用户体验,IT部门必须明确这对其企业来说意味着什么。

与此同时,一个有效的服务保障模式能够允许企业更有效地查看和规划交易,以更好地了解 IT

因此,一旦变革发生,IT企业就可以开始考虑诸如“如果我们改变基础架构将损失多少钱?”或者“这个操作会给我们的服务水平协议(SLA)合规带来怎样的风险?”等指标。现如今客户如果想要更换其他服务提供商的其他服务实在是太简单了,所以IT必须辨别那些对其业务影响最深的指标,并确保将其运营风险和声誉风险降到最低。

和业务的需求。之后,企业便能够以最佳的组合方式为程序分配资源,包括硬件、带宽和网络能力,而不是过高或过低地供应资源。

IT 管理。他们预言高科技孤岛的优势、毫无意义的讨论会议以及表现不佳的应用性能,将会为故障排除...

一个很好的案例是一个国际食品制造公司已经让服务保障融入了其全球运营当中。这家公司的目标是每七年实现翻倍增长,因此需要更好地掌控各区域从交易活动到网络性能的各项表现。其IT

团队领导表示:“显然,我们不希望过度购买那些我们并不需要的能力、基础设施和带宽。我们的目标是希望能够预估能力并进行预测性购买,所以我们添加此系统并不算迟。”

不断调整

为 IT 管理采用服务保障措施并不是一个一次性的 IT 项目。这将是一个不断提供增量收益的持续性过程,而

IT运营经理必须要决定他们想从哪里开始。如果所需的最终结果是提升终端用户体验,IT 部门必须明确这对其企业来说意味着什么。

因此,一旦变革发生,IT

企业就可以开始考虑诸如“如果我们改变基础架构将损失多少钱?”或者“这个操作会给我们的服务水平协议(SLA)合规带来怎样的风险?”等指标。现如今客户如果想要更换其他服务提供商的其他服务实在是太简单了,所以IT

必须辨别那些对其业务影响最深的指标,并确保将其运营风险和声誉风险降到最低。

看完上面的内容,有没找到自己运营it项目效率低下原因了,或者从中找到一些启发。倘若,能够从这五步中能够找一个合适it运营理念,找准自己产品定位,也许你的it项目运营起来会更加轻松哦。

本文转载自拓源优课:www.toyoke.com

本文由4887王中王鉄算盘奖结果发布于服务器&运维,转载请注明出处:端到端APM应用性能的管理观,服务保障变革IT运营

关键词:

上一篇:网络架构革命运动掀起,架构概览

下一篇:没有了

最火资讯