您订阅的产品有更新,请实时查阅
查看详情
颁布功夫:2019-12-04
我是一名运维
也是一个折翼的天使
我就职于某A股上市造作类企业
旗下有江东、赤峰、克拉玛依三个厂区
各人都尊称我为“张工”
这是一名运维工作者的日常
专家统计:70%的业务问题是用户先发现的
因而,被用户抱怨是常有的事
专家还说了,
90%的精力破费在故障分析和定位上
因而,被用户“连环夺命催”也是难以预防的
销售总是说:
业务部门总是说:
业务运维总是说:
网络运维总是说:
好好好,各人都没问题
所所以老板的问题咯?
每天疲于应酬部门间扯皮的我:
2019年8月22日
这是我职业生涯中再泛泛不外的一天
一如既往又有问题产生了
ERP系统打开出格慢,一个订单半分多钟能力打开
我登时有点慌
由于消费者在门店下单后,工厂通过ERP系统接管到订单,而后起头进行备料、出产、交付,该业务出现问题,整个出产活动城市受到影响。
固然我熟悉各区域的网络,但处置这种问题还是极度没底。
我必要从报障的终端用户到ERP业务服务器之间的设备,逐一查抄
命运好的话,1个幼时
命运不好的话,5、6个幼时也有可能
忽然想起公司最近新采购了“猎豹”
听说猎豹是一个智能运维平台,能站在最终用户的视角评估业务利用的曲直,实时感知用户的接见履历,并能够急剧定位问题,界定责任人。
我嗤之以鼻,这种业界难题
是你一个系统就能解决的吗?
那我倒要看看这只“猎豹”到底行不能
没想到的是
打脸来的太快就像龙卷风
我的难题三步就被解决了:
Step1:
我接管到了猎豹通过邮件和短信发来的告警通知
Step2:
通过猎豹提供的告警详情,分析故障时刻用户与U9业务交互的履历KPI,对指标进行钻取分析,相识到具体是哪些用户与U9业务接见过程中产生了慢的履历,而后基于这些源IP进一步缩幼故障影响领域的判定。
Step3:
经过一轮分析,最终判定问题出在某一家运营商链路上,数据包分析的结论给了张工充足的凭据证明该运营商链路存在较多丢包、不不变的景象导致了此故障的产生
我连忙把这一信息反馈给了运营商
运营商对自己的广域网链路排查分析后,故障建复了。
整个过程,没有扯皮,没有抱怨,
处置问题快、狠、准,
我不由得想要为猎豹鼓掌??
原来,故障定位,用猎豹就够了!
以前,我们没罕见据支持来注明业务履历的好不好,查核指标也只是凭据业务是否宕机。而此刻,猎豹能够援手我们量化和提升用户履历;
以前,我们总是晚于用户发现问题,只有不是极度大的延长问题,用户不会自动反馈,一旦反馈就是大面积问题。而此刻,猎豹自动在延长出现的时辰发现履历问题,更早排查原因,运维从此不再被动;
以前,故障无法追忆,时时有些问题过一会就没了,原因底子没法找。而此刻,猎豹助我们秒级“还原现场”,眼见为实。
猎豹是一只聪明的幼豹子,它深刻洞察业务、量化用户的履历、急剧定位问题、支持故障自愈、数据回溯,让运维工作,从未如此单一。
