2020-09-21
随着5G、云计算和微服务等技术的发展,传统的运维手段面临挑战,智能运维成为大势所趋。亚信科技全域智能运维平台AISWare AIOps定位于提供AIOps能力引擎,为各域运维系统注智和赋能。该产品结合实际需求,持续精益打磨,构筑差异化优势并落地实践,取得了良好效果,获得了多项行业奖项。后续,该产品仍将以需求为指引,持续发展,在精品之路上砥砺前行。
一、背景
传统运维面临挑战,智能运维成大势所趋
二、AISWare AIOps
提供AIOps能力引擎,为各域运维系统注智赋能
(1)高内聚运维学件:围绕质量保障、成本管理和效率提升三大方向,提供高内聚、低耦合的场景化运维学件,轻量级能力对接生产,支撑运维智能化需求的快速落地,便于复制和推广;
(2)标准化API接口:将算法模型和推理规约封装在学件内部,通过Open API接口,组件式方式与第三方系统集成,为其注智赋能;
(3)一站式开发运营:支持运维开发者结合各自的业务场景需求,调用现有服务,快速定义、训练和发布个性化的运维学件,并提供运营管理和运行监控服务。
AISWare AIOps结合实际需求,持续精益打磨。一方面根据需求持续扩展运维学件支持的场景范围,目前产品支持的AIOps场景已经超过40个;另一方面结合对运维场景的业务理解,不断优化模型、提升效果,目前产品具备一系列自研的算法能力,相比开源算法,更能适应实际运维场景,表现优异。以指标异常检测为例,通过自研算法实现精准化的故障发现,相比LSTM等算法,准确性可提高30%左右,资源消耗可降低50%,查全率和查准率也在行业中处于领先位置。
经过长期打磨,产品逐渐构筑起差异化优势:
(1)场景丰富:全面支持质量保障、成本管理和效率提升等多类场景,基于运维学件能力,实现运维智能化需求的快速落地,解决实际运维问题;
(2)算法积淀:基于长期积淀,面向复杂运维场景需求,以自研的算法模型构建学件能力,相比开源算法,更能适应实际场景,效果更优;
(3)组件集成:与运维系统解耦,提供组件化学件能力,以Open API的方式与相关系统集成,简化引入方式,避免重复建设,降低融智成本;
(4)平台支撑:以“平台+学件”相结合方式实现智能运维能力支撑,提供学件构建、开放、运营、管理的一体化服务。
三、案例
市场淬炼落地场景,创造价值获得认可
目前,AISWare AIOps已广泛应用于国内各大电信运营商的智能运维实践,并适用于电力、广电、金融、能源等行业。
案例1:黄金指标异常检测
AISWare AIOps在某通信运营商Kafka Topic流量、业务量、 负载均衡响应时延等多类指标监控告警中引入,实现智能化动态阈值异常检测,日均调用超1200万次,故障查全率99%,查准率在90%左右,成功预测多次故障。
案例2:告警根因分析及收敛
AISWare AIOps在某通信运营商O域告警收敛场景中引入,通过告警RCA规则动态挖掘,实时定位根因告警,目前告警收敛率98%,有效缓解告警风暴。
案例3:微服务应用系统故障定位
AISWare AIOps在微服务调用链故障定位实战场景中引入,从全链路角度出发,通过综合分析各服务运行状态、调用关系,进行调用链根因节点定位,并结合平台指标运行数据、拓扑关系,进一步智能推理、定位实际故障根因。从实际检测数据看,平均故障查全率超过85%,查准率80%,大幅缩短故障定位时间。
2020国际AIOps挑战赛亚军
2019年TMF亚洲峰会最佳催化剂奖
GSMA《AI in Network》优秀案例
四、展望
运维赋能持续发展,精品之路砥砺前行
AIOps市场逐渐回归理性,需要更关注当前IT/CT运维面临的迫切问题,如何把场景学件能力贯通形成复杂场景、高度智能的解决方案,并在运维实践中推广使用,最终实现无人值守的智能运维是后续发展的方向。而AISWare AIOps产品也将秉承为运维系统注智赋能的宗旨和使命,以一线需求为指引,持续打磨产品能力,在精品之路上砥砺前行。