一、监控工具和数据源多样化
差异IT情形中使用了多种监控工具和数据源,每个款工具所接纳的告警接入手艺和数据处置赏罚名堂各不相同,这导致了告警数据的疏散和碎片化,使得告警治理变得重大。从集团统一化运维战略出发,团结运维实践,大圣科技亟需为应用运维建设统一处置赏罚告警的处置赏罚尺度。
二、告警数据量多
监控工具发生的告警爆炸式增多,告警通知应接不暇。包罗许多重复冗余信息和噪音。这些冗余告警使得运维团队无法快速筛选要害故障信息,难以识别真正的问题,影响了问题解决的效率。
三、故障升级不实时
营业系统(焦点/主要/通俗)的影响规模各不相同,源告警也有严重性区分, 故障优化级应该凭证告警的影响规模和严重性综合判断、处置赏罚、升级和通知,但当前监控工具缺乏的这样的升级能力,增添了人为判断的时间。
一、平台整体设计
对接CMDB系统、对接GTS系统(工单系统)、通知方式(企微、飞书、邮件、钉钉)、告警升级和排班治理。
二、数据集成-事务尺度化
通过建设差异数据源的数据接入和数据规则处置赏罚、数据统一规范、数据关系表扩展等功效,实现对HB火博自研监控产流品及市场主监控产物的异常事务数据接入和多源异构数据统一尺度化处置赏罚。
三、告警收敛
针对海量异常事务,通过一系列规则举行降噪收敛处置赏罚,形成故障,实现对异常事务的合并处置赏罚,阻止告警风暴,提升一线运维职员、运维治理职员的事情效率,降低人力成本。
四、告警通知
运维部门都市有7*24小时值班制度,但不能时时刻刻都在电脑前盯着故障列表,一是故障数目多,二是有些故障不需要快速响应。一些主要的故障需要实时吸收到并处置赏罚解决。运维部门内差异的运维组认真处置赏罚的故障差异,平台发生的通俗故障只需要向一线运维职员发送邮件通知,关注即可。对于最高品级故障需通知到运维专责,关注严重的故障。
一、专业能力强
HB火博数据的智能告警能力切合大圣科技的运维要求
二、手艺创新能力有目共睹
海内首家,唯一通过信通院根因剖析测评优异级的厂商
一、实现告警统一治理
多源事务统一接入,(从0-1建设)完整监控笼罩,实现告警统一治理
二、提升运维职员事情效率
故障尺度剖析处置赏罚,提升事情效率,镌汰排查时间,提升运维职员事情效率,阻止登录多套平台审查告警信息
三、实现1人治理多套系统
海量告警智能收敛,降低故障剖析的信息量,镌汰运维职员数目,到达降低运维成本,实现1人治理多套系统
四、有用降低MTTR时间,由小时级转酿因素钟级
故障通知高效转达,提高响应效率,与企微、邮
件、钉钉、飞书及GTS对接,以及故障升级战略,通过多种方式通知,保障故障实时响应,降低MTTR时间,由小时级转酿因素钟级。