近日,爱分析发布“2023金融数字化最佳实践案例”。最佳案例奖面向金融数字化厂商,围绕实践领先性、案例创新性、应用成熟度、价值创造四个维度进行评选,旨在肯定金融数字化领域领先企业的数字化创新应用和最佳实践。经过申报、初评、调研、终评多轮角逐,最终评选出11个具有参考价值的创新案例,鼎茂科技为中韩人寿保险有限公司实施部署的“一体化智能运维平台”案例入选。
关于中韩人寿
关于解决方案
鼎茂一体化智能运维平台解决方案,通过对海量运维数据的一体化治理和关联分析,将原有零散运维工具拉通整合,并融入运维对象指标管理体系和运维领域知识,实现基于对象的管理闭环。产品以组件化形态敏捷融入IT环境,帮助企业构建精细化、智能化的平台级运维管理解决方案,基于统一的管理门户,获得从智能监控、智能告警、智能分析,到全局化数智运营的全场景AI赋能,整体式增强系统高可用性,全面提升运维管理效能。
助力保险机构解决以下问题:
分散监控
·传统监控方式告警规则分散,难以管理
·指标、日志、事件,彼此孤立,分析手段不统一
·单一层面指标难以反应业务或系统运行状态,易产生误报,告警功能失效
海量告警
·分散且等级各异,并且可能漏报严重告警
·几乎90%以上,是告警噪音
·几乎80%的时间浪费在手动事件聚合
海量数据治理与可视化
·数据无法快速接入清洗,难以敏捷应对运维场景需求
·业务状态、系统运行状态等无法透视
·传统定制大屏周期长,难以快速应对需求变更,重复建设成本高
行业应用场景
智能监控场景
银行机构场景>>>过去采用Zabbix静态阈值监控主机。由于批量执行平台主机日常集中处理批量交易时段会有明显的高消耗,客户按照40%的风险阈值对CPU.IOWait指标进行监控,在跑批时段产生较多误报。由于是正常的表现,运维人员并不会处理实际收到的告警,久而久之就变成噪音信息。
实施后>>>应用异常检测技术实现动态阈值监控,能够自适应根据高峰低谷动态学习安全阈值,正常的高峰期高资源消耗不再发生误报。
保险机构场景>>>IT资源利用率不高,资源投入不均衡,某些业务条线有大量闲置资源。部分业务条线经常随业务增长进行资源扩容,但缺乏准确的资源规划,总是存在资源瓶颈和业务活动的冲突。
实施后>>>基于AI模型准确细致的将主机、网络等不同维度的资源和不同项的指标与业务容量的相关性测算,较为准确的推算出业务目标匹配的IT资源投入,资源有效利用率提升30%,同时避免资源规划不足导致临时扩容情况发生60%。
智能告警场景
资管机构场景>>>已建设Prometheus和Zabbix覆盖业务应用和基础资源监控,由于运维团队仅有数名运维人员,监控点较多,无法人工对各项告警规则进行完善的调试和优化,导致告警事件的收敛抑制缺失,日均有500笔告警事件,难以全部及时处置。
实施后>>>应用智能模式识别压缩算法结合内置的告警管理UC库,形成开箱即用的告警压缩模型和规则,少量人工干预即可完成对于告警有效收敛抑制。日均告警事件压缩至100笔内,并及时处置完毕,确保了故障问题的不被遗漏或延误发现。
数智运营中心场景
银行机构场景>>>已建设监控、CMDB、ITSM等多项基础运维工具,但管理效能依然不理想,领导层反应存在问题汇报不及时或遗漏上报,以及故障集中处置时需要对各方沟通询问的情况,同时对于全局的运行情况需要去多个平台查阅汇总,决策效率不高。
实施后>>>对运行指标和告警进行治理抽象,结合管理决策逻辑构,建统一运维驾驶仓,避免了人工沟通上报的各项可能管理风险漏洞,大幅提升管理指挥效能;并通过数据结构化组织后的可视化,为决策提供实时可见、信息完整的依据,大幅提升分析决策的效率。