视色av,亚洲免费av一区二区,日韩av一区在线观看,日韩色中色

首頁

/

嘉為藍鯨告警中心:助力大型保險集團實現告警規范管理

發布日期:2024-06-12 15:48:33

分享到

為應對數字化轉型的挑戰,提升整體的IT運營和運維能力,金融行業數據中心管理體系也在一直發展、完善。我們認為大體分為兩大階段,即狹義數據中心監控管理,到廣義數據中心監控管理階段。其中廣義的數據中心監控管理,更多是含從業務價值視角的全領域的建設。通過建立完善的監控告警管理規范,結合監控告警工具,可以提高系統的穩定性和可靠性,減少故障的發生和影響,提升業務價值。

某大型保險公司基于嘉為藍鯨告警中心,構建了完善的告警管理規范,打造告警全生命周期管理體系,實現業務可用性提升。


01. 業務場景

該公司在多年的監控建設過程中,已陸續實現了網絡設備監控、系統基礎監控、中間件數據庫監控、云平臺監控、應用監控、動環監控,所有的監控告警管理規范和工具都由數據中心管理員進行管理,各領域管理崗和外包人員負責接收和處理監控過程中產生的告警。由于監控系統分散、涉及角色多,數據中心管理員較難進行規范管理。

缺乏專業工具支撐,告警的產生、流轉、處理過程中需要耗費時間較長,響應和處理效率低下,對業務連續性使用會產生一定影響。同時因為各領域管理崗較為分散,對于告警的處理效率、人力成本等很難進行評估和量化。


02. 分析痛點

該公司有規范的管理流程,但缺少工具支撐管理,導致在實際業務場景中存在以下痛點:

1)工具無法匹配管理規范

基于企業對告警的管理規范,5級及以上的告警都能自動生成事件工單且由對應的人員處理,且會根據告警治理過程對規范進行優化,需要通過配置才能靈活適配規范。

2)告警信息不規范

由于監控系統多樣性以及建設的時間較早,導致告警信息不規范,很多告警甚至缺少關鍵信息。

3)告警無法收斂導致工單過多

現有系統中,產生的告警60%以上都是重復告警。這些無效和重復的告警會導致創建的事件工單量大、告警通知量大,且需要在人工處理階段花大量時間對重復的工單進行判斷關聯。事件單數量過多也不符合管理規范。

4)無法適配交易時間

金融業的業務系統跟交易時間關聯較大,因變更和交易關閉時間,也會產生一些無效的告警,需要根據交易時間判斷告警有效性。

5)變更導致告警風暴

變更過程或者變更過后,會產生大量告警,需要自動對變更產生的告警進行屏蔽。


03. 解決方案

1)結合告警管理規范,落地最佳實踐

根據該公司的組織架構和管理規范,結合業務場景,通過配置和對接第三方系統,對整個告警生命周期管理實現了閉環。


2)結合CMDB實現告警豐富及告警動態分派

通過關聯CMDB數據,實現告警信息的豐富和完善,并根據CMDB實例中的負責人信息,實現了告警動態流轉,保證告警通知的及時性和準確性。


3)根據交易日歷和變更進行告警收斂

根據交易日歷和ITSM變更工單,修改告警收斂策略的時效性或者創建新的收斂策略,通過自動化手段盡可能地減少無效告警。


04. 成果展示

1)結合CMDB實現告警動態分派


2)根據ITSM變更工單創建告警屏蔽


3)交易日歷控制抑制策略是否生效


05. 建設成效

  • 實現了多監控系統的告警進行統一生命周期管理,實現告警100%管理
  • 實現告警動態分派和準確觸達,告警從產生到通知不到1分鐘
  • 結合金融行業的特征實現告警收斂,減少了無效告警產生的資源浪費,告警收斂率達到70%
  • 多種自動化場景結合,減少日常人工維護和管理的成本;
  • 為告警治理提供數據支持,通過數據復盤實現各環節的優化。


06. 場景適用性

嘉為藍鯨告警中心適用于告警生命周期管理的場景,結合企業告警管理規范,總結出企業最佳落地實踐。適用于金融行業及其他更廣泛行業進行告警高效處理、標準化實現業務系統持續可用的場景。適用有以下業務場景需求的企業:

  • 監控系統較多,沒有集中管理告警的系統;
  • 告警數量較多且很多無效告警,告警處理效率低;
  • 告警產生跟交易開閉市時間有關聯,需要根據交易時間對告警進行分別處理;
  • 原來監控告警沒有完善的規范,管理較為混亂,想要規范化;
  • 告警處理過程中故障排查較難,希望有信息進行輔助排查;
  • 想要通過故障自愈實現一些固化場景,或者實現場景創新。

免費申請演示

聯系我們

服務熱線:

020-38847288

QQ咨詢:

3593213400

在線溝通:

立即咨詢
查看更多聯系方式

申請演示

請登錄后在查看!