在數字化轉型驅動下,企業IT架構向云原生演進的過程中,技術棧的碎片化與組件的微服務化使得IT技術架構復雜性指數級攀升。運維人員不僅需要應對云原生、微服務等新型架構帶來的海量告警,還需掌握多云環境協同、國產化替代等領域技術,經常需要花費大量時間在告警分析和告警處理中,難以釋放更多時間創造更多價值。
近幾年,隨著生成式AI技術的突破性發展,從ChatGPT展現的通用智能到DeepSeek的火爆,無疑都彰顯出大模型在企業IT運維中的巨大潛力。通過將大模型與企業告警治理的深度應用,構建基于自然語言交互的告警分析、告警處理、根因定位等能力,助力運維模式從“人工經驗驅動”向“AI主動治理”升級。
作為企業運維團隊的得力助手,小鯨觀測助手結合內置運維知識庫與業界領先的大模型技術,集成對接 DeepSeek、ChatGPT、通義千問等大模型,不僅可以協助處理日常運維難題,還能夠幫助團隊在告警治理過程中減輕負擔。以下是小鯨觀測助手在企業告警全生命周期管理中覆蓋的核心業務場景:
場景一:知識智能推薦,精準解決告警難題
當告警產生后,小鯨觀測助手依托告警中心的輔助分析能力,解析告警對象、告警名稱、告警內容等關鍵信息。借助大模型、內置運維知識庫、RAG技術,推薦告警產生的原因及可能的解決方案。不僅如此,它還支持混合檢索,通過靈活調整向量檢索和文本檢索的權重,提高知識推薦的準確率。
場景二: 智能聊天問答,即時響應運維需求
在日常運維工作中,您在頁面就能隨時喚醒小鯨觀測助手,與小鯨觀測助手進行互動交流。當您在故障排查過程中,遇到看不懂的錯誤日志時,可利用“劃詞問答功能”選中日志中的關鍵內容向小鯨觀測助手提問。小鯨觀測助手即時提供專業解答,大幅提升故障排查效率。
場景三: 智能排障引導,全方位協助問題排查
若推薦的知識未能解決問題,小鯨觀測助手還能提供“智能引導式排查”。不僅能夠快速識別用戶操作意圖,而且能夠利用編排好的劇本、無縫鏈接CMDB、歷史變更記錄、歷史告警記錄、指標數據、日志數據、調用鏈數據等多維度信息,引導運維人員進行復雜問題的排查和處理,真正做到手把手教您排查問題。
場景四: 智能告警治理,輕松應對海量告警
在面對海量告警時,運維人員常會陷入兩難,要么不知如何開展告警治理,要么需投入大量人力進行告警梳理和分析。小鯨觀測助手通過對告警數據的統計分析,幫助找出那些高頻出現的告警,結合內置運維知識庫中的最佳實踐經驗,為運維人員提供針對性的原因分析及優化建議,讓原本棘手的告警治理工作變得輕松高效。
場景五:告警策略優化,實現告警壓縮降噪
在告警治理過程中,面對高頻告警、誤報以及漏報等難題。小鯨觀測助手可對各類告警事件展開分析。以磁盤 I/O 使用率告警這一高頻出現的告警為例,能夠快速識別出告警數量過多的問題和產生原因,并依托內置的運維知識庫的經驗,給出告警閾值配置的最佳實踐以及相關優化建議。
以上場景僅僅是告警治理中的一部分助力,借助大模型能力,實現場景不斷挖掘,可持續賦能整個告警全生命周期管理過程。
申請演示