视色av,亚洲免费av一区二区,日韩av一区在线观看,日韩色中色

首頁

/

應急災備管理系列(一)——信息系統應急災備管理的定義

發布日期:2023-11-07 13:59:39

分享到

01. 業務連續性與信息系統應急之間的關系

談到業務連續性,相信大家并不陌生,業務連續性管理是保障企業業務持續運轉的重要組成部分。通過字面意思來解讀,無論業務連續性管理(BCM,Business Continuity Management)還是業務連續性管理體系(BCMS,BCM,Business Continuity Management System)都可認為是一套完整的業務連續性組織能力的管理框架,與其他許多管理領域都有著密切的關聯,如下圖所示:

其中的應急管理領域,顧名思義指的是面對突發事件時,快速響應并緊急采取有效措施,將損失降低到最小的相關活動。進一步延伸,可擴展到事前的預防與事后的復盤改進與持續優化。應急管理全過程概括如下:

早在2011年,《商業銀行業務連續性監管指引》(銀監發[2011]104號)中明確提出了“商業銀行應當開展業務連續性風險評估,識別業務連續運營所需的關鍵資源,分析資源所面臨的各類威脅以及資源自身的脆弱性,確定資源的風險敞口。關鍵資源應當包括關鍵信息系統及其運行環境,關鍵的人員、業務場地、業務辦公設備、業務單據以及供應商等”。并且隨著云原生、分布式等技術的快速發展,金融單位核心系統的不斷升級和迭代,企業和組織對于IT系統的依賴程度越來越高,IT 風險與業務風險相互交叉,疊加發生的可能性不但存在而且有不斷增強的趨勢。一旦業務信息系統出現問題,將帶來無法估量的嚴重影響:

1)服務中斷

信息系統故障可能導致金融單位的服務中斷,無法正常提供客戶所需的金融服務,如轉賬、支付、查詢賬戶余額等。這會給客戶帶來不便,并可能導致客戶流失。

2)數據丟失或泄露

信息系統故障可能導致金融單位的數據丟失或泄露,包括客戶的個人信息、賬戶信息、交易記錄等。這會對客戶的隱私和安全造成威脅,可能導致金融詐騙等問題。

3)業務延誤和損失

信息系統故障可能導致金融單位的業務延誤和損失。例如,無法及時處理交易請求、無法準確計算利息和費用等,這會影響金融單位的運營效率和盈利能力。

4)聲譽損害

信息系統故障可能對金融單位的聲譽造成損害。客戶對金融單位的信任和滿意度可能受到影響,而且媒體和公眾對于信息系統故障的報道和評論可能進一步損害金融單位的聲譽。

因此我們在此處主要談論業務連續性管理和信息系統應急之間的關系。

① 關聯性

業務連續性包含了信息系統應急。信息系統應急主要解決業務中斷的重要事件應急和災難級別的應急活動。而超出了業務業務連續性管理的部分事件,就是我們日常碰見的一些高頻事件了。


② 管理對象

業務連續性關注整個組織的管理運營從而支撐業務的正常運轉。而信息系統應急管理,主要關注圍繞著“事前——事中——事后”的操作對象中。


02. 企業信息系統應急成熟度等級

2023年5月23日國家市場監督管理總局與國家標準化管理委員會聯合發布了重新修訂發布了《信息技術服務數據中心業務連續性等級評級準則》。通過解讀,我們認為落實在信息系統應急上的能力成熟度建設同樣也分為幾個等級,如下所示:

  • 始級:離線管理應急預案,運維管理領域各工具之間相互割裂;缺乏日常應急管理意識;
  • 基礎級:具備應急預案、場景、演練的初步線上化管理能力;初步具備應急組織架構和日常組織架構的體系建立
  • 發展級:應急執行流程的建設,并配套完成演練的執行、應急事中的執行,以及流程執行的過程展示,過程暫停、查看日志等管控能力。
  • 穩健級:引入故障注入等能力,實現常態化演練和無損演練;預案、場景等經驗沉淀,完善預案體系和覆蓋率,提升處置效率;通過持續改進,強化整個運維能力的提升,包括變更管理能力、應用架構能力等;
  • 卓越級:深度聯動可觀測體系,一體化建設故障的輔助定位和預案推薦能力,提升自愈率;以故障為核心,打通觀測、運營、管理、操作等故障全流程管理、處置過程;全面評估應急體系能力水平,助力組織目標安全穩定高效的實現。


03. 企業信息技術應急管理現狀與影響

目前大部分企業的信息系統應急水平還處于起始級或基礎級,在應急事中存在以下現狀:

  • 應急預案建設不完善;
  • 預案的時效性難以保證,平時可用,真到事發時卻發現用不成;
  • 應急感知慢,可能從業務端反饋才知道;
  • 應急時不同系統間來回切換查看數據,故障決策難;
  • 應急依賴專家經驗,預案選擇難;
  • “擊鼓傳花”式應急執行,跨組織之間協調機制差;
  • 應急過程記錄不全,缺少應急管理相關度量指標,導致無法形成應急管理運營體系無法形成閉環。

這些現狀都可能導致我們應急事中的處置環節時間延長,輕則耽誤了業務對外提供服務,影響了企業的正常運營。重則需要需要向監管單位進行述職并接受嚴厲的大額罰單,甚至還需要處理不斷發酵的輿情。例如今年年中,某地證監局就對某券商公司的業務中斷事件開具罰單,并要求于3個月內完成整改工作并向某地證監局報送整改報告,同時對信息技術中心行政負責人采取出具警示函的行政監管措施。


04. 企業需要如何管理應急

事實上,事情的本質就是我們能夠通過工具體系和管理規范,確保專家經驗沉淀的預案保持良好的時效性,工具能力的有效聯動并輔以管理規范的有效驅動,就能大大縮短我們的應急處置時長,保障業務的連續性。

*注釋*:

MTBF:平均無故障時間

MTTI:平均調查時間

MTTK:平均故障定位時長

MTTF:平均故障處理時長

MTTV:平均故障確認時間

MTTR:平均響應時間

通過提升MTBF時間,降低MTTR時間,就可以有效的管理應急全流程。這里我們總結了以下“1-2-3-4”設計原則:

  • 一個目標,快速止血,第一時間回復生產
  • 兩大場景,“事件應急”和“災備應急”
  • 三個一體,“技術平臺一體”,實現底層能力平臺PaaS化;“管理操作一體”,實現應急管理思想和自動化操作的同和;“數據融合一體化”,實現應急決策所需配置數據、執行數據、性能數據的統一管理和展示
  • 四個全面,應急過程全對象管理;應急過程全周期貫通,應急全場景覆蓋以及應急組織不同的角色,無論這個組織在企業內是虛擬的還是真正存在的

基于這個設計原則,我們可以更好的理解應急管理的建設目標,也明白支撐應急系統事中快速的響應,決策需要的數據來源,從而通過逐步迭代,小步快跑的模式,建設一套完整應急框架體系、應急管理綜合解決方案。通過常態化的應急演練及運營優化思想,進而形成高時效性的應急預案庫, 保障在重大突發事件出現時,應急處置及時有效,縮短故障歷時,降低業務影響,有效防范和化解業務風險,最大程度減少該事件帶來的損失。

展望未來,希望在大數據和AIOps人工智能的能力加持下,真正實現根因快速定位,進一步提升不同部門和專業間的協作和配合能力,以應對更復雜的問題和事件,使整個數據中心的應急能力更上一層樓,為業務提供更好的保駕護航能力。

每個企業應當考慮哪些因素可以使我們建設信息系統應急的“事前——事中——事后”環節卓有成效,又當在每個環節開展哪些活動,我們的微信公眾號下一篇連載:應急災備管理系列文章(二)——信息系統應急災備管理的關鍵業務價值流和活動,敬請期待!

免費申請演示

聯系我們

服務熱線:

020-38847288

QQ咨詢:

3593213400

在線溝通:

立即咨詢
查看更多聯系方式

申請演示

請登錄后在查看!