最近小嘉在逛知乎時(shí)看到一位知友提出了這樣的一個(gè)問(wèn)題,這與之前溝通的一位客戶疑惑一致,為他解答的過(guò)程自己也整理除了一些思考,故和大家一起聊聊。
01. 開(kāi)源工具為何會(huì)不符合公司要求?基于開(kāi)源組件定制開(kāi)發(fā)是否是好的方式?
開(kāi)源工具早期包括現(xiàn)在一直都是國(guó)內(nèi)國(guó)外企業(yè)在做運(yùn)維時(shí)首選的工具體系,并且其中不乏很多工具入門(mén)簡(jiǎn)單,上手極快,功能強(qiáng)大,安裝部署容易,并且還有開(kāi)源免費(fèi)的優(yōu)勢(shì),滿足了企業(yè)組織對(duì)維護(hù)數(shù)據(jù)中心穩(wěn)定運(yùn)行保障的要求。這里的開(kāi)源軟件包括監(jiān)控、日志、自動(dòng)化等常見(jiàn)的運(yùn)維場(chǎng)景。
1)單個(gè)開(kāi)源工具無(wú)法滿足所有運(yùn)維需求
單看其中一個(gè)開(kāi)源工具,除了有上述提到的優(yōu)勢(shì)之外,其實(shí)也必然存在他的技術(shù)短板。就拿監(jiān)控舉例,Zabbix監(jiān)控發(fā)現(xiàn)功能非常好用,并且插件擴(kuò)展的方式幾乎可以豐富任何場(chǎng)景。但zabbix仍有它的短板。對(duì)于當(dāng)前比較火的容器部署架構(gòu),Zabbix的IaaS層監(jiān)控的優(yōu)勢(shì)無(wú)法發(fā)揮出來(lái),并且Zabbix 由于使用了關(guān)系型數(shù)據(jù)存儲(chǔ)時(shí)序數(shù)據(jù),在監(jiān)控大規(guī)模集群時(shí)存儲(chǔ)會(huì)遇到瓶頸。所以在容器、k8s架構(gòu)下,Prometheus成為了更有優(yōu)勢(shì)的工具。所以,為了滿足我們的運(yùn)維需求,需要上很多運(yùn)維工具。
2)運(yùn)維核心轉(zhuǎn)向?yàn)檎麄€(gè)應(yīng)用與架構(gòu)的健康性
我們?cè)谑褂瞄_(kāi)源工具時(shí),也會(huì)面臨很多場(chǎng)景問(wèn)題無(wú)法滿足,現(xiàn)在的運(yùn)維團(tuán)隊(duì)不再是看單點(diǎn)的運(yùn)行狀態(tài),而是更多以業(yè)務(wù)視角看整個(gè)應(yīng)用和架構(gòu)的健康性,這時(shí)zabbix的告警無(wú)法根據(jù)業(yè)務(wù)拓?fù)溥M(jìn)行收斂就會(huì)成為很大的問(wèn)題,瘋狂的告警郵件甚至給運(yùn)維增加了很多工作量。并且,zabbix根據(jù)不同場(chǎng)景的深度使用,都需要通過(guò)定制開(kāi)發(fā)實(shí)現(xiàn)。除此之外,不同行業(yè)的運(yùn)維體系都有報(bào)表和監(jiān)控大屏的需要,這些也都需要基于業(yè)務(wù)特點(diǎn),公司要求進(jìn)行定開(kāi)。而每種開(kāi)源工具的代碼邏輯都不同,如果我們對(duì)所有使用到的工具都進(jìn)行定制開(kāi)發(fā),耗費(fèi)的人力物力可想而知。
3)開(kāi)源工具聯(lián)動(dòng)&集成難
開(kāi)源工具搭建運(yùn)維體系就會(huì)存在另外一個(gè)問(wèn)題,這些工具之間的聯(lián)動(dòng),也需要通過(guò)點(diǎn)對(duì)點(diǎn)的對(duì)接的方式建設(shè)。那么新上一個(gè)開(kāi)源工具,就需要跟前面的n個(gè)開(kāi)源工具做集成,這種集成所需的交付周期也會(huì)比較長(zhǎng),而且聯(lián)動(dòng)效果對(duì)接口強(qiáng)依賴,開(kāi)的接口數(shù)量也不小。
從上面的分析就可以回答這三個(gè)問(wèn)題:
02. 我們需要的運(yùn)維平臺(tái)是什么樣的?如何建設(shè)呢?
換而言之,當(dāng)遇到以上運(yùn)維場(chǎng)景問(wèn)題時(shí),我們需要搭建一套自己的運(yùn)維平臺(tái)。那么我們的運(yùn)維平臺(tái)又要怎么建設(shè)呢?怎么才能把開(kāi)源工具不滿足的短板補(bǔ)齊,滿足公司管理要求、又能滿足公司業(yè)務(wù)特點(diǎn)?
整個(gè)平臺(tái)如何搭建,可以參考OASR模型,結(jié)合運(yùn)維流程,將IT運(yùn)維對(duì)象 (Object)、運(yùn)維活動(dòng)(Activity)、運(yùn)維場(chǎng)景(Scene)、運(yùn)維角色(Role)進(jìn)行分層剖析。
通過(guò)模型梳理清楚我們不同運(yùn)維角色在運(yùn)維場(chǎng)景中的需求,拆解每個(gè)運(yùn)維場(chǎng)景涉及的運(yùn)維活動(dòng)和對(duì)應(yīng)的執(zhí)行對(duì)象,底層的不同技術(shù)棧對(duì)象如何納管,運(yùn)維活動(dòng)如何在一個(gè)平臺(tái)上實(shí)現(xiàn),以及這種平臺(tái)建設(shè)后萬(wàn)一有新的技術(shù)棧,會(huì)不會(huì)也遇到開(kāi)源工具遇到的問(wèn)題?這些都要考慮。
在業(yè)內(nèi),就有實(shí)現(xiàn)運(yùn)維平臺(tái)建設(shè)的案例,騰訊內(nèi)部根據(jù)這種運(yùn)維場(chǎng)景和運(yùn)維活動(dòng)的梳理,內(nèi)部搭建了一套藍(lán)鯨運(yùn)維平臺(tái)。目前,藍(lán)鯨運(yùn)維平臺(tái)已經(jīng)在金融、證券、航司、交通、政務(wù)等行業(yè)落地,在自動(dòng)化、部署、監(jiān)控、權(quán)限管理、日志等等各個(gè)方面有一套完整的解決方案。而為了避免開(kāi)源工具使用中的問(wèn)題,我們是這樣做的:
第一點(diǎn),這個(gè)運(yùn)維平臺(tái)為了能夠覆蓋多種技術(shù)棧,在平臺(tái)層通過(guò)一個(gè)Agent納管底層所有的運(yùn)維對(duì)象節(jié)點(diǎn),以及無(wú)法下發(fā)Agent的網(wǎng)絡(luò)設(shè)備等,可以通過(guò)協(xié)議管理的方式實(shí)現(xiàn),首先做到了平臺(tái)對(duì)底層資源的管控一體。
第二點(diǎn),區(qū)分運(yùn)維活動(dòng)和運(yùn)維場(chǎng)景,運(yùn)維平臺(tái)的能力層(PaaS)能夠滿足所有拆解后的運(yùn)維單一動(dòng)作,比如配置平臺(tái)管理、腳本作業(yè)、容器管理等。而上層運(yùn)維場(chǎng)景已經(jīng)沉淀了常用的場(chǎng)景,也可以基于底層能力的調(diào)用根據(jù)平臺(tái)的前后端開(kāi)發(fā)框架,工具流水線、運(yùn)行環(huán)境托管持續(xù)構(gòu)建,能夠完全滿足不同運(yùn)維角色的運(yùn)維場(chǎng)景需求。這種底層的PaaS能力做到了平臺(tái)一體。
第三點(diǎn),針對(duì)開(kāi)源工具和商用工具無(wú)法天然聯(lián)動(dòng)的問(wèn)題,在平臺(tái)之上常用的應(yīng)用配置門(mén)戶、監(jiān)控告警、IT運(yùn)維服務(wù)管理、應(yīng)用發(fā)布自動(dòng)化、災(zāi)備切換自動(dòng)化等工具已經(jīng)實(shí)現(xiàn)了天然的聯(lián)動(dòng)交互。并且外圍工具也可以基于藍(lán)鯨平臺(tái)提供的標(biāo)準(zhǔn)接口做集成對(duì)接,快速實(shí)現(xiàn)外圍工具與運(yùn)維平臺(tái)的聯(lián)動(dòng)一體。
目前,藍(lán)鯨平臺(tái)社區(qū)體驗(yàn)版本,歡迎各位喜歡做運(yùn)維開(kāi)發(fā)技術(shù)研究的業(yè)內(nèi)大佬體驗(yàn)環(huán)境和做更多的技術(shù)交流。
碼字不易,若覺(jué)得有用,可點(diǎn)贊關(guān)注我們,會(huì)持續(xù)提供研發(fā)&運(yùn)維相關(guān)的干貨內(nèi)容。
若想深入了解咱們的運(yùn)維平臺(tái),歡迎去官網(wǎng)聯(lián)系嘉為藍(lán)鯨,我們將為您提供最新的產(chǎn)品材料與產(chǎn)品試用
SRE轉(zhuǎn)型:銀行SRE和虛擬IT組織的協(xié)作
查看詳細(xì)
提升軟件測(cè)試效率與質(zhì)量:基于CTest的結(jié)構(gòu)化測(cè)試用例設(shè)計(jì)與執(zhí)行
查看詳細(xì)
SRE轉(zhuǎn)型:銀行SRE和DevOps團(tuán)隊(duì)的協(xié)作
查看詳細(xì)
嘉為藍(lán)鯨CPack制品庫(kù):全新支持“純血”鴻蒙制品
查看詳細(xì)
DeepSeek 最新技術(shù)趨勢(shì):運(yùn)維人員如何提升告警管理效能?
查看詳細(xì)
SRE轉(zhuǎn)型:銀行SRE模式推廣策略
查看詳細(xì)
申請(qǐng)演示