2023年1月12日,由中國信息通信研究院主辦,混沌工程實驗室、云上軟件工程社區支持的“混沌工程實驗室2023年會暨年度頒獎典禮”圓滿召開。在當前IT系統全面上云,云原生與微服務的架構趨勢的時代背景下,提升云系統穩定運行能力的重要性日益凸顯。中國信通院于2022年11月啟動“首屆云系統穩定安全運行優秀案例征集”活動,以期激發云系統穩定性領域磅礴的創新力量,為數字化轉型穩步推進奠定基礎。
會上公布了“云系統穩定安全運行優秀案例”評選結果,基調聽云憑借與金茂集團共創《基于用戶體驗的多維可觀測能力體系建設實踐》入選中國信通院可觀測性優秀實踐評定的“卓越級”名單。

中國金茂作為地產行業數字化建設的先行者與領跑者,目前已建設覆蓋地產行業投資、營銷、經營、會員運營等全業務場景的應用系統200余套。系統規模與復雜度的快速提升引發眾多用戶體驗問題,集團對建設具備高效可觀測性能力的監控需求愈發迫切。
2020年基調聽云與金茂集團合作以來,通過對金茂系統的逐步調研,圍繞業務可用性、穩定性及質量三個維度開展可觀測能力體系建設及應用落地的共創合作,支撐金茂逐步形成以APM為核心,CMDB為數據底座,結合撥測、基礎監控能力的發展布局建設,基于金茂自身業務特性,形成以可觀測能力建設、數據融通、深度治理的三階段建設路徑。為在更多大型國央企中成功落地可觀測性監控平臺的思路和方法,提供可借鑒的優秀實踐案例。

實踐一:解決可觀測信號覆蓋不全。
在體系建設初期,集團內的多數應用存在監控手段不全,數據采集覆蓋度低的現象,基調聽云助力金茂從信號采集、信號關聯和信號告警三個環節規劃可觀測能力的覆蓋策略。在信號采集環節依據指標體系開展全IT資源可觀測能力建設;在信號關聯環節進行Tracing數據關聯、告警數據規范化,實現跨層數據打通;在信號告警環節制定精準告警策略,統一規范告警通知及處置動作,實現用戶側感知一致。

實踐二:解決業務可觀測鏈路完整度缺失。
在可觀測能力建設中,將信號采集、信號關聯和信號告警的三大支柱數據的實現互聯互通。基于對用戶體驗、網絡、服務器、操作系統、數據庫、中間件、應用軟件的可觀測性數據的采集,形成日志、指標和追蹤數據的關聯分析,實現了在一個可觀測性系統中聯動分析與下鉆,通過多個信號或視角來觀測系統時,更加的靈活和平滑,大大提高了分析的效率和精準度,減少排障時間。

實踐三:解決現有研運體系(DevOps、CMDB、ITSM)缺少可觀測能力。
可觀測性平臺與金茂體系內DevOps流程深度融合,在應用的發布流程中結合可觀測性信號采集的不同形式探針,形成系統發布時即具備了完成的可觀測性,將可觀測性能力左移到開發測試階段,上線即納管,增強系統上線后的健壯度,提高運維管理效率。

建設成效:
- 助力金茂集團內重點系統開展常態化監測預警,配置7×24小時主動觀測能力,使各類用戶體驗問題可控、可量、可管。
- 助力金茂集團實現覆蓋終端、網絡、主機、中間件、應用系統的多維可觀測能力體系建設,并搭建閉環流程實現數據告警事件閉環處置。實現對多類告警場景的統一格式展示,目前已在各重點業務系統中落地應用。
- 集團內系統整體性能及用戶體驗數據優化效果顯著。通過質量優化專項優化行動,用白屏時間、首屏時間、可交互時間、慢頁面占比、后端錯誤數和數據庫響應時間的六大指標對用戶體驗形成標準化評估規范,實現業務價值快速規模化落地。
- 將可觀測能力與DevOps流程接入,在代碼集成發版環節通過CICD方式進行觀測能力自動嵌入,實現項目全生命周期可觀測。
全面數字化時代已經到來,企業數字化發展不僅要注重產出也要注重成果,基調聽云已全身心投入數字經濟新藍海建設中,積極發揮數字時代下產品及平臺的“融匯”、“融通”、“融智”的核心優勢,攜手金融行業及等更多行業玩轉數字時代
2022-08-23



