身處數字時代,數字化轉型對企業的重要性不言而喻。統計數據顯示,91%的企業都參與了某種形式的數字化計劃。87%的企業認為數字化將顛覆他們的行業。政策驅動、技術發展等等因素都在推動著企業走向數字化領域,從而在激烈的市場競爭中脫穎而出。
然而,隨著數字化的逐步深入,云原生的廣泛應用讓分布式架構取代了原有的單體架構,微服務、容器、Serverless等部署方式能讓企業低成本、快速實現搭建的同時,也會讓整個系統愈加復雜,對企業IT能力要求變高,傳統的被動“監控”難以追蹤分布式架構中的通信路徑和相互依賴關系,尋找和排查問題更是難上加難,維護運營成本飆升。一旦出現問題,可能“牽一發而動全身”。
例如,8月28日,英國空中交通管制系統發生技術故障,當天有1500多個航班被取消,約占該系統需管制航班數量的四分之一,其影響持續數日之久,預估損失超過1億英鎊。數字化轉型背后,其實是對企業的監控系統提出了新要求。

從傳統監控到可觀測性
企業尋求變革以滿足不斷增長的需求
隨著微服務及容器化的普及,服務粒度細化,不同的服務模塊甚至由不同的語言開發,運行在不同云環境,排查定位系統問題的難度呈指數級擴散。據CSDN年度重要調研報告《2022-2023 中國開發者調查報告》結果顯示,開發者廣泛認為復雜性高、規范 API 接口、降低延時和故障率,是云原生亟待解決的重要的問題。云原生技術的廣泛應用使得 IT 系統環境變得更加復雜,微服務和容器產生了大量的數據,包括指標、事件、日志等。另外,DevOps實踐讓開發工程師和運維工程師共同對服務的穩定性負責,研發開始引入全鏈路追蹤系統,幫助快速定位問題;同時也需要在研發過程中輸出更多輔助定位系統問題的應用日志。
這些種種原因,讓企業迫切需要一個新的解決方案,在多個廠商組成一套系統的背景下,能夠融入開發與業務部門的視角,及時而靈活地在運行層面發現問題、解決問題,而不僅僅依靠監控指標,“可觀測性”概念應運而生。早在2018年,CNCF就將可觀測性一詞引入IT領域,并稱可觀測性是云原生時代必須具備的能力。自此,“可觀測性”逐漸取代“監控”,成為云原生技術領域最熱門的話題之一。Gartner 將可觀測性定義為軟件和系統的一種特性,它允許管理員收集有關系統的外部和內部狀態數據,以便他們回答有關其行為的問題。然后,I&O、DevOps、SRE、Support等團隊可以利用這些數據來調查異常情況,參與可觀察性驅動的開發,并提高系統性能和正常運行時間。
至此指標、日志、追蹤都已經得到廣泛應用,2018年CNCF提出可觀測性分組,將監控、日志和追蹤相關的項目都歸入可觀測性領域,后來又引入了混沌工程。總體來說,可觀測性描述的就是“觀測-判斷-優化-再觀測”這個閉環的連續性、高效性。如果說傳統監控是告訴我們系統的哪些部分是工作的,可觀測性就是告訴我們那里為什么不工作了。從某個意義上來說,監控是可觀測性的子集和功能,可觀測性是監控的超集和延展。
基調聽云產品VP陳靖華近日受訪中也表示:任何企業的數字化系統,只有做到可觀測,才能正在被有效監控,避免在轉型過程中出現由復雜性導致的系統性能突發故障,從而提升數字化運維質量與效率。
順勢而為,性能監測Top廠商
基調聽云穩步推進可觀測性能力建設
由于疫情帶來全行業線上業務的爆發式增長,2020年前后,整個性能監控行業都在向可觀測性轉型。我們看到,作為性能監測行業第一梯隊廠商,基調聽云在轉型上有著天然優勢。CNCF(云原生計算基金會)定義的可觀測性三大支柱包括鏈路追蹤(Trace)、聚合度量(Metrics)和日志(Log)。這些也是應用性能監控(APM)的重要元素,它們幫助開發者和運維人員追蹤應用的性能問題,聚合和分析應用的各項度量數據,以及通過日志來了解應用的行為和問題,因此基調聽云入局可觀測性可謂是“家學淵源”極深。但基調聽云并不滿足于現狀,正在逐步完善自身的采集能力,打造出一體化的采集系統。

從上圖可以看到,基調聽云智能可觀測性平臺可接入600+技術棧,其中除了追蹤、指標、日志,平臺還具備拓撲關系、診斷、用戶體驗、元信息等多種核心能力,并以統一探針、追蹤、AI算法平臺、業務分析引擎等平臺級能力提供從基礎設施、云原生、應用與微服務、終端體驗、實時業務洞察等全方位的可觀測性。
基調聽云將智能可觀測性平臺建設思路分為夯實數據基礎、數據治理&應用、增強可觀測性三個階段去建設,層層推進,穩步轉型,值得業界參考。
第一階段:夯實數據基礎
- 查缺補漏,完善技術棧可觀測性數據采集能力
- 以Tracing為追蹤,全面采集APP、web、小程序、網絡及后臺系統應用指標數據;
- 以業務承載關系采集主機、云原生組件、數據庫、消息隊列指標數據;
- 采集設備,系統,應用等訪問日志,業務日志、應用日志。
第二階段:數據治理&應用
- 實現Tracings、Metrics 、Logs互聯互通,實現統一建模與轉化關聯;
- APM與基礎組件聯動分析,實現應用層全棧和基礎組件關聯,提升綜合定位問題能力;
- APM與日志聯動分析,實現應用層全棧和日志的精確對接,提高定位效率和精度;
- IT數據與業務數據聯動分析,業務指標與性能追蹤,統計分析業務數據并呈現價值。
第三階段:增強可觀測性
- 實現多源數據整合,引入先進的機器學習和AI算法模型,增強可觀測性能力;
- 歷史運維數據分析;
- 智能分析決策及設計反饋;
- 智能關聯分析、告警收斂、容量預測。
最終形成基于行業傳統的可觀測性能力——指標、追蹤、日志三大支柱之上,再加以診斷、用戶體驗,全新的五大支柱能力。
基調聽云一直致力于提升用戶體驗,無論是在數據采集、一體化的探針打造,還是數據弧倉的構建等方面。所有這些努力都源于對用戶的關注和重視。然而,系統后端的問題可以通過重啟或快速修復來解決,但企業往往無法直接了解終端客戶的個性化問題。這給用戶帶來很大的困擾,他們往往無法通過自行搜索解決問題。這些問題產生的溝通成本非常高,甚至可能導致企業失去用戶。因此,基調聽云將用戶需求置于首位,致力于提供更加優質的產品和服務,以滿足用戶的個性化需求。
基調聽云致力于通過智能可觀測性平臺實現問題的精準定位。當客戶遇到系統問題時,無需發送截圖或詳細描述問題,通過在用戶同意的情況下,運營者可以在系統后臺直接打開相應的開關。用戶只需按照指示復現操作,后臺就能夠獲取到隱去個人信息的相同頁面。通過這種方式,我們可以清晰地了解整個界面的渲染過程以及用戶的每一步操作。這有助于后端快速了解每一位終端客戶的情況,準確找出問題的根源。此外,該平臺還能夠提供關于用戶所遇到問題的相關數據以及與后端微服務平臺數據之間的關聯信息,從而幫助企業更全面地了解問題并制定更有效的解決方案。
近日,中國應用性能管理(APM)解決方案提供商和智能運維領軍企業基調聽云正式和國內增強型分析搜索引擎的開創者北極數據,達成了生態戰略合作。
2022-03-25
持續可觀測性探究,帶領用戶探索更多可觀測實踐價值,基調聽云與亞馬遜云科技圍繞現代企業在監控領域的痛點展開,幫助客戶解決從開發、測試、運維環節遇到的種種困惑
2022-08-24
2022年9月17日,國家互聯網數據中心產業技術創新戰略聯盟(NIISA聯盟)2021年度技術創新獎項評審會議成功舉辦,來自聯盟專家委員會和秘書處的近40位副主任專家應邀出席評審會。
2022-09-30



