2021年蒲公英企服開放平臺1024開發(fā)者活動日前在線舉行,中國應用性能監(jiān)控和智能運維領軍企業(yè)基調(diào)聽云CEO趙宇辰,就行業(yè)關鍵性運維事件,數(shù)字化企業(yè)應對快速迭代和系統(tǒng)穩(wěn)定,數(shù)字化組織、政府如何在疫情和災害面前快速安全啟動數(shù)字化應用等相關問題與開發(fā)者進行了深入的探討,面對挑戰(zhàn)你可以放心起飛、基調(diào)聽云智能運維空中為你護航。
TracupTalk 主持人:很高興能在蒲公英1024程序員節(jié)邀請到基調(diào)聽云CEO趙宇辰先生。趙總,近期全球數(shù)字化技術(shù)水平的標桿Facebook出現(xiàn)了長達7小時的重大故障,F(xiàn)acebook的管理團隊、技術(shù)團隊、運維團隊幾乎無計可施,整個系統(tǒng)癱瘓了7個小時。那么我們的CTO、運維團隊、運維工程師是不是也面臨同樣的問題?如果這樣的事情發(fā)生在我身上,我是不是也無計可施?而關鍵的問題是有沒有辦法提前發(fā)現(xiàn)一些問題,有沒有辦法能找到一個背鍋俠,誰能幫我解決問題,誰能幫我在真正出現(xiàn)問題的時候能夠幫我解決,當然我們希望所有的問題是防患于未然。
基調(diào)聽云CEO趙宇辰:我們一直做的是軟件層面的監(jiān)控,那就像您剛剛講的Facebook的這種事件其實是經(jīng)常發(fā)生的。為什么呢?我們10年前或者15年前做監(jiān)控,往往是硬件層面監(jiān)控,但是我們現(xiàn)在發(fā)現(xiàn)其實硬件的故障已經(jīng)很少發(fā)生了,同時因為軟件設計的一些冗余,包括高可用,底層硬件件別的故障,并不會影響我們數(shù)字化整個的健康狀況。
那么用戶為什么軟件經(jīng)常出錯?因為我們知道軟件是高度迭代的,很有可能我們會每兩周或者每幾個月發(fā)布一個新的版本,去應對一些新的業(yè)務上的挑戰(zhàn),所以軟件層面的變更會特別大,也會特別多,凡事只要是變化的,他就容易出錯。所以一旦軟件進行頻繁的變動的時候、更新的時候往往會出現(xiàn)這樣或那樣的故障。
我們也聽到了很多客戶的反饋,因為基調(diào)聽云支持了國內(nèi)很多的互聯(lián)網(wǎng)客戶,包括現(xiàn)在越來越多的行業(yè)客戶,政府客戶、金融客戶,其實都有這樣的一個痛點,大家都很擔心,很多時候開發(fā)是想上新的東西,去提供更好的數(shù)字化的服務和體驗給我們的終端客戶,但是運維相對來說他們是確保數(shù)字化系統(tǒng)數(shù)字基建不要出問題,如何應對這樣一個看似好像有點矛盾,但是最終都是為了提供一個更好的數(shù)字化體驗的事情,基調(diào)聽云認為需要去做到整個的業(yè)務的數(shù)字化監(jiān)控。
以前傳統(tǒng)的監(jiān)控,我們是偏硬件層或者偏基礎架構(gòu)層,只能看到cpu內(nèi)存或者是硬盤,這樣一些偏傳統(tǒng)的基礎架構(gòu)的數(shù)據(jù),其實我們現(xiàn)在很多的客戶其實關注的是業(yè)務的連續(xù)性或者業(yè)務的穩(wěn)定性。
我們看今天系統(tǒng)上面跑了多少訂單,跑了多少合同,如果是一個ToC的可能是我有多少用戶在上面,我在我平臺上面所有的這一切是建筑在業(yè)務邏輯之上的,所以我們希望能打造一個端到端的監(jiān)控體系,就是從業(yè)務邏輯到客戶端,客戶端可能是網(wǎng)頁小程序或者是APP, App又分iOS和安卓等等,通過后端的服務器,經(jīng)過多個組件到了數(shù)據(jù)庫,這些后端的服務器上面可能跑的是Java、Python、SQL各種編程語言寫的軟件系統(tǒng),這樣形成一個整體的端到端的監(jiān)控,因為只有把這些數(shù)據(jù)抓取下來,把整個的數(shù)據(jù)鏈條打通,這樣在出現(xiàn)一個比較大的故障的時候,比如您剛提到的Facebook,包括一些之前像航空公司出現(xiàn)那些故障的時候,我們才能快速定位到說哪里出現(xiàn)了問題,而不像以前可能盲人摸象,每人看到的是系統(tǒng)的一部分對吧?
運維同學說數(shù)據(jù)庫沒問題,網(wǎng)絡說網(wǎng)絡好像也ok,前端說可能是后端的問題,就是大家會相互扯皮或者問題定位不清晰,因為每人只能看到自己的一角,我們現(xiàn)在希望數(shù)據(jù)都能抓取下來,然后再結(jié)合一點AI算法。算法是不是能根據(jù)以前發(fā)生的一些故障,或者說其他客戶發(fā)現(xiàn)的故障,以前是因為一個數(shù)據(jù)庫連接池導致了某一個服務的阻塞,然后服務阻塞又導致了可能我們面向客戶的最終的支付系統(tǒng)的故障,這樣一個鏈條的傳導。
現(xiàn)在結(jié)合人工智能,我們是不是能快速地分析到,是不是哪里可能出現(xiàn)了問題,先縮小定位的范圍,然后再最終確認到底是哪出現(xiàn)了問題,所以客戶經(jīng)常給我們提的一個需求就是能不能1分鐘發(fā)現(xiàn),5分鐘定位,10分鐘解決,這是個長期目標,也取決于自動化運維的各種工具手段。這也代表了現(xiàn)在客戶對數(shù)字系統(tǒng)的連續(xù)性有比較強的訴求。我們再往前走一步,我們未來是不是盡量連這種問題都不要發(fā)生,在出現(xiàn)這些表征的問題的情況下,我們是不是能提前的預警?例如磁盤快打滿了,或者消息隊列已經(jīng)漲得很多了,在這個時候是不是能提前做一些預警,所以這方面還需要有一些前瞻性的工作,這也是我們探索的目標。
總體而言就是希望大家在日常的運營維護數(shù)字化系統(tǒng)的時候,基調(diào)聽云能成為這樣一個背鍋俠,甚至以后可能就沒有鍋,還沒有掉下來的時候,這個鍋已經(jīng)被基調(diào)聽云接走了。
TracupTalk 主持人:感謝趙總對數(shù)字化監(jiān)控深入淺出的講解,我記得梅花創(chuàng)投創(chuàng)始合伙人吳世春先生曾經(jīng)說過:創(chuàng)業(yè)過程中不確定性永遠會存在,我們怎么辦?“強行起飛,空中加油”。我們不能等所有的bug都不存在的情況下再。您對這個觀點是怎么看的?

?
基調(diào)聽云CEO趙宇辰:
首先這其實一直是基調(diào)聽云在努力的方向。基調(diào)聽云就像一個加油機永遠伴隨在客戶產(chǎn)品的旁邊,出現(xiàn)任何問題,都能夠進行空中救援、空中支持、空中加油。確保系統(tǒng)不出現(xiàn)問題。我們在軟件開發(fā)的時候,其實起飛是很快的,但是長時間是要在空中的飛行,飛行怎么確保萬無一失,其實是一個特別難的事兒,也是我們一直基調(diào)聽云在追求的一個事情。
在數(shù)字化進程當中,不論是組織、企業(yè)、政府還是社會都需要數(shù)字化系統(tǒng)來支撐我們運轉(zhuǎn)。其實在疫情當下沒有一個數(shù)字化的健康碼,你可能是寸步難行,而健康碼我們偶爾會遇到一些問題,前不久我們也發(fā)生了一些問題,碼掃不出來了,它可能是系統(tǒng)的問題,也可能是網(wǎng)絡的問題,所以我們非常期待在數(shù)字化系統(tǒng)運行當中能有一個空中護航機,隨著我們一起去發(fā)展延伸吳世春的這句名言,“強行起飛,空中護航”。
基調(diào)聽云有十幾年歷史,最早服務了很多互聯(lián)網(wǎng)的客戶,因為互聯(lián)網(wǎng)公司他們就是建立在數(shù)字系統(tǒng)之上,特別疫情之后,我們發(fā)現(xiàn)很多的行業(yè)包括政府客戶其實都很追求數(shù)字化體驗,就像您剛才說的比如健康碼,健康碼這些小程序很多是各地政府48小時甚至24小時連夜開發(fā)上線的,上線之后一下它的訪問量就很大,比如一個城市百萬人口進出樓宇進出火車站機場都需要掃這樣的一個健康碼。它的用戶體驗關系到了民生,一旦我的健康碼掃不出來,很有可能我今天耽誤行程,甚至回家都回不了,那就造成了很大的一個困擾。
所以我們當時也是跟騰訊包括各地政府去合作,希望保障這樣一個數(shù)字化體驗。就像您說的很有可能是網(wǎng)絡的問題,當?shù)氐木W(wǎng)絡設施不太好,也有可能是前端的問題,手機適配,那是不是iOS沒問題,但安卓某一個具體的一個機型可能適配出現(xiàn)了問題,也有可能是后端服務器壓力太大,沒有經(jīng)過完整的壓力測試出現(xiàn)問題,包括一些數(shù)據(jù)庫,是不是語句寫的不夠優(yōu)美,或者是性能不夠好,導致整個體驗加載不出來,這也有可能,所以我們也會幫助各地政府去做這樣一個端到端的監(jiān)控。
其實不光是像健康碼,我們現(xiàn)在去體檢,我們現(xiàn)在去醫(yī)院掛號,可能都是用數(shù)字化的手段對吧?我們?nèi)プ鲆粋€核酸檢測,很有可能就在附近的一個醫(yī)院通過手機掛個號,然后提前注冊一下,把個人信息全部注冊進去,到了就直接掃了二維碼,就直接可以去做核酸檢測了。
在稅務方面,我們每個人可能都是通過手機的APP去報個稅,包括各地的醫(yī)保很多都是建筑在數(shù)字系統(tǒng)之上,所以我們現(xiàn)在看到各行各業(yè)其實都依賴于數(shù)字系統(tǒng)去維持我們的日常生活,吃喝住行可能都會覆蓋到,所以我們在這一塊也堅定地相信數(shù)字化體驗或者數(shù)字基建的性能和它的穩(wěn)定性、可持續(xù)性或者可觀測性,其實是未來一個非常重要的也是很大的一個契機,我們也希望能幫助我們的客戶提升他們的用戶體驗和系統(tǒng)性能。
TracupTalk 主持人:感謝基調(diào)聽云趙總給開發(fā)者朋友們帶來的數(shù)字化監(jiān)控講解和對企業(yè)全程的陪護,我相信大家聽完后也會對數(shù)字化監(jiān)控的重要性有一個新的認知。再次感謝趙總能參加1024蒲公英程序員節(jié)線上直播活動!
就像趙總提到的疫情促使各行各業(yè)加快了企業(yè)數(shù)字化進程,而越來越多的軟件加持,為企業(yè)的軟件安全和穩(wěn)定性提出了考驗,數(shù)字化監(jiān)控是一個很專業(yè)的領域,同時也是一個至關重要的領域。如果需要類似基調(diào)聽云這樣的數(shù)字化監(jiān)控軟件,小編建議可以在蒲公英企服企服開放平臺進行選擇,蒲公英企服平臺匯集了4000+ToB軟件,更多的選擇和橫向?qū)Ρ葞椭煺业竭m合您需求的軟件、產(chǎn)品與服務。
基于云原生的輕量級框架在云上通過敏捷開發(fā)快速實現(xiàn)數(shù)字化轉(zhuǎn)型的業(yè)務,目前是比較流行的做法。但是享受云原生技術(shù)帶來的敏捷和便利的同時 ,技術(shù)團隊也會面臨一些新的挑戰(zhàn),比如上層應用復雜度的增加,出現(xiàn)問題時,分析需要使用不同維度的工具,這意味著服務維持、維護運營會更加的困難。
2023-10-24
全面數(shù)字化時代已經(jīng)到來,企業(yè)數(shù)字化發(fā)展不僅要注重產(chǎn)出也要注重成果,基調(diào)聽云已全身心投入數(shù)字經(jīng)濟新藍海建設中,積極發(fā)揮數(shù)字時代下產(chǎn)品及平臺的“融匯”、“融通”、“融智”的核心優(yōu)勢,攜手金融行業(yè)及等更多行業(yè)玩轉(zhuǎn)數(shù)字時代
2022-08-23
全面數(shù)字化時代已經(jīng)到來,企業(yè)數(shù)字化發(fā)展不僅要注重產(chǎn)出也要注重成果,基調(diào)聽云已全身心投入數(shù)字經(jīng)濟新藍海建設中,積極發(fā)揮數(shù)字時代下產(chǎn)品及平臺的“融匯”、“融通”、“融智”的核心優(yōu)勢,攜手金融行業(yè)及等更多行業(yè)玩轉(zhuǎn)數(shù)字時代
2022-08-23
近日,基調(diào)聽云榮獲2023數(shù)字化創(chuàng)新突破技術(shù)獎項,這是對我們在智能可觀測性領域持續(xù)創(chuàng)新和技術(shù)提升的認可。自基調(diào)聽云智能可觀測性平臺發(fā)布上線以來,我們一直致力于為廣大用戶提供更加智能、穩(wěn)定、高效的運維服務,并不斷優(yōu)化底層技術(shù)能力以加強客戶體驗。
2023-08-21



系電話.png)