CPU被GPU按在地上摩擦了一次,這次又被CIPU蹂躪?

2022年6月13日,我首次以線上的形式圍觀阿里雲峰會。

作為一場行業峰會,資訊量自然很大,阿里雲談了很多理念,釋出了一些新服務。不過,我最感興趣的還是——CIPU(Cloud infrastructure Processing Units),這是阿里雲在會上宣佈推出的雲基礎設施處理器。阿里雲的野心很大,認為CIPU未來或將替代CPU成為雲計算的管控和加速中心。

CPU被GPU按在地上摩擦了一次,這次又被CIPU蹂躪?

替代CPU,話題性十足,引發了各方討論。

在過去很多年,關乎晶片這個概念,CPU是第一主角,因為CPU處理器規格決定了一臺伺服器工作效能的高低。後來GPU出現了,不過GPU只是配角,它最初僅僅作為Windows影片遊戲的加速器。

沒人能想到,隨著人工智慧、元宇宙、自動駕駛等理念深耕發展,更符合前沿市場運算需求的GPU被各大企業青睞,GPU超過CPU,成為市場新主角。一個典型的標誌事件在於,GPU代表企業英偉達市值超過CPU代表企業英特爾,並且超過了一倍有餘。

CPU被GPU按在地上摩擦了一次,近年又被IPU、DPU等概念衝擊。現在阿里雲釋出的雲資料中心處理器CIPU,能否成為新時代的主角,繼續蹂躪CPU?

算力就是競爭力的新時代 CIPU架構擁有更大用武之地

眾所周知,過去多年,用CPU管理和加速計算、網路、儲存等基礎設施是常態。然而進入AI時代,千百萬個行業生產的資料已經達到天文數字,傳統以CPU為中心的計算體系架構日漸面臨計算與網路傳輸時延的高要求與整體I/O效能虛擬化損耗的挑戰。

時至今日,網際網路大資料不僅僅涉及網際網路行業,它也和我們的日常生活、生產息息相關,我們的工業、農業、教育、醫療等等,每一個行業都離不開資料,都需要資料的互動、計算、傳輸、儲存、應用,也亟需數字化、資訊化的工具來提升效率,亟需高效能的雲計算服務來降本增效。

簡單來說,進入萬物網際網路新時代,算力就是核心競爭力,提升算力,就是提升生產力。

算力有多重要?舉個例子,在《倚天屠龍記》中,張無忌的內功不精純(演算法一般),但也震驚了張三丰,“只覺掌心中傳來這股力道雄強無比,雖然遠不及自己內力的精純醇正,但泊泊然、綿綿然,直是無止無歇、無窮無盡。” 為什麼會有如此功效?簡單來說,如果張三丰體內有100臺伺服器,張無忌就有200臺,算力大了一個層級。

這兩年,國家大舉推進“東數西算”戰略,也是基於最佳化我國大資料算力結構、提升我國算力競爭的考量。當然,算力提升最終帶來的價值不僅僅是各大科技公司的降本增效,而是全社會效率的提升。“東數西算”節約了電費、土地成本、算力成本,卻又提升、統籌、優化了算力資源,一舉多得,自然降低了方方面面的運營成本,成本的降低,必然提升廣大市場主體的創業積極性,進而提升社會效率。

在萬物互聯的人工智慧時代,同樣的演算法,如果算力足夠強大,就能發揮不一樣的效應。阿里雲作為行業領導者,敏銳洞察到行業發生的深刻變化,推出綜合了多種技術和服務的CIPU架構,在這個全新體系架構下,CIPU對資料中心的計算、儲存、網路資源快速雲化並進行硬體加速,按照阿里雲的說法,CIPU與計算結合,算力可以做到“0”損耗。

CIPU架構推出的直觀價值,就在於算力的提升。這個架構超脫於傳統,但沒脫離傳統,它將傳統通用計算單元、滿足特定工作負載的加速計算單元、以及滿足網路和儲存功能的加速單元進行高速互聯協調(相當於把實現各類功能需求的軟硬體打包在一起),組合成一個完整的分散式異構算力模組,就像張無忌一樣,一個人融合了九陽神功、乾坤大挪移、太極拳等多種武功,可以按需解決敵人。CIPU架構也是如此,因此能高效滿足複雜多變的雲上資料中心算力場景。

行業形成共識:阿里和京東先後革新架構

正如前文所言,以CPU為中心的計算體系架構已經無法滿足當今大資料、人工智慧時代的需求,這不僅僅是阿里雲一家的認知,也正在成為行業共識。至少,阿里的老朋友京東,也是這麼認為的。

在阿里雲宣佈推出CIPU的道路上,京東雲圍繞產業數字化需求推出“京剛”軟硬一體虛擬化架構,不僅能將虛擬化損耗降至零,保留物理機的計算資源和效能,還全面支援雲主機、裸金屬雲主機、原生容器,釋放雲計算低成本優勢;在今年618期間首次大規模應用,京東雲釋出的統一儲存平臺雲海,基於高效能的存算分離架構,可以實現資料統一儲存、統一管理,資料自由流動,對OLTP/OLAP等場景的計算儲存資源實現解耦並降本增效,成本節省30%~50%。

從CIPU的特性來看,CIPU與計算結合,快速接入不同型別資源的伺服器,帶來算力的“0”損耗,以及硬體級安全的加固隔離;CIPU與儲存結合,對存算分離架構的塊儲存接入進行硬體加速,雲盤儲存IOPS最高可達300萬,長尾時延降低50%;CIPU與網路結合,可對高頻寬物理網路進行硬體加速,構建大規模彈性RDMA高效能網路,時延最低可達5us。

阿里雲和京東雲乾的事情,本質來說就是透過計算架構的升級,解決了算力損耗難題,同時最佳化儲存和網路頻寬,幫助廣大企業和機構在使用中降本增效。

當然,阿里雲更進一步,早年研發的飛天作業系統,這個時候可以和CIPU直接融合適配,進而形成了雲上的統一虛擬資源池,並供客戶使用雲上算力。

有意思的是,作為CPU時代的霸主英特爾,也開啟了自我革命。近期,在英特爾2022On產業創新峰會上,英特爾也公佈了第四代英特爾至強可擴充套件處理器(代號Sapphire Rapids)細節,內建人工智慧深度學習加速技術和資料流加速器,從軟硬體同時入手最佳化AI工作負載,為各行各業的資料計算和管理賦能。

CPU被GPU按在地上摩擦了一次,這次又被CIPU蹂躪?

英特爾自身也認識到CPU架構在大資料、雲計算時代的侷限,進行了從CPU到XPU的全面佈局。不過英特爾的歷史包袱太重,思想轉變的同時業務體系很難及時跟進,出現了頭重腳輕的狀況。希望華為、京東、BAT等企業,能夠反過來倒逼英特爾,助推這家企業銳意轉型,新時代不能少了英特爾。

架構革新背後:牢牢掌握雲計算的未來主動權

鄭緯民院士當天參加了阿里雲峰會,他認為阿里雲提出的CIPU,使得中國在爭取雲計算的定義權中處於有利位置,改變了原本由西方技術制定的遊戲規則,讓我國IT產業建立了全球領導力。這一改變格局的事,讓我對中國在下一個技術時代擁有自己的一席之地表示樂觀。

CPU被GPU按在地上摩擦了一次,這次又被CIPU蹂躪?

阿里雲能否擔得起這樣的讚譽另當別論,但我國爭取把握IT發展全球主動權是不爭事實。

平心而論,在IT底層技術和架構層面,我們還落後於西方(其實就是美國),但在應用層面,也就是“網際網路助力人民美好生活”這個層面,我們比西方領先。由於我國較早將網際網路提升到國家戰略,現在中國接入網際網路的行業,以及相關的企業、個體,都超過全球任何一個國家。當在家點外賣、掃碼買紅薯成為生活常態後,那麼我們國家產生的資料維度也比任何一個國家更為豐富,資料價值可以裂變的關聯價值也就更多。

因此,我們有必要爭取把握IT發展主導權,從底層架構到適配作業系統、軟硬體一體化層面進行革新。我們要走一條中國特色的道路,讓網際網路、大資料、雲計算繼續深入生活、工作、農業生產的方方面面,產生更大的價值。

所以,我們看待阿里雲以及華為雲、騰訊雲、百度雲、京東雲的價值,不要看這些企業自身獲取了多少營收、賺取了多少利潤,而是要看它們給廣大社會主體帶來的價值,這個價值無法用資料來衡量,但遠超他們自身的營收資料。

建議相關智庫機構進行系統研究,就像當年研究物流效率提升帶來的經濟效益提升一般(我國物流總費用佔GDP的比例每降低1個百分點,就可為工業企業節省超過9000億元的費用,為我國經濟和社會發展帶來超過6500億元的效益),計算出來算力提升為經濟社會帶來的價值。我想,這一定會是一個驚人的資料。

TAG: 算力CIPUCPU架構阿里