作為智慧社會的底座、數字經濟的引擎,算力的重要性已經被提到一個前所未有的高度。當下,算力的提升仍然面臨著多個維度的挑戰,算力發展亟需變革。
先進計算技術指代一切從計算理論、計算架構、計算系統等層面有效提升現有算力規模、降低算力成本、提高算力利用效率的創新性技術。
為了解決算力挑戰,打破後摩爾時代的算力危機,先進計算技術將從單點計算效能的提升與算力系統的高效利用兩個方向著手突破。以量子計算、光計算為代表的先進計算技術將為人工智慧等工具搭載全新的引擎,加速人類科學復興。
在近期剛順利舉辦完的“DeepTech 創新周 2022”系列論壇上,圍繞“先進計算和智慧計算”主題進行的討論受到了行業極大的關注。本次活動,我們也邀請到了頂尖的科學家、商業領袖等共同參與,探討從硬體到架構、理論到系統層面,先進計算的下一步。
突破摩爾定律的“芯”機遇
隨著越來越多大學成立了研究腦科學、認知科學的研究團隊,腦科學、認知科學和神經科學緊密結合形成的交叉學科,被期待能帶來革命性的突破。基於對生物腦的理解,類腦計算也被視為下一代人工智慧。
類腦技術的主要出發點,在於打破當前 AI 底層網路框架層面的限制。
生物體的大腦是非常高效的,人腦的功耗只有約 20 瓦,但所能完成的事情非常複雜。蜜蜂大腦容積只有一毫克,功耗約為 0。1 個毫瓦,相當於 1 個紐扣電池就可以驅動運轉 6 個月的時間,並且用接近於零的算力,完成覓食、飛行、導航、社交一系列活動。
一個小小的“處理器”完成複雜的活動,讓無數晶片科學家想要從底層理解生物是如何感知、以及如何基於感知獲得的資料進行復雜計算的。
SynSense 時識科技的創始人兼
CEO 喬寧
表示,以動態視覺感知計算為例,我們的眼睛並不是像傳統相機一樣來成像,而是靠二維排布在視網膜上的視錐神經感知光強的變化,並生成攜帶“時空資訊”的脈衝數據流,送到大腦皮層做運算。
我們的眼睛到大腦之間也不像“馮諾依曼”系統一樣具有快取,而是基於眼睛產生的連續資料流,在大腦裡做實時的連續“時空計算”。所以,我們的大腦完成的是基於脈衝神經網路的連續時空計算,且通常這種計算比傳統的深度學習網路多一個時間域的計算維度。
仿生的類腦晶片與生物大腦一樣,其算力與網路規模相關,在實際運轉中,不太會出現峰值算力的問題。作為第三代人工智慧,仿生的類腦計算更勝任有時間相關性的實時感測資訊處理,比如複雜的行為分析、決策判斷、複雜場景理解等是很高效的。這得益於類腦感知及計算的系統優勢:類腦計算在感知的層面,資料量通常比傳統要少幾個量級;而在運算層面,類腦計算通常基於事件觸發稀鬆、連續的時空計算。
目前類腦晶片還是一個比較新的賽道,這個領域的公司也相對較少。喬寧博士於 2017 年在瑞士蘇黎世創立了 SynSense 時識科技,並帶領公司走在世界類腦晶片產業化的前列。他表示,類腦計算更關注多模態感測資訊的實時處理能力,強調精準度更高、延時更短、成本更低以及靈活性更高,類腦晶片能夠帶來的是低成本、低功耗、低延時,並且針對端側的感測資訊處理解決方案,可以賦能諸多邊端 AI 場景。
電子晶片技術目前已經越來越接近物理極限,未來我們無法期待透過把系統做得更密集來大幅提升算力。但人類社會對算力的需求增長沒有任何放緩。
金賢敏是上海交通大學的教授、長江學者,一年前,他成立了圖靈量子,是我國率先開展光量子晶片和光量子計算機的產業化公司。
金
賢敏
表示,圖靈量子的願景就是依託晶片底層技術、量子計算和光子計算研究,將光子晶片推向產業化階段。
讓量子計算、光子計算和 AI 光子處理器成為商品,將是一個具有極高上限的事業。
他認為,光子晶片作為一個底層技術在產業化方面有巨大的發展機會,甚至可能是降維打擊。因為量子計算、光子計算對晶片有極高的要求,比如損耗、速度等等,這會推動光晶片在傳統的晶片基礎之上繼續發展。
雖然我們現在感覺到算力還在高速提升,但如果能把量子計算和光子計算帶入產業,人類算力爆發還只是一個開始。
以往大部分的資料中心都以 CPU 為中心,因為資料中心的業務具有不確定性,因此資料處理需要通用和靈活的計算平臺。
但當資料量爆發式增長,CPU 已經無法有效處理所有資料,因此產生了對異構計算的需求。隨著人工智慧的興起,GPU 成為了資料中心的一部分,為了支撐 AI 的訓練和推理,未來還會有更多的異構平臺。
當資料進入到資料中心,如何合理地把資料分配到不同的平臺,成為異構計算的一個挑戰。
雲豹智慧硬體工程副總裁莫志城
認為,DPU 的出現就會逐步解決這一難題。
DPU 作為一個數據處理和運維的中樞,負責把不同的資料排程給最合適 xPU,甚至 DPU 本身也可以進行資料處理,這將是一個巨大的變革。未來資料中心所有的管理和運維都可以透過 DPU 實現。
目前業界也可以看到這方面的探索,從公開資料資訊可以查到,亞馬遜從 2016 年起每年都會消耗幾百萬片 DPU 晶片,每一臺 AWS 的伺服器裡都至少有一個定製化的 DPU 晶片。
從運營商的角度考慮,未來 DPU 承擔了資料中心管理者角色後,算力損耗可以降到 0,全部或者大部分 CPU 都可以售賣、租賃,達到最佳化成本的目的。由於 DPU 晶片複雜,現階段 DPU 的發展還有賴業界長期的投入。不管是軟體還是硬體層面,都需要長期的投入才能取得更長遠的發展,生產出高質量的 DPU 晶片,最終獲得客戶的長期認可。
讓計算變得更聰明
資料、算力增長的背後,涉及的端側裝置、協同平臺、資料儲存、處理等碳排也與日俱增,不可忽視。在碳達峰、碳中和的戰略背景下,如何提高整個數智裝置與計算的效率、降低能耗,是行業最為關注的重要問題。綠色計算在這個背景下,成為低碳算力發展的最新趨勢。
目前,國家頒佈了“3060”雙碳目標,工信部和發改委分別印發了新型資料中心發展三年行動計劃,明確的提出了資料中心綠色可持續發展,加快節能低碳技術的研發應用。
目前資料中心的耗電量已經佔了全國發電量的 2。7%,而且每年還在以 10% 的趨勢在增長,資料中心的綠色化是一個必然的趨勢。
螞蟻集團 AI 預測與博弈平臺資深總監 James Zhang 在分享中
表示,截止 2021 年,螞蟻集團已經藉助 AI 決策,幫助上萬個複雜的業務場景能夠定製化地使用計算資源。首先,綠色專案組首創了強隔離技術,把兩種業務(例如線上業務和離線業務)部署在同一種伺服器上,實現同時執行且不互相干擾,提高了使用效率。
實現綠色計算的第二個措施是分時排程,就像城市裡的潮汐車道,不同業務都有各自的業務高峰,伺服器資源也可以分時支援三種業務。
最後就是核心的技術:AI 彈性容量,讓 AI 進行全域性資源排程和分配最佳化,幫助各條業務線在利用算力方面達到千人千面的定製效果,獲得更高的計算能力,同時讓全域性計算耗能降到最低。
他表示,螞蟻集團全年減排工作組的溫室氣體總排放節約量近 3 萬噸,其中綠色計算專案貢獻了 78%。
“資料與算力就是生產力”已經成為行業的重要共識。
對資料的使用及資料安全愈發被關注,由姚期智發軔的 MPC 理論(多方安全計算),經過演變和融合逐漸形成了“隱私計算”的技術賽道。
隱私計算融合了密碼學、計算機硬體、AI 等多學科,逐漸形成了以多方安全計算、聯邦學習、可信執行環境為代表,混淆電路、秘密分享、不經意傳輸等作為底層密碼學技術,同態加密、零知識證明、差分隱私等作為輔助技術的相對成熟的技術體系。隱私計算技術當前主要成熟應用在金融、政務、聯合營銷、醫療等對隱私計算有剛性需求的行業。
目前隱私計算可以大致分為幾種方案,第一種是在傳統的資料生產鏈路上進行隱私加固。一方面遵循最小化採集的原則,同時對資料做去標識化、脫敏處理,或進行噪音處理。另外,還要保證資料計算之後的結果不會侵犯到個人隱私。
螞蟻集團隱私計算演算法總監王力
表示,隨著隱私保護技術的發展,一個新的模式被提出來:聯邦學習模式。簡單來說就是使用資料但不採集,資料始終留在使用者端而不上雲端。但目前由於端的計算能力、儲存能力不夠等原因,這項技術還沒被大規模鋪開。
在分析影象方面,王力所在團隊採取的一種方式是先分析影象包含的能量裡,有多少是對視覺化有幫助而對識別任務幫助不大,並將這部分資訊去除。
第二步就是引入隨機性,在頻率上進行隨機打亂和組合,效果就是無法反推影象原始的頻率;第三個就是引入一些不可逆的操作,丟失一些影象的原始資訊。在經過一系列處理之後,實際證明訓練出來模型的效果同樣很好。
在語音識別方面,整體的思路和影象類似,區別在於影象方面是處理頻率,而語音則是處理超頻率。此外,語音具有時間上的連貫性,所以在做隱私保護時,需要切斷連貫性,進一步保證使用者的隱私。
王力所在的團隊已經提出了一套脫敏技術的衡量標準,希望建立一套全面的多媒體隱私資料保護標準在行業進行推廣。未來也會把聯邦學習和多媒體隱私保護進行結合,探索更多場景下的隱私保護技術。
圖計算與圖形計算
圖計算,是研究人類世界的事物和事物之間的關係,對其進行描述、刻劃、分析和計算的一門技術,是前沿理論界的研究熱點。
Gartner 在《2021 年十大資料和分析技術趨勢》報告中預測,到 2025 年圖技術將應用於 80% 的資料和分析創新。圖計算技術在金融、製造、能源等領域有著廣闊的應用價值和前景,甚至在前沿的生物計算和 AI 造藥中,也能看到它的身影。
關於圖計算技術的進展和現狀,
螞蟻集團圖資料庫負責人洪春濤
在分享中表示,螞蟻集團從 2015 年開始研發圖資料庫,內部也使用了很多圖計算技術,且獲得了很好的效果。
比如雙 11 購物時,每一筆支付涉及到的風控電路都要經過圖計算,實現非常高吞吐的同時保證毫秒級的低延遲。目前螞蟻集團內部已經有 100 多不同業務線使用到了該圖計算平臺。
但整體來說,目前業界大部分圖資料庫都還在發展中,圖資料庫離已經發展了很久的關係資料庫在成熟度上還有較大差距,同時成本也較高。
另外,圖資料庫在生態上也存在標準不統一的問題,目前業界在圖查詢的語言標準上並不確定,在評判標準上也有所欠缺。因此外界對圖資料庫的應用主要是作為第二儲存。
洪春濤認為,圖資料庫未來有希望能取代關係代數成為新的計算模式,就像程式語言從低階向高階轉化。目前螞蟻也正在積極參與建立圖資料庫的標準,進一步推動這項技術的發展和應用。
圖計算和圖形計算僅一字之差,但二者的研究範疇和應用方向有的極大的區別。
澤森科工創始人張心欣
專注圖形學演算法研究多年,於 2020 年成立澤森科工,致力於用技術打造出便捷高效、集中作業的“全流程”三維內容生成軟體。公司目前已獲得數千萬元天使輪融資。
作為國內首款主打“全流程” 的 3D 內容生成軟體,澤森自研的「ZENO」系統集物理模擬、生物模擬、程式化幾何、程式化材質、實時渲染等多功能於一體,為創作者帶來了“一個平臺,操作到底“的全新制作體驗。
「ZENO」打通了所有傳統 3D 內容製作流程,並將每一製作流程的效能提升到極致,使用者僅使用一款工具即可實現創意從萌芽到視覺化呈現的全過程。相比傳統的跨平臺製作方式,「ZENO」為使用者帶來了全域性 4-5 倍製作效率提升的新體驗。
張心欣表示,隨著「ZENO」功能豐富性及效能優越性的不斷完善,我們能洞見「ZENO」未來在圖形計算處理方向的廣闊應用空間。
以算力為基礎,在大規模實際應用層面,隱私計算、圖計算和綠色計算受到行業的關注呈指數級增長。更多智慧化、智慧化的應用將湧現;綠色低碳、開放開源的算力也將會成為數字經濟時代生態共建的趨勢。