進入深水區,AI 基礎設施的角色是什麼?

經過十年,人們對 AI 的認識逐漸清晰。正如前不久谷歌的工作人員聲稱 AI 聊天程式 LaMDA 擁有了意識,很快就被認為並不成立。

AI 的存在,並非為了是挑戰人類,而是為了提供工具、最佳化流程、提供效率。

就在上週,DeepMind 釋出了最新的蛋白質結構資料庫:超過 2 億個蛋白質結構,這幾乎涵蓋了科學界所有已知的有編目的蛋白質。AlphaFold 是 AI 為生物學研究提供的強大工具。有了 AI 的助力,生物學家能夠花更多精力研究蛋白質的功能,而非測量結構。

技術發展是一個疊加的程序。

AI 也需要這樣,進入具體領域,發生對話,實現其技術價值。以怎樣的形式讓交流發生,也是經歷了上一階段的 AI 創業公司需要思考的議題。而對於想應用新技術的公司,又面對需要跨越的學習門檻。

對於單個企業而言,搭建硬體、除錯演算法從頭做起不切實際。如何將需求落實為技術方案,再運用技術方案實現管理?將這個問題給到 AI 技術提供方,思考又會拆分為許多層,場景匹配演算法、演算法接入框架、晶片支援算力。

商湯正在探索的解法是「AI 基礎設施」,將不同層的技術層集中建設、按需要調配,降低使用門檻和成本。「需要推動整個的生產方式,從手工作坊向工業化量產去邁進。」商湯聯合創始人與大裝置首席科學家林達華說。「AI 大裝置」,也是商湯對軟硬一體大型通用型基礎設施的稱呼。

2022 年初,坐落在上海的「商湯科技人工智慧中心」啟動運營。第二個城市級 AI 基礎設施,商湯來到了山東。七月底,「2022 中國算力大會」在山東省濟南市召開,於「中國北方 AI 算力創新中心」正式啟動。算力大會上,商湯與山東省淄博市政府一起討論如何用「AI 基礎設施」更好地助力城市的數字化升級。

01「數字化」的下一步,與 AI 的下一步

當這個「數字化」的概念展開,是 AI 進入具體的產業場景,看到的複雜需求。

在改革開放之後,中國用極短的時間完成了城市化。大刀闊斧的歷史程序告一段落,經濟模式升級的需求持續存在,必然需要尋找新的方式。山東也在最近這幾年發力,去年的資訊科技產業營收突破 1。2 萬億元,數字經濟規模總量排到了全國第三。在數字經濟建設上,明確了十四五期間資料中心建設規劃,加快提升資料與算力基礎設施服務能力。

當一個省要實現數字經濟的發展突破,AI 恰是能夠為各行各業提供「工具」與「引擎」的技術。從這個角度而言,商湯進入山東,也是技術發展與城市化程序的交匯。

商湯在去年底上市,成為 AI 第一股。轉年初 1 月,位於上海臨港的人工智慧計算中心(AIDC)啟動運營。AIDC 集合了 2 萬多塊 GPU,支援每秒 3。74 百億億次的浮點算力,能夠支援數 10000 億引數模型完整訓練。是目前亞洲最大的人工智慧計算中心之一。為什麼作為一家軟體為核心能力的公司,會建立這樣一個大規模的基礎設施?這便要從人工智慧目前的發展階段去理解。

三次人工智慧浪潮以來,最近十年是 AI 第一次走出實驗室,進入大千世界的各種場景。

現實世界總是充滿不曾被注意的細節。

商湯 AI 大裝置事業群總裁楊帆形容。「隨著人工發展走入深水區,將面臨一個很大的挑戰:今天的 AI 解決一個問題,自身所花費的成本和代價,可能比帶來的好處還要大。」而商業化,則必須要降低成本。AI 發展至今,從硬體到軟體、框架、模型,也有一套隨之發展的技術體系,軟體能力也依靠整個技術生態而實現。

位於上海臨港的商湯科技人工智慧計算中心

商湯建立大型 AI 基礎設施,便是將發展至今技術體系中不同的資源集中在一起,在面對具體的需求時,不必從頭造輪子,快速調取合適的資源,簡單調整後適配。「我們建設了從資料準備、模型訓練到模型部署全鏈條的技術平臺。」林達華表示。

以資料標註為例,高質量標註的資料,能夠成為生產資料,訓練出優異的模型。在人工智慧產業初期,資料標註更依靠人工,隨著產業發展,高成本、低效率的人工必然需要減少。目前,在商湯自建的資料平臺上,已經整合上百個提供自動標註方案的 AI 模型。比起一般的資料標註服務,效率提升超過 60%。

02 為演算法應用降低成本

當人工智慧進入到行業,會發現生產鏈條非常長,並且場景多樣化。

林達華形容,「我們遇到很多長尾場景,響應每個具體需求的時候,成本和代價都是非常高的。因此要讓人工智慧成為未來整個國民經濟發展的根本。需要突破新的紅線,就是成本紅線。」

想更加靈活、低成本應對不同場景需求,商湯選擇將生產過程劃分為兩個階段。在第一個階段,依靠大規模算力,匯聚來自不同場景不同任務的資料,訓練出一個基礎模型。在這個基礎模型之上,再去迴應更細分的具體需求。於是在第二階段,只需要少量的資料、輕量的計算,就能夠應對需求。這使得處理單個案例的成本下降。

進入深水區,AI 基礎設施的角色是什麼?

衝壓生產線線上自動檢測

在青島,商湯和一汽解放一起開發了「5G+AI」的衝壓件表面質量線上檢測。在衝壓自動生產線的最後一環,用相機拍照,對沖壓件板材的質量和尺寸進行識別和檢測。衝壓工藝是汽車製造環節之一,是人員密集型產線。以前依靠人工檢測,缺陷檢出率較低。使用 AI 檢測之後,大大提升了檢測效率。

這個功能依靠商湯 AIDC 提供算力支援,利用商湯深泉演算法訓練平臺。深泉演算法訓練平臺是專為工業製造領域的打造智慧模型生產平臺,承接來自各種場景的業務需求。深泉平臺能夠提供模型的自動訓練,還能模型進行評估、迭代,從而篩選出最佳模型自動完成部署,供使用者進行呼叫。它存在的目的,就是幫助工業製造行業的客戶降低研發門檻。

「一個成功的人工智慧基礎設施,除了基礎的一些儲存算力外,額外有兩個點:低成本門檻、低技術門檻,換句話說就是用的起和得會用。」商湯科技副總經理楊松在圓桌討論時說。

在工業製造領域,依託演算法訓練平臺,商湯在青島也與其它工廠一起開發了多種應用。在海爾工廠中,商湯透過應用 5G+AI+MEC 識別技術,對進入工廠的車輛、裝置等進行智慧識別與管理,防止車輛進入生產重地等非行駛區域;在生產線上,商湯也與海爾構建了標準生產管理模型,對生產流程進行檢測和提示,最終使操作和檢驗達到 100% 一致性。

降低 AI 技術使用門檻,也不是僅靠 AI 公司就能夠實現。對於學習成本較高的企業而言,需要有契機與新技術發生交流。AI 真正在場景裡落地,是逐漸發生的過程。商湯表示:我們希望在產業裡面做平臺的整合,跟大家一起去努力讓訓練平臺、推理平臺的整合化更高,把一些底層技術封裝起來。

03 生態的兩端:從設施到人才

在算力大會上,由淄博市政府牽頭的「中國北方 AI 算力創新中心」正式啟動。這是一個城市級的人工智慧底座,對於淄博這座城市而言,是第一個數字經濟的基礎設施。淄博也是全國首批產業轉型升級示範區之一。

如果簡單比喻:算力是生產力,演算法是生產關係,資料是生產資料。若從產業視角來看,算力則屬於高耗能產業。因此選擇集約化的方式建造算力中心,能夠有效利用資源。

林達華表示:建設面向人工智慧場景的高效能的排程系統,帶來了更低的效能損耗,更高的資源利用。集中排程系統,就需要算力平臺作為支撐。AI 算力創新中心,也將扮演支撐者的角色。在城市數字化的過程中,淄博意識到「急需一個統一的 AI 能力中心平臺。」數字化轉型中,往往第一步是感測器等基礎設施搭建。這提供了基礎的資料。下一步,需要有效的資料分析和處理,才是智慧化的開始。

進入深水區,AI 基礎設施的角色是什麼?

AI 算力創新中心將解決資料的打通和處理問題。林達華舉例說:商湯的技術團隊建設起來了專用面向人工智慧的儲存系統,可以對數以億計甚至百億級的小檔案進行一個隨機的訪問,例如 5 秒鐘就可以讀取完成 3000 多萬輛機動車輛的資訊。

在一個城市建立AI基礎設施,短期來看,能夠解決種種應用需求;長期而言,則是 AI 持續與當地產業交流,這也為產業人才培養提供了重要環境。

目前,商湯與青島職業技術學院共建了青島市人工智慧產教科創實訓基地。

作為和 AI 技術一路成長的企業,商湯也願意與同行者一起做長期的事情。楊松在圓桌討論的尾聲說,「只有 AI 人才數量提升,每個企業才會對自身的數字化轉型和人工智慧建設,有更好的認知;這樣才會有一個總體的解決方案,去看一個具體的行業怎樣去接入到人工智慧企業去。」

TAG: AI商湯算力人工智慧技術