AI做顯示卡、顯示卡跑AI!英偉達實現晶片設計自迴圈?

AI做顯示卡、顯示卡跑AI!英偉達實現晶片設計自迴圈?

新智元報道

編輯:袁榭 拉燕

【新智元導讀】

用AI更快更好設計顯示卡,再用做出的顯示卡跑更快更好的AI。英偉達的這個反向營銷案例,非常巧妙。

瞭解英偉達的研發情況,已經成為每年英偉達春季GTC會議的一個常規特徵。

比如首席科學家兼研究部高階副總裁Bill Dally每年就會提供英偉達研發機構的概況和關於當前優先事項的一些細節。

2022年,Dally主要關注英偉達正在開發和使用的AI工具,這些AI正在改善英偉達自身的產品。

如果願意接受的話,這其實是一個巧妙的反向營銷案例:英偉達從製作顯示卡來做跑AI工具的公司,成為了一家AI工具用來做顯示卡的公司。

是的,英偉達已經開始使用AI智慧來有效改善和加快自家的顯示卡設計。

Dally在2022年的GTC演講中描述道:「我們的設計團隊是一個約有300人的小組,試圖在英偉達的產品設計上探索更有前瞻性的領先位置。我們有點像遠光燈,試圖照亮遠處的東西。這個團隊被鬆散地組織成兩半。

供應部分負責提供顯示卡的技術。它使顯示卡本身更好,從電路、到超大規模整合設計方法、架構網路、程式設計系統,以及讀入顯示卡和基於顯示卡的軟體的儲存系統。」

「需求部分試圖透過開發要用顯示卡才能良好執行的軟體系統和技術,來推動市場對英偉達產品的需求。

例如我們有三個不同的圖形研究小組,因為我們在不斷推動計算機圖形技術的發展。我們還有五個不同的人工智慧小組,因為使用GPU來執行AI是目前一個巨大的熱門,而且只會越來越熱。我們也有做機器人和自動駕駛汽車的小組。」

「我們還有一些以地域為導向的實驗室,如我們的多倫多和特拉維夫人工智慧實驗室。」

偶爾,英偉達公司會從這幾個小組中抽出部分人力重組個登月式專案,例如,其中一次此類專案產生了英偉達的實時光線追蹤技術。

AI做顯示卡、顯示卡跑AI!英偉達實現晶片設計自迴圈?

光追專案的組織架構圖

一如既往,2022年的研究與Dally上一年的談話有重複之處,但也有新的資訊。比如該部門的規模肯定已經從2019年的175人左右增長了很多。毫無疑問,英偉達開發自動駕駛系統和機器人的努力也已經加強了。Dally沒有多說CPU的設計工作,這無疑也在增強。

接下來呈現的是Dally演講中關於英偉達在設計晶片時越來越多地使用AI的一小部分內容。

繪製電壓下降圖

Dally指出:「作為人工智慧的專家,我們自然希望利用AI來設計更好的晶片。」

英偉達的顯示卡設計部門以幾種不同的方式做到這一點。第一個也是最明顯的方法是,可以利用現有的計算機輔助設計工具,並將AI模型納入其中。

例如,顯示卡設計部門有一個輔助設計的軟體工具,其中的AI實時測繪了英偉達的GPU顯示卡產品中使用電力變化的位置圖譜,並實時預測電壓網格下降的程度。

一般電壓下降是用電流乘以電阻下降度算出,要在傳統的CAD工具上運算出這個值需要三個小時。因為這是一個迭代的過程,一直用傳統工具的話,對設計部門來說,工作量會變得非常艱鉅。

AI做顯示卡、顯示卡跑AI!英偉達實現晶片設計自迴圈?

概念展示

英偉達的顯示卡設計部門想做的是訓練一個AI模型來獲取相同的資料。開發人員在一堆設計上如此試行過後,然後給AI輸入功率圖。AI由此產生的推理時間只有三秒。

當然,如果你包括上功率圖特徵值提取的時間,那就是18分鐘。無論如何,與傳統效果相比這都是非常快的結果。

在類似的前提情況下,顯示卡設計部門還嘗試了不使用卷積神經網路AI、而是使用圖神經網路的AI。如此處理的目的是為了估計顯示卡電路中不同節點的開關頻率,這實際上推動了前述例子中的功率特徵值輸入效率。

附帶的效果是,英偉達的開發人員能夠得到非常準確的顯示卡電路功率估計,比傳統工具要快得多,而且只用了很小的一部分時間。

預測寄生元件

Dally特別喜歡的、若干年前他作為一名電路設計師投入相當多時間的設計專案,是用圖形神經網路AI預測寄生元件(設計時未曾打算或預料到的電子元件)將會如何被附加到最終成品中。

過去,電路設計是一個非常反覆的過程,設計師會畫出一個帶了一堆電晶體標誌的電路原理圖。但他不會知道電路板的效能如何。

直到佈局設計師拿著這個原理圖,做了佈局樣品,附加了寄生元件,然後設計者才可以執行電路模擬,發現其中哪些部分不符合預期的設計規格。

然後設計師會返回去修改他的原理圖,並再次麻煩佈局設計師再跑一遍這個流程,這是一個非常漫長的、反覆的、不人性的勞動密集型過程。

AI做顯示卡、顯示卡跑AI!英偉達實現晶片設計自迴圈?

現在英偉達的顯示卡設計部門可以做到的,是訓練神經網路來預測寄生元件,而不需要讓佈局設計師製造佈局樣品才發現瑕疵。

因此,電路設計者可以非常快速地迭代,而不需要在迴圈中重複進行手動設計-佈局-再設計的步驟。

按Dally表示,與基礎真實值相比,現在英偉達的設計AI對這些寄生器件的預測非常準確。

佈局/佈線擁塞

同時,我們還可以預測晶片的佈局/佈線帶來的擁塞問題,這對晶片的佈局至關重要。

按正常的流程,晶片設計人員會做一張網格表,執行一遍佈局和佈線的過程。一般這個過程非常耗時,會花費數天的時間。

只有如此設計師們才能獲得顯示卡樣品實際的擁塞情況,光有設計圖的初始佈局是不夠的。

設計師們需要將其重構,並以不同的方式放置宏,以避開紅色的區域(如下圖所示)。紅色區域有太多交錯的線路穿過給定的區域,就像位元版「交通堵塞」。

AI做顯示卡、顯示卡跑AI!英偉達實現晶片設計自迴圈?

而像這種情況,用上輔助設計的AI之後,沒必要再跑一邊佈局和佈線,就可以拿著這些網格列表,並用影象神經網路AI對擁塞出現的位置進行基本預測,結果還算準確。

雖說還不算完美,但是能顯示哪些區域存在問題。之後設計團隊就可以在特定區域採取行動,快速完成迭代,不再需要一遍遍重複全域性佈局和佈線了。

晶片標準單元設計自動化

現有的方法都是用AI來評價人類的設計,而未來,更令人興奮的是能夠使用AI來完成設計。

Dally舉了兩個例子來說明AI如何完成晶片設計。

第一個系統叫NVCell,它結合了模擬低溫退火和加強學習,基本上能夠設計出數字積體電路的標準單元庫。

每次設計師實現了晶片技術上的升級——比方說從7奈米最佳化到5奈米,設計師都會創造出一個單元庫。

一個單元就像是一個「與門」和「或門」,是一種完全的加速器。

眼下,英偉達的設計部門有數千個這種單元庫。這些單元需要在新技術的框架下,遵循一套複雜的設計標準,被重新設計。

第二個,是用強化學習模型來設計電晶體佈局。

設計師們大部分都採用強化學習的辦法來放置電晶體。然而更重要的是,在電晶體放置後,一般都有很多設計規則上的錯誤,找到這些錯誤就像一款電子遊戲一樣。

事實上,強化學習就擅長這個。一個很好的例子就是,強化學習在Atari電子遊戲上的應用。

所以,這就像是一款Atari電子遊戲,只不過,這次是一款修正標準單元中設計上存在的錯誤的遊戲。

透過強化學習,英偉達的設計師可以篩查一遍出現的設計規則錯誤,然後修正它們。這樣,設計師就可以基本完成標準單元的設計工作了。

如下圖所示,92%的單元庫都可以用這個工具做好,不會存在任何設計規則上的錯誤或是電路上的錯誤。

此外,12%的單元比人工設計的單元都要小。總的來說,從單元的複雜性上看,AI設計的單元和人工設計的一樣好。

AI做顯示卡、顯示卡跑AI!英偉達實現晶片設計自迴圈?

這可以幫助設計師完成兩件事。

第一,應用AI能極大地節省勞動力。沒有AI的話,大約需要一個10人小組耗時一年來建立一個新的技術庫。而如今,設計師可以用幾個GPU,跑幾天就行。

然後,人工只用介入剩下那8%AI未能完成的單元就好了。

在大多數情況下,設計師憑藉AI往往能做出更好的設計。

所以說,不光省時省力,做出來的東西還更好。

參考資料:

https://www。hpcwire。com/2022/04/18/nvidia-rd-chief-on-how-ai-is-improving-chip-design/

TAG: AI偉達顯示卡設計設計師