前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

▎藥明康德內容團隊編輯

人類或許從沒有像現在一樣接近破解蛋白摺疊的秘密。

蛋白質存在於每一個細胞中,參與到基因表達、細胞發育和代謝等各種過程。它們由氨基酸搭建成線性的分子,並且會自發摺疊成3D的形狀。參與構建的氨基酸可以從幾十個到幾千個不等。

儘管氨基酸和蛋白質都很常見,但不代表人類真的能參透其中的機制。原因在於根據不同的氨基酸和序列,

蛋白質能摺疊成的構型數量是一個天文數字

為了破解其中的秘密,生物學界曾於1994年開始舉辦國際蛋白質結構預測競賽(CASP)來吸引全世界最前沿的實驗室挑戰預測蛋白摺疊。CASP使用稱為GDT的評分系統來評估預測蛋白結構的精確性。這個評分從0到100,如果評分達到90分以上,可以認為預測的結構與實驗手段獲得的結構相當。

2018年,DeepMind開發的第一代AlphaFold首次參加CASP就拔得了頭籌,而在2020年的第14屆CASP中,

AlphaFold系統對所有蛋白靶點3D結構預測的中位GDT評分為92.4分

。即便是針對最難解析的蛋白靶點,AlphaFold的中位GDT評分也達到了87。0分。在接受檢驗的近100個蛋白靶點中,AlphaFold對三分之二的蛋白靶點給出的預測結構與實驗手段獲得的結構相差無幾。

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

▲2006-2020年CASP比賽中最佳蛋白摺疊預測系統的評分表現(圖片來源:DeepMind Blog)

今年7月,華盛頓大學David Baker教授的實驗室在《科學》上發表了不同於AlphaFold策略的RoseTTAFold演算法,它同樣能夠在10分鐘根據氨基酸序列預測出蛋白結構。而就在上個月,

兩種AI更是聯手預測了真核生物蛋白質複合體的三維結構,實現了從單體到複合體的突破。

但我們要知道的是,AI能帶來的驚喜總是沒有上限的。這一次,《自然》的新研究展示了AI的強大想象能力,它不僅能預測結構,甚至能自己幻想出新的蛋白結構,再次震驚了學界!

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

新研究中,研究者不再給AI(trRosetta)一些已知蛋白結構的氨基酸序列進行預測,

而是向它們提供一些隨機的序列,並且會向其中引入一些突變

,直到AI的神經網路確定能夠將這些序列摺疊成穩定的結構為止。“我們不會在任何時候引導AI朝特定方向前進,一切都依靠它們的想象,”在Baker實驗任職的Ivan Anishchenko博士表示。

這一點有些類似Google DeepDream的工作原理,DeepDream的網路會透過大量的訓練識別面部和其他模式的照片,然後將這些“知識”逆向使用,透過模糊的照片推測出清晰的模式。而新研究同樣如此,trRosetta的神經網路已經在許多預測中獲取了許多有關蛋白序列和結構的資訊,現在便是時候讓它逆向推測了,研究者給它一個隨機的未知(模糊)序列,直到它能想象出穩定的結構(清晰)。

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

▲新研究設計的AI“想象”策略

(圖片來源:參考資料[2])

研究中提供的都是包含100個氨基酸的隨機序列,這些氨基酸之間的距離分佈和特點要比天然蛋白的更加模糊。為了讓AI想象出的蛋白差異化更明顯,研究者還會在隨機的位置替換掉一些氨基酸,改變殘基對分佈序列。

在大量訓練和學習之後,

trRosetta利用隨機的序列產生了2000種全新的蛋白結構,這些結構與天然蛋白相似性非常低

。此外,這些想象的結構非常多樣化,彼此之間有很大差別。這些蛋白都含有常規的α螺旋和β摺疊,但並沒有天然蛋白會有的環狀和其他結構。

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

▲想象出來的蛋白結構和實際形成的相差無幾

(圖片來源:參考資料[2])

此外,Baker實驗室與華盛頓大學合作,他們獲得了129個“想象”蛋白的合成基因,然後透過基因工程在大腸桿菌中獲得了這些蛋白。透過結合核磁共振和X射線晶體成像技術,研究者確定AI想象的蛋白結構和實際形成的結構幾乎是一樣的。“它們想象出的蛋白結構準確率非常高,即使這些序列在天然蛋白沒有相近的序列,” Anishchenko博士表示。

當AI有了想象能力,醫學的未來發展將變得完全難以預料。

當研究者有工具任意地設計想要的蛋白時,任何以蛋白為基礎的藥物、酶都能隨心所欲的獲取。

參考資料:

[1] Deep learning dreams up new proteinstructures。 Retrieved Dec 1st, 2021 from https://www。eurekalert。org/news-releases/936470

[3] AlphaFold Is The Most ImportantAchievement In AI—Ever。 Retrieved Dec 1st, 2021 from https://www。forbes。com/sites/robtoews/2021/10/03/alphafold-is-the-most-important-achievement-in-ai-ever/?sh=896306d6e0af

更多推薦

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

前沿 |《自然》新研究讓幻想成真!AI成功想象和構建出前所未有的蛋白結構……

點個“在看”再走吧~

TAG: 蛋白AI結構序列想象