李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

智東西(公眾號:zhidxcom)

作者 | ZeR0

編輯 | 漠影

“天下佳山水,古今推富春。”

中國古代水墨山水畫的巔峰之筆《富春山居圖》是元代畫壇宗師、“元四家”之首黃公望晚年的傑作,這一傳世名畫於清代順治年間遭火焚,斷為長短兩卷,後人再無從知曉缺失的原畫。

在今日舉辦的2022百度世界大會上,百度首席技術官王海峰展示了基於百度文心大模型“補全”的《富春山居圖》。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲浙江博物館館藏《富春山居圖·剩山圖》區域性(左上),臺北故宮博物院館藏《富春山居圖·無用師卷》區域性(右上),AI補全《富春山居圖》並題詩(下圖紅框處)

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲AI補全《富春山居圖》過程

從補全的內容來看,水平如何?

黃公望紀念館負責人毛傳鑌的評價是:“與現存真跡風格一致,使兩岸畫卷走出博物館實現了合璧,光線風格統一,山水脈絡和諧,不僅符合原畫審美特點,視覺上還同樣具有觀賞價值。”

文心大模型還為畫作題詩一首,連撒貝南都直呼“太凡爾賽了”。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲文心大模型為《富春山居圖》題詩

用AI修復老照片、讓畫中人“活”起來……AI參與文物修復中的案例已經屢見不鮮,但此次用百度文心大模型“補全”富春山居圖與以往不同——在其技術支撐下,每個人都可以參與其中。

只要在百度APP搜尋“富春山居圖”,你就能參與到這一傳世之作的“虛擬修復”中,

僅需不到1秒,在中間空白處簡單勾勒幾筆,便能像專業畫家般寫意山川,補全你心中的《富春山居圖》。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲撒貝南現場體驗“AI作畫”

究竟是怎麼實現的?我們一起看看背後的技術。

一、復原《富春山居圖》背後的技術難題

要“補全”一幅傳世名畫,有三大技術難點:

高畫質晰度、高還原度、全民參與

以前許多將AI應用於歷史畫作的修復清晰度並不高,而只有實現高畫質尺寸的補全,做到逼真的細節,生成的畫作才能具備更高的藝術觀賞性。

在只有一幅《富春山居圖》樣本的條件下,要高度還原黃公望這位“元四家”之首的大師作品,呈現出與原作相近的繪畫風格,對模型的遷移學習能力則提出了極高要求。

最後,要透過H5互動,讓更多人參與到《富春山居圖》的“虛擬修復”中,難點是同時滿足所有人多樣化的創作期望和天馬行空的創意想法。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲每個人都可以藉助AI補全自己心中的《富春山居圖》

解決這些問題的利器,是大模型。

據百度技術人員介紹,文心大模型只用不到1秒鐘,就能補全《富春山居圖》這樣一幅高畫質藝術畫作,這大大提升了內容創作的效率。

因為引數量大、建模能力強,文心大模型既能確保生成清晰度較高的畫作,又能將大眾不同的補全創意實時轉化生成。

文心大模型運用了“

視覺生成大模型+單樣本微調

”的技術策略:先是學習大量的中國山水畫,實現了從山水畫“小白”向“大師”的進階,等具備“大師”水平後,它再去學習黃公望的《富春山居圖》,就能更快速地掌握這幅傳世名作的精髓,從而讓補全的畫作與現存真跡風格一致。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

考慮到使用者意圖存在很強的主觀性,要讓使用者的創作意圖得以體現,需保證生成的畫面結構與使用者的筆觸一致。

對此,百度團隊進行了大量除錯,來

確定畫作中風格與使用者筆觸的對應關係

,並且前期讓更多的使用者儘量都嘗試修復,收集、照顧不同使用者的繪製筆觸的特點,從而做好修復效果與使用者筆觸引導結果之間的權衡;同時

在部分尺度上引入隨機性

,來讓生成結果擁有更多可能性,大模型也有強大的泛化能力來保證生成結果的穩定。

像這樣的

人工智慧自主生成內容(AIGC)

,是繼UGC、PGC之後一種新的內容生產方式,它不僅能提升內容生產的效率,也會創造出有獨特價值和獨立視角的創意內容。

在百度世界大會上,百度創始人、董事長兼CEO李彥宏分享了AIGC將走過的三個發展階段:第一階段是“

助手階段

”,AIGC輔助人類進行內容生產;第二階段是“

協作階段

”,AIGC以虛實並存的虛擬人形態出現,形成人機共生的局面;第三階段是“

原創階段

”,AIGC將獨立完成內容創作。

而大模型技術的突破,正在加速這個發展趨勢。

在文心大模型的支援下,AI已具備很強的理解和生成能力,能實現創意作品的自動生成,包括AI作畫、AI寫歌、AI剪輯等。再往後發展,基於大模型的AIGC有望成為內容生產的主流模式。

“未來十年,AIGC將顛覆現有內容生產模式,可以實現以1/10的成本,以百倍千倍的生產速度,去生成AI原創內容。”李彥宏說。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

二、AI數字人背後的大腦,寫詩作曲樣樣精通

除了補全《富春山居圖》外,百度AI數字人同樣展示出強大的創作能力。

擔任今天百度世界大會的AI策劃官、助理主持人和開場嘉賓的百度AI數字人希加加,也特別展示了一把創作技能。

現場,主持人撒貝南出了個難題:“畫一張現代派、朦朧感、五彩繽紛的——貓。”

不一會兒,希加加就交出了一幅作品:

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

看起來是不是還挺切題的?

百度AI數字人已在許多場景中展現AI繪畫功底。比如近期,希加加發布並售賣和Qee熊、FE賽車合作的畫作,另一位數字人度曉曉亦創作了“無界”系列畫作並參加西安美院本科生畢業展。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲度曉曉攜AI畫作參加西安美院本科生畢業展

這些參展畫作均有AI自動生成,每幅畫的創作時間只需數十秒,效率遠超人類。

不過,AI作畫只是其AIGC能力的一小部分,自動生成內容技術賦予了數字人強大的創造力。希加加會寫詩、作曲、唱跳、實時直播,用多國語言交流;度曉曉挑戰了高考語文作文,40秒就能寫出40篇,隨機抽取的一篇分數趕超了約75%的高考考生。

像希加加、度曉曉這樣有豐富技能傍身的數字人還有很多。據百度集團副總裁袁佛玉介紹,百度智慧雲打造了一個數字人平臺“曦靈”,提供數字人的製作和運營服務,已形成了一個“AI數字人家族”。“隨著百度AI演算法的突破,我們能讓數字人制作成本十倍、百倍地下降,還能讓數字人生產週期,從動輒幾個月,縮短到小時級別。”

和AI復原《富春山居圖》一樣,這些百度數字人的AIGC能力也來自百度飛槳及文心大模型。

例如,AI數字人對話能力,使用的是對話生成大模型-文心PLATO,PLATO擁有接近真人對話水平的;數字人畫畫能力,使用的是文心大模型-跨模態圖文生成模型ERNIE-ViLG,它不僅支援自動生成油畫、水彩畫、中國畫等多種風格的影象,還能實現“看圖說話”的效果。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲文心ERNIE-ViLG圖文雙向生成統一建模框架

預訓練大模型(簡稱“大模型”)是當前人工智慧發展的重要方向,具有效果好、泛化能力強的特點,能顯著降低AI開發和應用的門檻。

談及大模型的能力,李彥宏舉例說,人的學習和記憶能力是有限的,《全唐詩》有接近5萬首,通讀都很難,背誦就更不容易了。但這對於大模型來說,根本就不是事兒。

而百度基於產業級深度學習平臺飛槳打造的知識增強大模型——百度文心大模型從大規模知識和海量資料中融合學習,學習效率更高、學習能力更強,還能跨語言、跨模態學習,一旦跨過某個奇點,就能產生真正意義上的AI原創內容。

三、從重塑內容創作,到提速千行百業

“輕輕幾筆連線山河”的背後,文心大模型已從技術創新邁進場景落地,為不同產業提供新思路。

作為國內首個可互動虛擬偶像,度曉曉在百度App中為使用者提供的全程AI陪聊功能,以及在聊天過程中表現出更高的“智商”和“情商”,也來自文心大模型的支援。這一方面意味著對話互動式搜尋新時代的到來,另一方面也是大模型支援下AIGC能力逐漸成熟的體現。

包括AIGC方向在內,文心大模型已經規模化應用於百度資訊流、智慧音箱等網際網路產品,並落地到工業、能源、教育、金融、通訊等行業的智慧化轉型升級中。

例如在媒體行業,文心大模型的理解和生成創作能力激發創意,提升內容多樣性,降低了製作成本;在保險領域應用中,文心大模型的智慧解析能力,能使文字處理效率提升30倍;在醫療領域應用中,文心大模型將每份病歷的檢查時間,從30分鐘縮短到了秒級。

目前,百度文心已釋出

20多個大模型

,既包含基礎通用的大模型,也包含面向重點任務領域和行業的大模型,以及豐富的工具與平臺,支撐企業與開發者進行高效便捷的應用開發。

李彥宏:AI將顛覆內容產業!現場1秒補全《富春山居圖》殘卷

▲文心大模型全景圖:由模型層、工具與平臺層和大模型創意與探索社群構成

在拓寬場景覆蓋廣度之餘,文心大模型也在加深產業應用的深度。

面向業界,百度文心首發了兩個行業大模型:聯合國家電網釋出

能源電力大模型

、聯合浦發銀行釋出

金融行業大模型

,透過引入行業特色資料和知識,在電力、金融相關領域提升效果顯著。

今天的百度世界大會上,百度文心又推出一個關鍵領域的大模型——

航天-百度·文心大模型

這是

世界上第一個航天領域的大模型

,從航天的場景、資料和知識中融合進行學習,可以對航天資料進行智慧的採集、分析和理解,助力太空智慧感知、規劃和控制。

近期,百度還推出文心大模型創意社群——文心·暘谷社群,希望可以讓更多使用者零距離感受文心大模型的魅力和應用創新潛力。

據介紹,百度正在嘗試透過大模型幫助提升素材和物料的生產效率、降低成本,探索文化創作、互動等場景的更多新玩法,更大限度地拓展藝術家及普羅大眾的創作空間。

結語:打破創作壁障,AI拉近藝術與生活的距離

《富春山居圖》的部分畫卷已經毀於一場大火,我們無從知曉被燒燬的真跡樣貌。

人工智慧也許並不能真正做到百分之百地還原殘畫,但它穿越時空,在古老文物與身處現代的我們之間搭起一座連線的橋。

藉助大模型等最新的AI技術,文物修復專家不再需要傾其畢生去掌握各個細分領域的技巧,便能提出更加多樣的修復方案。專家經驗與AI結合,將對書畫文物修復工作大有裨益,不僅助力還原遺失的傳統文化,也有助於推動基於中國文化藝術的數字內容創新。

而讓廣大使用者參與“虛擬修復”《富春山居圖》之類的活動形式,或許能調動更多人的興趣,去了解這幅傳奇畫作背後的奇聞逸事和它承載的厚重的歷史,去引得更多人真切地祈願,這兩幅身處兩地殘卷能早日合二為一。

當越來越多不擅長繪畫的人用AI執筆,繪出眼中所觀、心中所想,也許更多的奇思妙想將躍然紙上,藝術與生活的距離也將被進一步拉近。

TAG: AI文心模型百度居圖