未來屬於提出問題的人

軟體工程思想家傑拉爾德·溫伯格曾經給「問題」下了個定義:問題,就是理想狀態和現實狀態之間的差別。

我們的工作,就是應對問題的挑戰。問題可能是「我想要產品檢測更準確」,「我想要快速完成重複的任務」, 或者,「我想要沙漠變成綠洲」。

「我想要沙漠變成綠洲」這個問題,是高鴻志提出來的。他是個大學生,來自甘肅省古浪縣。在這個緊貼騰格裡沙漠的縣,有幾位被稱為「治沙六老漢」的固執老農,用 38 年造林 21。7 萬畝,在風沙中一寸寸奪回耕地,保護農田。

未來屬於提出問題的人

「治沙六老漢」三代治沙人合影 | 圖片來源:視覺中國

高鴻志也想做同樣的事。不過作為自動化專業的學生,他想換一種方法。他和朋友們開發出栽種和養護樹苗的智慧機器人,這些小傢伙能在複雜沙漠地形中,找到合適的地方栽下樹苗;在巡視林地時能識別樹苗根部,精準澆水和施肥。

成為時代楷模的「治沙六老漢」憑藉毅力和人定勝天的信念,靠雙手阻住了風沙的腳步;在人工智慧(AI, Artificial Intelligence)的幫助下,高鴻志找到了解決問題的新方法,讓新時代的治沙人,有了新的眼睛和新的手腳。

那麼,AI 是怎麼幫人解決問題的?

01、智慧時代的作業系統

AI 是計算機科學的分支,它嘗試讓機器去做到那些傳統上只有人能做到的事情——聽起來很簡單,但是要實現卻很困難。自上世紀五十年代 AI 的概念提出以來,這個蘊含希望的領域讓人們激動了兩次,又失望了兩次。直到 2006 年,多倫多大學的傑弗裡·辛頓教授提出一種基於多層人工神經網路的機器學習方法,AI 才迎來了第三次發展浪潮。

人工神經網路模仿了神經元相互傳遞訊號的方式,它會在訓練資料的幫助下逐漸學習,做出的判斷越來越準確。而多層神經網路,是在資料輸入層和結果輸出層之間,夾著更多 「隱藏層」的神經網路。各層中的神經元彼此相連,構成類似大腦皮層的複雜結構。

這種讓多層神經網路從訓練資料中學習的方法,就是大名鼎鼎的「深度學習」。它是目前最受重視的機器學習方法,也是近年來 AI 迅速發展的基礎。無論是打敗李世石的 AlphaGo, 還是能聽懂我們說話的小度音箱,都是基於深度學習技術;處理人類的自然語言、看到和識別物體、轉換不同資料形式,都是深度學習技術能夠分擔人類工作的領域。

未來屬於提出問題的人

簡單人工神經網路和深度人工神經網路

在這項技術發展的早期,往往是研究者自己編寫神經網路,經由資料訓練,轉化成能解決問題的深度學習模型。很快地,人們把構建深度學習模型的幾個必要過程提煉出來,形成穩定通用的組合,構成「深度學習框架」。它們隱藏了複雜的底層工作,大幅降低深度學習的使用門檻。因其重要,框架被稱為「智慧時代的作業系統」,成為大多數 AI 使用者的入口。

許多 IT 企業都以開放原始碼的方式釋出了自己的深度學習框架,希望能將 AI 引入更多行業中。在世界上,谷歌的 TensorFlow,Meta(原臉書)的 PyTorch , 百度的飛槳 PaddlePaddle,亞馬遜的 MXNet 都擁有大量使用者,吸引了大批開發者和研究者;2020 年以來,國內又相繼出現了曠視 MegEngine、清華大學 Jittor、華為 MindSpore、一流科技 OneFlow 等等一批開源深度學習軟體框架。

但是,並不是所有的框架,都適合所有企業和場景。

網易雲音樂就碰到了獨特的問題。作為規模巨大的音樂社群,網易雲音樂希望能向用戶推薦合口味的音樂、歌單甚至直播。但是它的資料很特別:型別多,規模大,動態程度高。網易雲音樂的資料型別從聲音、資料條目直到文字都有,9,000 萬首歌,28 億個歌單,還有 2 億活躍使用者每天產生的海量評論和互動,資料關係高達千億級別以上。

經過連番測評,大多數框架都敗下陣來。最終,網易雲音樂以「飛槳圖學習」(PGL, Paddle Graph Learning) 元件為基礎升級了推薦系統,提升了冷門歌曲分發、雲村廣場、陌生人一起聽等等業務場景的效率,最高甚至提升了近一倍。

百度飛槳是目前國內最受歡迎的開源深度學習框架,綜合市場份額第一。但是,飛槳想做的並不僅僅是框架。它的目標是成為 AI 時代的基礎設施,讓 AI 能力成為即需即用的資源,像電,像自來水,像移動網際網路。

只有 AI 能力靈活可用且隨時可得時,它才能真正發揮作用,真正幫助各行各業跨入 AI 時代。那些在行業中真正實踐的人,那些面對真正問題的人提出需求、定義問題,AI 就能以強大的能力,幫助他們解決。

在網際網路高速發展的時代,IT 企業中都會有產品經理,他們是發現需求、定義問題,再組織資源去解決問題的人。好的產品經理可遇不可求。今天,在 AI 的幫助下,產品經理更需要的是懂得如何運用前沿的 AI 技術,更好更容易地解決問題。

時代變了,關鍵在於能不能提出好問題。

02、有 AI 的未來

世界是由提出問題的人推動的。提出一個好問題,往往比找到答案更重要。當萊特兄弟不再模仿鳥類飛行,而開始研究空氣動力學的時候,人類才真正能飛翔。

那麼,有 AI 的未來會是怎樣的?

百度飛槳認為,AI 應該幫助各行各業提升能力,更便捷地解決問題。AI 能力應該像大工業生產那樣標準化、模組化、自動化,讓任何人都能容易地學習和使用。

這也是目前 AI 平臺面臨的普遍問題。正如亨利·福特所說,「如果我去問人們想要什麼,他們會說想要更快的馬。」技術的發展往往先於大眾認知,有問題的人們未必意識到 AI 可以幫助他們解決問題;AI 技術的門檻還是偏高,人們未必會容易學會使用 AI 來解決問題。

飛槳想要解決這些問題,成為智慧時代的增長引擎。從 2016 年開放原始碼以來,飛槳一直致力於與開發者社群、與各種行業和企業合作,提供針對行業獨特需求的 AI 能力,最佳化與硬體的適配,以及降低學習和使用門檻。

北京大興區長子營鎮有一座植物工廠,廠長李開一個人最多可以照看 100 畝地——是過去的 5 倍。提供助力的,依然是 AI:計算機視覺元件不僅會自動識別蔬菜是否健康、能否採收,還能及時發現害蟲。搭建這樣的系統也並不困難:飛槳提供了 EasyDL 零門檻 AI 開發平臺 ,將構建深度學習模型的過程轉變成搭積木般的活動。

未來屬於提出問題的人

這是相對簡單的 AI 能力。在其他內容更繁雜、上下游更多樣的行業,飛槳使用另一種策略:開發預訓練大模型,並針對任務和行業最佳化,形成基礎能力、任務能力、行業能力的組合。

提高 AI 的「智力」,關鍵在於演算法、資料和算力。解決問題能力強的深度神經網路,需要大量資料和強大計算能力的支撐。神經網路會透過學習訓練資料,在內部為一些變數賦值,這些變數被稱作「模型引數」,是深度學習模型解決問題能力的關鍵。而預訓練大模型,就是引數很多的、用大量資料預先訓練好的深度學習模型,可以幫使用者降低建立和訓練 AI 模型的成本。

更強的計算能力,更多的資料,這是「大力出奇跡」的思路,往往有效。從 2019 年到 2021 年,模型引數的數量每年都增加一個數量級:微軟的 T-NLG 有 170 億引數, OpenAI 的 GPT-3 有 1,750 億個引數,谷歌的 Switch Transformer 的引數更是達到了 16,000 億。

未來屬於提出問題的人

大模型引數數量的迅速攀升

同樣迅速猛增的,是大模型的訓練成本。GPT-3 使用了 285,000 個 CPU 核心,10,000 個 GPU, 以每秒 400Gb 的高速網路連線 GPU 伺服器;這樣的配置,足以在全球超級計算機排行榜前五中佔據一席。在超大算力的需求下,GPT-3 訓練一次就要用掉 19 萬度電,花掉 460 萬美元。

這樣的發展是不可持續的。雖然大模型通用性強,但提升效果所需的成本增加得更快。而且,通用性強並不意味著在具體問題上表現更好。

使用者以為自己想要更快的馬,但是他們真正想要的是更快、更安全、更方便的交通工具;使用者使用某種工具,是為了解決某個問題。市場營銷大師西奧多·萊維特曾說:「使用者不想要四分之一英寸的鑽頭。他們想要的是個四分之一英寸的洞。」

AI 大模型要與應用場景匹配,才能更好地解決問題。所以,飛槳文心大模型將能力分了類。基礎大模型沉澱知識與認知推理能力,任務大模型為特定任務最佳化,行業大模型再疊加行業特有的資料和知識,來讓 AI 獲得更好的認知,幫助人們做出更好的決策。在 5 月 20 日的 Wave Summit 2022 深度學習開發者峰會上,飛槳文心大模型一口氣釋出了十個大模型,涉及多種專項任務,以及能源電力和金融兩個垂直行業。

與行業合作,讓能源電力和金融領域的任務提升效果,意味著強大的 AI 能力開始幫助人們解決重要問題了。

但是這還不夠。工具要易學易用,才能廣泛使用;飛槳文心大模型還配套了開發套件、API 以及內建了文心大模型能力的 EasyDL 和 BML 開發平臺,努力降低使用門檻,爭取讓人人都可以成為 AI 開發者。開放良好的生態,才能帶來更多創造,文心大模型共創共享飛槳生態,推出大模型創意和探索社群暘谷;飛槳平臺已經凝聚 477 萬開發者,服務 18 萬個企事業單位,建立 56 萬個解決問題的 AI 模型。依託飛槳這個平臺,百度協同產學研培養了超過 200 萬 AI 人才。

飛槳的目標很明確:讓更多人意識到,AI 可以幫助人們解決問題;讓更多人知道,如何使用 AI 來解決問題。

03、未來屬於提出問題的人

畢竟,世界是以問題來組織的。世界不在乎學科門類,只是向人們丟擲挑戰。

未來正在變得越來越快,越來越不確定。適者生存,未來屬於能敏銳地發現問題、提出問題的人。

然後,他們將和 AI 一起,面對世界的挑戰。

提出問題的人,將不僅是政治家、商業領袖或學者;他們可能是創業者,小團隊,行業專家,以及任何想把世界變得更好的人。

TAG: AI飛槳模型學習深度