深度知識的6個維度：如何讓人工智慧真正理解世界？

2022-05-31由雷峰網發表于科技

智慧的真正標誌不是知識，而是想象力。

作者 | Gadi Singer

編譯 | 王玥

編輯 | 陳彩嫻

什麼知識讓我們變得聰明？我們用來理解世界、解釋新體驗和做出深思熟慮的選擇的認知結構是什麼？定義一個闡明給人類或人工智慧更深入理解和更高認知的知識的框架，將有助於我們對此話題進行結構化的討論。

近日，英特爾實驗室副總裁兼緊急人工智慧研究主任Gadi Singer介紹了這種賦予人工智慧更高認知的知識構建（knowledge constructs）的數個維度，並指出一條通往更高智慧機器的道路。

圖為英特爾實驗室副總裁 Gadi Singer

更高層次的機器智慧的核心，可能是讓知識構建幫助人工智慧系統組織自己的世界觀，賦予人工智慧理解意義、事件和任務的能力。如此一來，機器認知將從資料擴充套件到知識結構，包括描述性知識、世界動態模型和起源等維度。

在學習語言時，我們要區分形式（form）和意義（meaning）：形式指的是用來表達意義的符號，也就是表面的表達。每種形式在特定的語境中都有特定的含義，而形式在不同的語境中可以有不同的含義。

正如Bengio和Sch lkopf等人在“Towards Causal Representation Learning”一文中總結的那樣：“目前機器學習的大多數成功都是源於對適當收集的獨立和相同分佈（i。i。d）資料的大規模模式識別。”系統吸收可觀察到的元素，如文字字元、聲音訊號和影象畫素，並建立模式和隨機相關性，同時在基於識別的任務中產生出色的結果。

論文地址：https：//arxiv。org/pdf/2102。11107。pdf

越來越多的人認為，演算法必須超越表面相關性，達到真正理解的水平，從而實現更高水平的機器智慧。這種徹底的轉變將使所謂的System 2、3rdWave或廣義/靈活的 AI 成為可能。正如Gadi Singer在核心部落格“認知人工智慧的崛起”中所說的那樣，更高水平的機器智慧需要深層次的知識構建，這種知識構建可以將人工智慧從表面相關性轉化為真正理解這個世界。

美國國防部高階研究計劃局（DARPA）的 John Launchbury 指出，在第三次人工智慧浪潮中，抽象（比如創造新的意義）和推理（規劃和決策）將掀起一場新革命。第三次浪潮本身的特點是語境適應，即系統為現實世界的各種現象構建語境解釋模型。

知識維度中有兩個維度反映了對世界的看法，一個是

描述性維度

，描述性維度對世界上存在的事物進行了概念性的抽象，另一個是

現實世界及其現象的動態模型

。

此外，

故事

提升了人類在共同信仰和神話基礎上的理解和交流複雜故事的能力。

語境和來源歸因

以及

價值和優先順序

是元知識維度，這些維度帶來了基於條件的有效性和知識的不斷疊加。最後，

概念參考

是結構基礎，跨維度、模態和參考而存在。

這六個知識維度結合在一起，可以讓人工智慧不僅僅停留在事件相關性上，而是獲得更深入的理解，因為這六個知識維度的潛在概念是持續的，可以解釋和預測過去和未來的事件，甚至允許計劃和干預，並考慮反事實的現實——因此文中使用了“深度知識（deep knowledge）”一詞。

闡明和描述機器智慧所需的知識構建型別，有助於確定實現這種知識構建的最佳方式，從而實現更高水平的機器智慧。

支援更高水平智慧的六大知識維度

對於人工智慧系統來說，實施人類理解和交流中觀察到的知識構建可以為智慧提供實質性的價值。當所有的知識型別都得到支援和組合時，實際價值會大幅增長。

圖注：支援更高水平智慧的知識維度。圖源：Gadi Singer/英特爾實驗室

1. 描述性知識：層次、分類和屬性繼承

描述性知識（即概念性的、命題性的或陳述性的知識）描述事物、事件、事物/事件的屬性以及其之間的關係。假設使用（適當的）類或概念的分層，深度描述性知識就能擴充套件其原本的定義。這類知識可以包括事實和記錄系統。與特定用例和環境相關的事實和資訊可以作為層次知識進行組織、利用和更新。

單個人工智慧系統中使用的基礎本體（ontology）可以使用來自策劃系統的與任務相關的類和實體（例如，OpenCyc本體或AMR命名的實體型別）進行播種。這種基礎本體應該是可以透過神經網路/機器學習技術進行擴充套件——也就是說，獲取新知識就會得到新的實體，關係和類。

2.世界模型

世界上的現象模型讓人工智慧系統能夠理解情況、解釋輸入/事件以及預測潛在的未來結果並採取行動。現象模型是抽象/概括，可以分為正式模型和近似（非正式）真實世界模型；現象模型允許在特定情況下對例項使用變數和應用程式，並允許對特定例項或更通用的類進行符號操作。

正式模型的例子包括邏輯、數學/代數和物理。與正式模型相比，現實世界的模型通常是經驗的、實驗性的、有時甚至顯得有些混亂。現實世界的模型包括物理模型、心理模型和社會學模型。程式模型（“專有知識”）包括在這個類中。

因果模型可以幫助人工智慧系統發展更上一層樓。在語境發生變化的情況下，如果與因果關係等知識模型相結合，並理解了控制原因的語境和考慮反事實的能力，那麼過去的統計資料就可以有效地應用於現在從而預測未來。這些模型有助於從條件和可能因素的角度理解情況或事件。因果推理是人類思想不可或缺的組成部分，透過這種方式可以實現人類智慧級別的機器智慧。

3. 故事和指令碼

正如歷史學家尤瓦爾·哈拉瑞所說，故事構成了個人和社會的文化和世界觀的關鍵部分。故事的概念對於充分理解和解釋人類的行為和交流是必要的。故事是複雜的，在一個連貫的敘述中可能包含多個事件和各種資訊。故事不僅僅是事實和事件的集合，故事還包含了重要的資訊，這些資訊有助於發展對所呈現資料之外的理解和概括。與世界模型不同的是，故事可以被視為具有歷史意義、參考意義或精神意義。故事可以代表價值觀和經歷，這些價值觀和經歷會影響人們的信仰和行為。例子包括宗教或民族故事、神話，以及在任何層次的人群中分享的故事。

4. 語境和來源歸因

語境的定義是圍繞著某個事件併為其自圓其說提供資源的框架。語境可以看作是一種覆蓋的知識結構，調節著它所包含的知識。語境可以是持久的，也可以是短暫的。

持久的語境可以是長期的（比如從西方哲學角度或東方哲學角度獲取的知識），也可以隨著時間的推移、根據新的學習材料而改變。持久語境不會對每個任務進行更改。

當特定的本地語境很重要時，瞬態語境是相關的。單詞是根據其周圍句子或段落的區域性語境來解釋的。影象中感興趣的區域通常在整個影象或影片的語境中得到解釋。

持久語境和瞬態語境的結合可以為解釋和操作知識提供完整的設定。

知識的另一個相關方面是資料來源（又名資料追溯），其包括資料來源、在資料傳播的過程中發生了什麼以及隨著時間的推移資料將去往何方。人工智慧系統不能假設所接收的所有資訊都是正確或可信的，尤其是在被稱為“後真相時代”的情況下資訊更不可輕易相信。將資訊與其來源相關聯可能是建立可信性、可認證性和可追溯性所必需的。

5. 價值和優先順序（包括善/威脅和倫理）

知識的所有方面（例如，物件、概念或程式）在整個判斷範圍內都有相對應的價值——從最大的善到最大的惡都有對應。可以假設，人類智力的進化包括追求回報和避免風險（比如，追求吃午餐；避免被當成午餐）。這種風險/回報的關聯與知識緊密相連。潛在的得失具有功利價值；對於實體或潛在的未來狀態，還有一種基於倫理的價值。這種基於倫理的價值反映了一種道德價值觀，即“善”不是基於潛在的有形回報或威脅，而是基於對什麼是正確的潛在信念。

價值和優先順序是元知識（meta-knowledge），其反映了人工智慧系統對知識、行動和結果相關方面的主觀斷定。這為問責制奠定了基礎，應該由負責特定人工智慧系統的人認真處理。當人工智慧系統與人類互動並做出影響人類福祉的選擇時，潛在的價值和優先順序系統很重要。

6. 概念參考：消除歧義，統一和跨模態

知識是以概念為基礎的。例如，“狗”是一個抽象概念——一個有多個名稱（在各種語言中狗的說法都不一樣）、一些視覺特徵、聲音聯想等等的概念。然而不管其表現形式和用法如何，“狗”這個概念都是獨一無二的。“狗”的概念被對映到英語單詞“dog”，以及法語單詞“chien”。“狗”的視覺特徵可能如下圖：

同時“狗”也和汪汪吠叫聲對應了起來。

概念引用（Concept Reference，簡稱ConceptRef）是與給定概念相關的所有事物的識別符號和引用集。概念引用本身實際上不包含任何知識——知識駐留在前面介紹的維度中。概念引用是多維知識庫（KB）的關鍵，因為概念引用融合了概念的所有表象。

Wikidata就是集中儲存結構化資料的多維知識庫的一個很好的例子。在Wikidata中，項（items）代表人類知識中的所有事物，包括主題、概念和物件。Wikidata的條目與這個框架中ConceptRef的定義相似——只有一個關鍵的區別：在Wikidata中，術語“項”既指給定的識別符號，也指有關識別符號的資訊；而ConceptRefs 只是帶有指向KB指標的識別符號。關於概念的資訊則被填充在前面章節中描述的各種檢視中（例如與概念相關的描述性或程式性知識）。

常識

常識知識由隱性資訊組成，隱性資訊是指廣泛（且為大眾共享）的不成文的假設，人類自動運用這些假設來理解世界。人工智慧想要更深入地理解這個世界，將常識應用到情境中是必不可少的。在這個框架中，常識知識被認為是上述六種知識型別的子集。

理解與知識型別之間的關係

理解是智慧的基礎。向更高階機器智慧的發展引發了一場關於“理解”的討論。約書亞·本吉奧將擁有人類理解能力的人工智慧描述為：

明白因果關係，理解世界如何運轉；

理解抽象的行為；

知道如何使用以上知識去控制、推理和計劃，即使是在新穎的場景中也依然擁有這種能力；

解釋發生了什麼；

out-of-distribution（即OOD，分佈外）生成。

而以知識為中心的對理解的定義是：用豐富的知識表示建立世界觀的能力；獲取和解釋新資訊以增強這種世界觀的能力；以及對現有知識和新資訊進行有效推理、決定和解釋的能力。

這種理解觀點的先決條件是以下四種功能：

具備豐富的知識；

獲取新的知識；

能夠跨實體和關係連線知識例項；

對知識進行推理。

理解不是二元屬性，而是因型別和程度而異。這一觀點的核心是知識的本質及其表徵——知識結構和模型的表達能力可以促進理解和推理能力快速發展。

想象所有的人[和機器]

正如阿爾伯特·愛因斯坦所觀察到的：“智慧的真正標誌不是知識，而是想象力。”要真正理解，機器智慧必能超越資料、事實和故事。要重建，發現和創造一個可觀察屬性和事件背後的宇宙模型，想象力是必要的。從人工智慧系統的角度來看，想象力是透過創造性推理實現的，也就是進行歸納、演繹或溯因推理，併產生不受以往經驗和輸入輸出相關性嚴格規定的新穎結果。

知識表示和推理是人工智慧的一個成熟領域，這個領域處理關於世界的資訊表示，使計算機系統能夠解決複雜的任務。知識和推理不一定是截然不同的，而是代表了一個從已知到推斷的光譜。機器理解將透過構建知識的能力輔以先進的相關推理（例如，機率推理和似是而非推理、溯及推理、類比推理、預設推理等）來得到實現。

建立在深度知識基礎上的神經符號AI

在使人工智慧更有效、更負責任和更高效地為人們提供支援的過程中，我們的目標是使人工智慧系統更強大，同時推動人工智慧達到更高的認知和理解水平。科學家已經在處理資料、識別模式和尋找轉瞬即逝的相關性方面取得了巨大的進展，但仍有必要思考哪些知識型別能賦予人工智慧系統對世界建模和理解世界的能力。

當我們對人工智慧獲得更高層次的認知所需要的知識結構的型別有了更深的理解時，我們就可以繼續在這個深度知識的基礎上進行構建，使機器能夠真正地理解世界。

https：//community。intel。com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/Understanding-of-and-by-Deep-Knowledge/post/1385497

雷峰網

TAG：知識人工智慧語境理解模型

深度知識的6個維度：如何讓人工智慧真正理解世界？

相關推薦