高等數學有多難:人工智慧考高數僅得81分

據智慧科技迷,多年來,科學家一直嘗試讓AI機器人挑戰數學考試,但連年不及格,甚至低到20多分。因此,人們普遍認為人工智慧無法挑戰高數。然而近日,麻省理工的科學家基於OpenAI Codex預訓練模型在高數上透過few-shot learning的正確率達到了81%!相關研究已經被ArXiv收錄。研究者發現,讓AI解決數學問題存在多種方案。

首先,利用最新的GPT-3語言模型透過文字預訓練,使用小樣本學習僅能達到18。8%的正確率。其次,研究者嘗試使用小樣本學習和最新的思維鏈提示,正確率上升到了30。8%。最後,研究者對程式碼進行微調,使用Codex進行少量學習的方式,讓AI挑戰麻省理工學院六門數學課程中的210道問題,正確率提升到了81。1%。研究團隊的解決思路是先在文字上做預訓練,再用程式碼進行微調,把數學問題轉換成等價的程式設計問題。透過讓AI自動生成補充題乾的上下文,將題目自動生成適合模型執行的文字,再生成對應的程式碼並執行,最終解決數學問題。研究團隊下一步打算把這項技術擴充套件到更多課程並考慮運用到實際教學中。

也許以後MIT的同學期末考試裡會有AI出的題了,這項工作是第一項在人類水平上自動解決大學級數學課程問題的工作,也是第一項在規模上解釋和生成大學級數學課程問題的工作,它成功證實了程式是可以作為解決數學問題的重要方式之一。由於該方法是不需要額外培訓,因此是可擴充套件的。這是高等數學的一個里程碑。

高等數學有多難:人工智慧考高數僅得81分

TAG: AI正確率數學課程問題研究者