讓機器人智慧體自己學會玩遊戲,強化學習庫gym很開放

這個人工智慧界的強化學習工具包很open開放,因為它就是Open AI推出的。Open AI這個用於研發和比較強化學習演算法的工具包叫Gym。既然是強化學習包,那麼理所當然支援智慧體(或者以機器人為核心)不斷完善學習。據官網介紹,Gym可是支援訓練智慧體(agent)做任何事的,比如從行走到玩乒乓球、彈球或圍棋之類的遊戲,都可以。

由於是強化學習包,因此Gym提供了多種多樣的虛擬環境,比如機器人控制,2D盒,經典控制,還有遊戲介面和第三方環境,從簡單到困難,覆蓋多種不同型別的資料。機智客認為,我們可以根據自己的強化學習演算法的需要,選擇不同的環境。我們要使用的時候,比如在Ubuntu這樣的Linux發行版系統下,可以用Python語言。

讓機器人智慧體自己學會玩遊戲,強化學習庫gym很開放

這個開源的強化學習包,還和其他的深度學習庫或數值計算庫相容,比如TensorFlow。在GitHub已經開源,當然為了便於開發,官方主要支援python語言,也將其上傳到了python官方的第三方倉庫包裡。我們可以從GitHub上clone,也可以直接用pip來安裝使用。

很自然,我們要學習這款強化學習工具包,理所當然要建立虛擬環境了。鑑於以前我們已經嘗試過多次不同的AI深度學習應用的demo了。虛擬環境準備工作已經做好了,就不介紹如何安裝conda了。

需要說明的是python的版本號,看網上有的兄弟說這個需要python3。5版本以及以上,而最新的頁面上,機智客看到GitHub官方上介紹是,支援Python 3。7, 3。8, 3。9 and 3。10。因此最好用python3。7以上版本比較合適。建立一個Gym的虛擬環境,用conda create ——name gym37jzk python=3。7命令建立一個叫gym37jzk的虛擬環境。建立後啟用進入虛擬環境,就可以clone或者install Gym了。

安裝成功Gym強化學習工具包後,就可以在終端或者程式碼編輯器裡import gym來開展強化學習的學習了。由於gym內建了很多函式和環境,所以我們可以透過方法來完成一些簡單的演示操作。比如建立一個小車倒立擺模型,比如env = gym。make(‘CartPole-v0’)。初始化重新整理,這就可以玩了。更多有趣的函式和功能,我們可以學習其中的文件和API。

TAG: 學習虛擬環境Gym強化Python