讓機器人智慧體自己學會玩遊戲，強化學習庫gym很開放

2022-02-05由機智客發表于科技

這個人工智慧界的強化學習工具包很open開放，因為它就是Open AI推出的。Open AI這個用於研發和比較強化學習演算法的工具包叫Gym。既然是強化學習包，那麼理所當然支援智慧體（或者以機器人為核心）不斷完善學習。據官網介紹，Gym可是支援訓練智慧體（agent）做任何事的，比如從行走到玩乒乓球、彈球或圍棋之類的遊戲，都可以。

由於是強化學習包，因此Gym提供了多種多樣的虛擬環境，比如機器人控制，2D盒，經典控制，還有遊戲介面和第三方環境，從簡單到困難，覆蓋多種不同型別的資料。機智客認為，我們可以根據自己的強化學習演算法的需要，選擇不同的環境。我們要使用的時候，比如在Ubuntu這樣的Linux發行版系統下，可以用Python語言。

這個開源的強化學習包，還和其他的深度學習庫或數值計算庫相容，比如TensorFlow。在GitHub已經開源，當然為了便於開發，官方主要支援python語言，也將其上傳到了python官方的第三方倉庫包裡。我們可以從GitHub上clone，也可以直接用pip來安裝使用。

很自然，我們要學習這款強化學習工具包，理所當然要建立虛擬環境了。鑑於以前我們已經嘗試過多次不同的AI深度學習應用的demo了。虛擬環境準備工作已經做好了，就不介紹如何安裝conda了。

需要說明的是python的版本號，看網上有的兄弟說這個需要python3。5版本以及以上，而最新的頁面上，機智客看到GitHub官方上介紹是，支援Python 3。7， 3。8， 3。9 and 3。10。因此最好用python3。7以上版本比較合適。建立一個Gym的虛擬環境，用conda create ——name gym37jzk python=3。7命令建立一個叫gym37jzk的虛擬環境。建立後啟用進入虛擬環境，就可以clone或者install Gym了。

安裝成功Gym強化學習工具包後，就可以在終端或者程式碼編輯器裡import gym來開展強化學習的學習了。由於gym內建了很多函式和環境，所以我們可以透過方法來完成一些簡單的演示操作。比如建立一個小車倒立擺模型，比如env = gym。make（‘CartPole-v0’）。初始化重新整理，這就可以玩了。更多有趣的函式和功能，我們可以學習其中的文件和API。

TAG：學習虛擬環境 Gym 強化 Python

讓機器人智慧體自己學會玩遊戲，強化學習庫gym很開放

相關推薦