RL

南大最新綜述論文：基於模型的強化學習

南大最新綜述論文：基於模型的強化學習

與無模型強化學習（model-free reinforcement learning， MFRL）方法相比，智慧體只能使用從與真實環境的互動中取樣的資料，稱為經驗資料，MBRL方法使智慧體能夠充分利用學習模型中的經驗資料...

日期：2022-08-02TAG： RL 模型 MBRL 學習策略

無模型強化學習

設計獎勵機制的問題是無模型強化學習中的另一個關鍵部分，如果可以在訓練過程中設計高效的獎勵機制，則可以減少 agent 與環境的互動次數，提高樣本利用率，從而降低實驗成本...

日期：2022-06-02TAG：學習模型強化 RL 環境