arXiv

ICML 2022開獎！復旦、上交、廈大多篇工作入選傑出論文

ICML 2022開獎！復旦、上交、廈大多篇工作入選傑出論文

pdf摘要：本文提出Adversarially Trained Actor Critic （ATAC），這是一種基於相對悲觀主義概念的離線強化學習（RL）的新型無模型演算法...

日期：2022-07-21TAG： PDF https 論文 org arXiv

奇點臨近，新研究使用資料多樣性再次大幅提升神經網路翻譯效能

研究人員說：“ DeepRacer是在機器人控制代理上成功進行的大規模深度部署強化學習的首次成功實踐，該代理僅使用原始攝像機影象作為觀察結果，並且採用無模型學習方法來執行可靠的路徑規劃...

日期：2022-02-16TAG： https arXiv org ABS VAD

風雲| 預印本平臺遭遇窘境：一篇論文被拒，預印本文庫審稿機制待變

風雲| 預印本平臺遭遇窘境：一篇論文被拒，預印本文庫審稿機制待變

我的數學預印本之旅我把文章寫好了，做成了pdf檔案，準備把它投到中國科學院科技論文預釋出平臺（ChinaXiv）...

日期：2021-05-23TAG：印本文章文庫論文 arXiv