RL Coach 1.0.0,Python 强化学习框架

afterer
 afterer
发布于 2019年07月29日
收藏 5

RL Coach,这是一个用于培训和评估强化学习代理的开源框架。具体内容:

  • 1.0.0 版本推出融合了“更新”和“更强大”的算法,同时提高了 RL Coach 的 API 的可用性。RL Coach 1.0.0 总共添加了 27 种强化学习模型,具体而言,这些模型由引导它们达到指定目标的奖励反馈循环驱动,以及支持使用Coach作为Python库的API。此外,还有改进的文档和未指定的bug修复,以及一般的性能增强。
  • RL Coach 1.0.0 很好地发挥了批量强化学习,并启用了所谓的关闭策略评估(OPE),它测试的稳健性的学习策略(即规则集,指定 AI 代理在所有意外情况下应该做什么)的数据获取的基础上使用其他策略。
  • 另外,它还增加了对几个新的强化学习代理的支持,包括 Sample Efficient Actor-Critic with Experience Replay (宏碁),  Soft Actor-Critic(SAC)和双延迟深确定性策略梯度(TD3)。

官方指出,它只在 Ubuntu 16.04 LTS 和 Python3.5 上进行了测试。它与 OpenAI 的同名 OpenAI Gym 一起使用。

详情见说明

本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 OSCHINA 社区 [http://www.oschina.net]
本文标题:RL Coach 1.0.0,Python 强化学习框架
加载中
返回顶部
顶部