一个易于使用的强化学习库,适用于研究和教育
项目描述
一个用于研究和教育的强化学习库
什么是rlberry
?
编写强化学习算法很有趣! 但在这之后,我们还有许多枯燥的事情要实现:并行运行我们的智能体、平均并绘制结果、优化超参数、与基线比较、创建复杂环境等等等等!
rlberry
是一个Python库,通过几行代码就能简化你的工作,让你有更多时间开发智能体。rlberry
还提供了多个强化学习智能体的实现、基准环境和许多其他实用工具。
我们提供了一些工具,帮助你实现 可重现性、强化学习智能体的 统计分析 和 美观的可视化。
安装
安装最新(最小)版本以确保稳定。
pip install rlberry
文档中包含了更多 安装说明。
入门
在我们的 开发者文档 中,你可以找到对库的 快速入门、rlberry 的 用户指南 以及一些使用 rlberry 的教程和一些 示例。还可以查看与最新发布版本对应的 稳定文档。
变更日志
查看 变更日志 了解对 rlberry 的变更历史。
其他 rlberry 项目
rlberry-scool:这是用于教学目的的仓库。这里主要是基本的智能体和环境,以更易于学生学习的版本。
rlberry-research:这是我们的研究团队存放一些与 rlberry 兼容的智能体、环境或工具的仓库。这是一个“持续进行中”的仓库,部分代码可能不再维护。
引用 rlberry
如果你在科学出版物中使用 rlberry
,我们将非常感谢你使用以下 Bibtex 条目进行引用
@misc{rlberry,
author = {Domingues, Omar Darwiche and Flet-Berliac, Yannis and Leurent, Edouard and M{\'e}nard, Pierre and Shang, Xuedong and Valko, Michal},
doi = {10.5281/zenodo.5544540},
month = {10},
title = {{rlberry - A Reinforcement Learning Library for Research and Education}},
url = {https://github.com/rlberry-py/rlberry},
year = {2021}
}
关于我们
此项目由 INRIA SCOOL 团队 创立并积极维护。更多信息 请点击此处。
贡献
想要为 rlberry
贡献吗?请查看 我们的贡献指南。 如果你想要添加任何新的智能体或环境,请毫不犹豫地 提交一个问题!
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。
源代码发行版
rlberry-0.7.3.tar.gz (124.1 kB 查看哈希值)
构建的分布
rlberry-0.7.3-py3-none-any.whl (172.0 kB 查看哈希值)
关闭
rlberry-0.7.3.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | abd3240718a561ba00aeecb9260c91fc35aa4d1612fd4be5c500b03ec6c81878 |
|
MD5 | 789e58eb3e8c487d9fbede9ca08decdd |
|
BLAKE2b-256 | b173105dafedd008ce70490444b864e6ca005d02c2866827ffefe7c6a9cbacd4 |
关闭
rlberry-0.7.3-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | be3286ae0c76d5dfb4ba746e03870eb19a063e745c5561a6cdd43c0007f5a7e2 |
|
MD5 | 545d87e615545b2d322abc7bb55149b6 |
|
BLAKE2b-256 | 05c836d8dd5f1864565f239beb6bc1e1aa1d6d95ccd10a4b0cf4f8fc51eadb65 |