跳转到主要内容

lrl:学习强化学习

项目描述

lrl:学习强化学习

完整文档请见 此处

概述

lrl是一个Python包,用于应用(并希望学习!)基本强化学习算法。它的目的是为试图理解计划和学习的核心概念的人提供一个初步的垫脚石,以简单环境和算法的现成实现,以良好的文档、可读性和易于消化的方式提供,从而为人们提供一个构建理解的平台。

作者编写此包的总体目标是为对强化学习感兴趣的人提供一个起点和把手,帮助他们开始学习。在这里,最快的、最有效的实现并不那么重要,而是对新主题的初学者以及具有中级Python技能的人可以阅读并从中学习的代码。

此包背后的想法最初是作为支持学生完成乔治亚理工学院OMSCS课程CS 7641:机器学习的材料。CS 7641采用自顶向下的学习方法,鼓励学生找到现有算法的实现并应用它们来了解它们的整体属性和缺陷。虽然监督学习的Python实现得到了很好的代表(scikit-learn)并且有一个学生主导的项目用于随机优化和搜索(mlrose)可用,但简单强化学习的稳健和注释良好的实现却并不普遍。此包试图填补这一空白。

安装说明

lrl可以通过pip访问

pip install lrl

或者,您可以将源代码拉取到工作目录中,以便在家中尝试

git clone https://github.com/ca-scribner/lrl.git lrl
pip install -e lrl

项目详情


下载文件

下载您平台所需的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源分发

lrl-1.0.0.tar.gz (43.3 kB 查看哈希值)

上传时间

构建分发

lrl-1.0.0-py3-none-any.whl (50.9 kB 查看哈希值)

上传时间 Python 3

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面