跳转到主要内容

单实体、多任务、强化学习工具

项目描述

AgentFlow:一个用于可扩展强化学习研究的模块化工具包

概述

AgentFlow 是一个用于构建强化学习代理的库。AgentFlow提供的核心功能包括

  1. 切片、转换和组合 specs 的工具
  2. 封装和组合RL任务的工具。

与假设单个环境和代理的标准RL设置不同,AgentFlow是为单实体、多任务环境设计的。这源于机器人应用的用例,该用例通常需要为各种技能训练RL模块,然后将它们(可能还包括非学习控制器)组合起来。

无需为每个技能实现独立的RL环境并逐个组合,使用AgentFlow,您可以定义一个或多个SubTasks,这些SubTasks可以修改来自单个顶级环境的时步,例如添加观测值和定义奖励,或者隔离环境中的特定子系统,如机械臂。

然后,您将SubTasks与常规RL代理组合成模块,并使用一系列图构建操作符来定义这些模块随时间的变化流(因此得名AgentFlow)。

图构建步骤完全是可选的,仅适用于需要类似(可能可学习的、可能随机的)状态机的用例。

组件

控制流

示例

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

此版本没有可用的源分布文件。请参阅生成分布存档的教程。

构建分布

dm_robotics_agentflow-0.8.1-py3-none-any.whl (143.9 kB 查看哈希值)

上传时间 Python 3

由以下支持