单实体、多任务、强化学习工具
项目描述
AgentFlow:一个用于可扩展强化学习研究的模块化工具包
概述
AgentFlow
是一个用于构建强化学习代理的库。AgentFlow提供的核心功能包括
- 切片、转换和组合 specs 的工具
- 封装和组合RL任务的工具。
与假设单个环境和代理的标准RL设置不同,AgentFlow
是为单实体、多任务环境设计的。这源于机器人应用的用例,该用例通常需要为各种技能训练RL模块,然后将它们(可能还包括非学习控制器)组合起来。
无需为每个技能实现独立的RL环境并逐个组合,使用AgentFlow
,您可以定义一个或多个SubTasks
,这些SubTasks
可以修改来自单个顶级环境的时步,例如添加观测值和定义奖励,或者隔离环境中的特定子系统,如机械臂。
然后,您将SubTasks与常规RL代理组合成模块,并使用一系列图构建操作符来定义这些模块随时间的变化流(因此得名AgentFlow
)。
图构建步骤完全是可选的,仅适用于需要类似(可能可学习的、可能随机的)状态机的用例。
组件
控制流
示例
项目详情
关闭
dm_robotics_agentflow-0.8.1-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 3693d59b2010ef0b7ac3b598e0f98c9087345b0e9c9818131b00a1d8f276f395 |
|
MD5 | f5ed120ebd948e2ce405b9ccee8104c8 |
|
BLAKE2b-256 | 5569c17bdb6fa73bc797ed68c7f437abdc1463aaf1cbd748dc8219be732e7080 |