OpenAI Gym排序环境

这些详情尚未由PyPI验证

项目链接

项目描述

排序健身房

基于2020年论文《强泛化与神经网络效率》的OpenAI Gym排序环境，该论文由Yujia Li, Felix Gimeno, Pushmeet Kohli, Oriol Vinyals撰写。Strong Generalization and Efficiency in Neural Programs

此存储库包含排序的神经网络接口环境的实现。

使用以下命令从PyPI安装（推荐）

pip install sorting-gym

导入Python包sorting_gym将暴露以下Gym环境

SortTapeAlgorithmicEnv-v0 - 基于Gym的算法环境（Gym的算法环境）的磁带环境
BasicNeuralSortInterfaceEnv-v0 - 一个接口，其中代理可以实现如冒泡排序和插入排序等简单算法。
FunctionalNeuralSortInterfaceEnv-v0 - 扩展BasicNeuralSortInterfaceEnv-v0接口以包括进入和退出函数的指令。

为了定义参数化动作空间，我们引入了DiscreteParametric(Space)类型，允许环境在离散参数空间的情况下描述不相交的输出空间。例如

from gym.spaces import Discrete, Tuple, MultiBinary
from sorting_gym import DiscreteParametric
action_space = DiscreteParametric(2, ([Discrete(2), Tuple([Discrete(3), MultiBinary(3)])]))
action_space.sample()
(1, 2, array([0, 1, 0], dtype=int8))
action_space.sample()
(0, 1)

对于不支持参数化动作空间的代理，我们提供了两个包装器（BoxActionSpaceWrapper和MultiDiscreteActionSpaceWrapper），将DiscreteParametric动作空间分别展平为Box和MultiDiscrete。

在sorting_gym.agents.scripted模块中，我们直接使用未包装的环境实现了论文中的脚本代理。

RL代理可能希望考虑支持参数化/自回归动作

目标

实现冒泡排序/插入排序环境。
实现冒泡排序/插入排序代理作为测试。
实现函数环境。
实现快速排序脚本代理以测试功能环境。
封装环境以暴露一个箱动作空间。
封装环境以暴露一个MultiDiscrete动作空间。
包括一个示例解决方案，通过强化学习训练代理。
环境渲染（至少基于文本，可选依赖项，用于使用例如pygame进行图形渲染）
从open ai gym中删除tape环境（用于在代理升级时生成更长的数据）
维护 - 许可和ci

进一步发展的想法

（如果需要）使用cython加速环境
向gym提交PR以创建离散参数空间
抽象出一个神经网络控制器混入/环境封装器？
考虑不同的/增强的指令集。而不是总是比较视图（以及邻居）中的每个指针和数据元素，具有显式的比较指令。可以扩展到其他数学指令，包括考虑指令的变量成本。
而不是传递先前参数，考虑传递当前作用域中执行的指令数量作为廉价的程序计数器。

使用pytest运行测试

pytest

构建/打包

poetry update
poetry version patch
poetry lock
poetry build
poetry publish

项目详情

这些详情尚未由PyPI验证

项目链接

发布历史发布通知 | RSS源

此版本

0.0.9

2020年8月18日

0.0.8

2020年8月17日

0.0.7

2020年8月7日

0.0.6

2020年7月23日

0.0.5

2020年7月22日

0.0.4

2020年7月21日

0.0.3

2020年7月21日

0.0.2

2020年7月20日

0.0.1

2020年7月20日

下载文件

下载适合您平台的文件。如果您不确定要选择哪个，请了解更多关于安装包的信息。

源分布

sorting-gym-0.0.9.tar.gz （16.1 kB 查看散列）

上传时间 2020年8月18日 源

构建分布

sorting_gym-0.0.9-py3-none-any.whl （18.4 kB 查看散列）

上传时间 2020年8月18日 Python 3

散列 for sorting-gym-0.0.9.tar.gz

散列 for sorting-gym-0.0.9.tar.gz
算法	散列摘要
SHA256	`a43655f2cf5f91dcfa945fde51f4918bf07d2bed889b829361bae07a04a8ef4c`
MD5	`1274acd2df1d12863f21a3fed119f626`
BLAKE2b-256	`249d4e7afd0a58362ad1044fcd4e02e01f89fd6d50f4e6eaeec55febfe7e5f74`

散列 for sorting_gym-0.0.9-py3-none-any.whl

散列 for sorting_gym-0.0.9-py3-none-any.whl
算法	散列摘要
SHA256	`70b94f442a712572ec2cc312c73dd8ba239b6f10cb5186ece250fcdd9afd1f1c`
MD5	`c086c9d9cccae5089871cf3c93d1d700`
BLAKE2b-256	`28f0ffa776ceed4add6eb8e2a57cd42f00e72b672bf04102d10959929f84cfc4`

sorting-gym 0.0.9

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

排序健身房

目标

进一步发展的想法

使用pytest运行测试

构建/打包

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS源

下载文件

源分布

构建分布

sorting-gym 0.0.9

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

排序健身房

目标

进一步发展的想法

使用pytest运行测试

构建/打包

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS源

下载文件

源分布

构建分布

发布历史发布通知 | RSS源