跳转到主要内容

一个简单的随机OpenAI环境,用于训练强化学习代理

项目描述

此存储库包含一个PIP包,是一个OpenAI环境,用于模拟香蕉销售的模拟环境。

安装

安装OpenAI gym

然后通过以下方式安装此包:

pip install -e .

使用方法

import gym
import gym_banana

env = gym.make('Banana-v0')

有关一些示例,请参阅https://github.com/matthiasplappert/keras-rl/tree/master/examples

环境

想象你正在卖香蕉。一次一个。而且香蕉很快就坏了。比如说3天。我会卖掉香蕉的概率由以下公式给出

$$p(x) = (1+e)/(1. + e^(x+1))$$

其中x-1是我的利润。这个x-1是我的奖励。如果我没有卖掉香蕉,代理获得-1的奖励(香蕉的价格)。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

gym_banana-0.0.3.tar.gz (4.4 kB 查看哈希值)

上传时间 源代码

构建分发

gym_banana-0.0.3-py3-none-any.whl (4.5 kB 查看哈希值)

上传时间 Python 3

支持