一个简单的随机OpenAI环境,用于训练强化学习代理
项目描述
此存储库包含一个PIP包,是一个OpenAI环境,用于模拟香蕉销售的模拟环境。
安装
安装OpenAI gym。
然后通过以下方式安装此包:
pip install -e .
使用方法
import gym
import gym_banana
env = gym.make('Banana-v0')
有关一些示例,请参阅https://github.com/matthiasplappert/keras-rl/tree/master/examples。
环境
想象你正在卖香蕉。一次一个。而且香蕉很快就坏了。比如说3天。我会卖掉香蕉的概率由以下公式给出
$$p(x) = (1+e)/(1. + e^(x+1))$$
其中x-1是我的利润。这个x-1是我的奖励。如果我没有卖掉香蕉,代理获得-1的奖励(香蕉的价格)。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源代码分发
gym_banana-0.0.3.tar.gz (4.4 kB 查看哈希值)
构建分发
gym_banana-0.0.3-py3-none-any.whl (4.5 kB 查看哈希值)
关闭
gym_banana-0.0.3.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a78405f287b9ae5872ab6514b8d013696318b4017d3a9b1c8f889ffdf17ccab0 |
|
MD5 | 0ad8e34f62cd353b2bc109b8a0714d4f |
|
BLAKE2b-256 | 39d61722a6bfa526408570503c311f64de36eda776659f5eaa9b5b6824ea07e9 |
关闭
gym_banana-0.0.3-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 19aec1c3fa2b5d9b584a2bbdc68e4b2e2b2e2071a70497b222b667611212a688 |
|
MD5 | 2ecaa6d3d1d61c7e3d0f7ba5c0ba1a87 |
|
BLAKE2b-256 | ce3f234dc47cfc3f15cc09008ea9ef4331e00703553ac81dbec3ab141f71c2f8 |