跳转到主要内容

部分观察的视觉强化学习领域。

项目描述

Goat Herd

PyPI

部分观察的视觉强化学习领域。

自己玩

您可以使用交互式窗口和键盘输入自己玩游戏。按键到动作、健康水平和库存状态的映射将打印到终端。

# Install with GUI
pip3 install 'goatherd[gui]'

# Start the game
goatherd

# Alternative way to start the game
python3 -m goatherd.run_gui

Goat Herd Video

以下是一些可选的命令行标志:

标志 默认 描述
--window <width> <height> 800 800 窗口大小(像素),用作宽度和高度。
--fps <integer> 5 每秒更新环境的次数。
--record <filename>.mp4 记录轨迹视频。
--num_cows 3 环境中牛的数量。
--view <width> <height> 7 7 布局大小(细胞);确定视距。
--length <integer> 剧集的时间限制。
--seed <integer> 确定世界生成和生物。

训练代理

安装: pip3 install -U goatherd

环境遵循OpenAI Gym接口

import goatherd

env = goatherd.Env(seed=0)
obs = env.reset()
assert obs.shape == (64, 64, 3)

done = False
while not done:
  action = env.action_space.sample()
  obs, reward, done, info = env.step(action)

环境详情

奖励

每当玩家挤奶一头牛时,都会获得+1的奖励。

终止

剧集在1000步后终止。

观察空间

每个观察结果都是一个RGB图像,显示了玩家周围世界的局部视图,以及代理的库存状态。

动作空间

动作空间是分类的。每个动作都是一个整数索引,代表可能动作中的一个

整数 名称 描述
0 noop 什么都不做。
1 move_left 向左走。
2 move_right 向右走。
3 move_up 向上走。
4 move_down 向下走。
5 do 捡起放置的栅栏或挤奶。
6 放置围栏 放置围栏库存。

问题

请在Github上打开一个issue

项目详情


下载文件

下载您平台对应的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

goatherd-0.1.0.tar.gz (73.8 kB 查看哈希值)

上传时间 源代码

由以下支持