部分观察的视觉强化学习领域。
项目描述
Goat Herd
部分观察的视觉强化学习领域。
自己玩
您可以使用交互式窗口和键盘输入自己玩游戏。按键到动作、健康水平和库存状态的映射将打印到终端。
# Install with GUI
pip3 install 'goatherd[gui]'
# Start the game
goatherd
# Alternative way to start the game
python3 -m goatherd.run_gui
以下是一些可选的命令行标志:
标志 | 默认 | 描述 |
---|---|---|
--window <width> <height> |
800 800 | 窗口大小(像素),用作宽度和高度。 |
--fps <integer> |
5 | 每秒更新环境的次数。 |
--record <filename>.mp4 |
无 | 记录轨迹视频。 |
--num_cows |
3 | 环境中牛的数量。 |
--view <width> <height> |
7 7 | 布局大小(细胞);确定视距。 |
--length <integer> |
无 | 剧集的时间限制。 |
--seed <integer> |
无 | 确定世界生成和生物。 |
训练代理
安装: pip3 install -U goatherd
环境遵循OpenAI Gym接口
import goatherd
env = goatherd.Env(seed=0)
obs = env.reset()
assert obs.shape == (64, 64, 3)
done = False
while not done:
action = env.action_space.sample()
obs, reward, done, info = env.step(action)
环境详情
奖励
每当玩家挤奶一头牛时,都会获得+1的奖励。
终止
剧集在1000步后终止。
观察空间
每个观察结果都是一个RGB图像,显示了玩家周围世界的局部视图,以及代理的库存状态。
动作空间
动作空间是分类的。每个动作都是一个整数索引,代表可能动作中的一个
整数 | 名称 | 描述 |
---|---|---|
0 | noop |
什么都不做。 |
1 | move_left |
向左走。 |
2 | move_right |
向右走。 |
3 | move_up |
向上走。 |
4 | move_down |
向下走。 |
5 | do |
捡起放置的栅栏或挤奶。 |
6 | 放置围栏 |
放置围栏库存。 |
问题
请在Github上打开一个issue。
项目详情
关闭
goatherd-0.1.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | ccbe03c0ac7290a0d76ebab821a8251c33759f49e0c067a6d1cc284bf79d63a6 |
|
MD5 | b7809df7b9be0e084e85b08c4ac4aebf |
|
BLAKE2b-256 | 93affbe1a1bfc7bbdb1a5a75487b9e1077a1461cf0f322acda706f6988c7ecf5 |