- 深度强化学习算法与实践:基于PyTorch的实现
- 张校捷编著
- 145字
- 2024-10-30 04:45:02
3.1 简单的强化学习环境
在所有的强化学习环境中,最简单的强化学习环境是仅仅涉及少数的状态,而且很容易给出对应奖励的强化学习环境。在第2章中,我们已经接触了两个这种类型的强化学习环境。对于这些强化学习环境,我们可以简单地写出一个实现。下面回顾一下这些环境,并给出一些常见的其他简单的强化学习环境。
在所有的强化学习环境中,最简单的强化学习环境是仅仅涉及少数的状态,而且很容易给出对应奖励的强化学习环境。在第2章中,我们已经接触了两个这种类型的强化学习环境。对于这些强化学习环境,我们可以简单地写出一个实现。下面回顾一下这些环境,并给出一些常见的其他简单的强化学习环境。