1.5 习题
1.机器学习主要分为哪几个类别?请简述强化学习与监督学习的异同点。
2.请简述强化学习的基本原理。
3.强化学习解决的是什么样的问题?
4.强化学习都有哪些分类?
5.请分别解释随机性策略和确定性策略。
6.回报、值函数、行为值函数三个指标的定义是什么?
7.请分别解释以下三对概念:学习与规划、探索与利用、预测与控制。
8.请列举2个可以使用强化学习来解决的例子,并确定每个例子的状态、动作及相应的回报值。
9.请以一个恰当的例子解释什么是智能体,什么是环境,以及两者之间的界限。