第1章 强化学习的模型

机器学习(Machine Learning,ML)是人工智能的基础和研究热点,按照不同的学习范式分类,机器学习可以分为监督学习(Supervised Learning)、非监督学习(Unsupervised Learning)和强化学习(Reinforcement Learning,RL)三大板块,其中,强化学习是一种模拟生物智能体学习最优决策过程的机器学习方法,其主要思想是智能体通过与环境的不断交互获得经验,并从经验中逐渐学习与环境交互的最佳策略。近年来,随着人工智能的发展,强化学习在自动控制、最优决策等领域获得了广泛应用。特别是在将深度学习(Deep Learning,DL)和强化学习结合之后,深度强化学习(Deep Reinforcement Learning,DRL)已经成为当今机器学习研究的热点之一。

本章首先简单介绍强化学习的概念、历史及和其他强化学习方法的联系,然后着重介绍强化学习的模型和数学表达。