书名：深度强化学习理论与实践
作者名：龙强章胜编著
本章字数：311字
更新时间：2024-12-27 22:25:02

第1章　强化学习的模型

机器学习（Machine Learning，ML）是人工智能的基础和研究热点，按照不同的学习范式分类，机器学习可以分为监督学习（Supervised Learning）、非监督学习（Unsupervised Learning）和强化学习（Reinforcement Learning，RL）三大板块，其中，强化学习是一种模拟生物智能体学习最优决策过程的机器学习方法，其主要思想是智能体通过与环境的不断交互获得经验，并从经验中逐渐学习与环境交互的最佳策略。近年来，随着人工智能的发展，强化学习在自动控制、最优决策等领域获得了广泛应用。特别是在将深度学习（Deep Learning，DL）和强化学习结合之后，深度强化学习（Deep Reinforcement Learning，DRL）已经成为当今机器学习研究的热点之一。

本章首先简单介绍强化学习的概念、历史及和其他强化学习方法的联系，然后着重介绍强化学习的模型和数学表达。

第1章 强化学习的模型

第1章　强化学习的模型