- 深度学习入门:基于Python的理论与实现
- (日)斋藤康毅
- 814字
- 2024-08-06 10:59:27
本书的理念
本书是一本讲解深度学习的书,将从最基础的内容开始讲起,逐一介绍理解深度学习所需的知识。书中尽可能用平实的语言来介绍深度学习的概念、特征、工作原理等内容。不过,本书并不是只介绍技术的概要,而是旨在让读者更深入地理解深度学习。这是本书的特色之一。
那么,怎么才能更深入地理解深度学习呢?在笔者看来,最好的办法就是亲自实现。从零开始编写可实际运行的程序,一边看源代码,一边思考。笔者坚信,这种做法对正确理解深度学习(以及那些看上去很高级的技术)是很重要的。这里用了“从零开始”一词,表示我们将尽可能地不依赖外部的现成品(库、工具等)。也就是说,本书的目标是,尽量不使用内容不明的黑盒,而是从自己能理解的最基础的知识出发,一步一步地实现最先进的深度学习技术。并通过这一实现过程,使读者加深对深度学习的理解。
如果把本书比作一本关于汽车的书,那么本书并不会教你怎么开车,其着眼点不是汽车的驾驶方法,而是要让读者理解汽车的原理。为了让读者理解汽车的结构,必须打开汽车的引擎盖,把零件一个一个地拿在手里观察,并尝试操作它们。之后,用尽可能简单的形式提取汽车的本质,并组装汽车模型。本书的目标是,通过制造汽车模型的过程,让读者感受到自己可以实际制造出汽车,并在这一过程中熟悉汽车相关的技术。
为了实现深度学习,本书使用了 Python 这一编程语言。Python 非常受欢迎,初学者也能轻松使用。Python 尤其适合用来制作样品(原型),使用 Python 可以立刻尝试突然想到的东西,一边观察结果,一边进行各种各样的实验。本书将在讲解深度学习理论的同时,使用 Python 实现程序,进行各种实验。
在光看数学式和理论说明无法理解的情况下,可以尝试阅读源代码并运行,很多时候思路都会变得清晰起来。对数学式感到困惑时,就阅读源代码来理解技术的流程,这样的事情相信很多人都经历过。本书通过实际实现(落实到代码)来理解深度学习,是一本强调“工程”的书。书中会出现很多数学式,但同时也会有很多程序员视角的源代码。