Chapter 1 第1章 了解时间序列预测

时间序列存在于从气象学到金融、计量经济学和市场营销的各个领域。通过记录数据并对其进行分析,我们可以研究时间序列来分析工业流程或跟踪业务指标,例如销售或参与情况。此外,有了大量可用的数据,数据科学家可以将他们的专业知识应用于时间序列预测。

你可能看到过其他关于时间序列的课程、书籍或文章,这些都用R语言实现解决方案,R语言是一种专门为统计计算而设计的编程语言。正如你将在第3章及以后章节中学到的,许多预测技术都使用统计模型。因此,人们做了大量的工作来开发软件包,以便使用R语言无缝进行时间序列分析和预测。然而,大多数数据科学家都需要精通Python,因为它是机器学习领域最广泛使用的语言。近年来,社区和大公司开发了一些强大的库,利用Python来执行统计计算和机器学习任务、开发网站等。虽然Python远不是一种完美的编程语言,但它的多功能性对其用户来说非常有用,因为我们可以开发模型,执行统计测试,并可能通过API或开发Web界面为模型提供服务,而所有这些都使用相同的编程语言。本书将展示如何仅使用Python实现时间序列预测的统计学习技术和机器学习技术。

本书将完全聚焦时间序列预测。首先你将学习如何进行简单的预测,这些预测将作为更复杂模型的基准。然后,我们将使用两种统计学习技术(移动平均模型和自回归模型)来进行预测。这两种技术将作为我们要涵盖的更复杂建模技术的基础,使我们能够解释非平稳性、季节性效应和外生变量的影响。之后,我们将从统计学习技术转向深度学习方法,以预测高维的大型时间序列,在这种情况下,统计学习往往不如深度学习方法表现得好。

现在,我们将研究时间序列预测的基本概念。我将从时间序列的定义开始,以便你能够识别时间序列。然后,我们将逐步讨论时间序列预测的目的。最后,你将了解为什么时间序列预测不同于其他回归问题,以及为什么这个主题值得专门写一本书。