前言

本书基于我在商学院的教学经验而创作,是关于机器学习的一本入门书籍,读者面向商学院学生和企业管理团队。本书的技术性不算太强,其目的不是要把读者培养成数据科学家,而是让读者了解“数据科学家”这个职业,并介绍这些数据科学家如何助推企业发展。

很多学生认识到,机器学习已经对业界产生了巨大的影响,从业者只有掌握机器学习的基础知识,才能在竞争日趋激烈的世界中生存。今天,业界所有高管都需要知道如何使用计算机;明天,业界所有高管都需要熟知大数据的含义,并需要与数据科学家合作,以此提高自身的竞争力。

在本书中,我并没有使用矩阵或向量运算,也没有使用微积分(除了在第6章的附录中使用微积分来解释反向传播)。虽然这些量化知识很有用,但根据我的观察,大多数商学院学生和企业高管对这些知识并不熟悉。

本书介绍了数据科学家最常用的算法,掌握这些算法能够让读者根据自身情况,与数据科学家高效合作。在本书中,我通过使用不同的数据集来解释算法。这些数据集可以从以下网站下载:www-2.rotman.utoronto.ca/~hull)。

本书使用的数据集附带Excel工作表和Python代码,我注意到,在选修我的课程之前,几乎所有的学生都能熟练使用Excel工作表,但我认为所有的从业人员还应该尽快适应Python代码。几乎所有学生都已经认识到,编码技能已经成为业界人士必需的技能。

读者可以从我的网站上下载Power Point幻灯片,欢迎选择采用本书的教师根据自己的需要对幻灯片进行调整。

在本书的写作过程中,很多人曾给予我帮助。我要特别感谢Jay Cao、Jeff Li和Niti Mishra,他们提供了本书附带的大部分Python代码。我还要感谢罗特曼管理学院金融创新实验室及全球金融服务风险研究所(Global Risk Institute in Financial Services)为机器学习和金融创新研究以及相应教学资料的开发提供资金支持。Peter Christoffersen(他于2018年不幸英年早逝)和Andreas Park是我在FinHub的同事,他们为我写作本书提供了很多灵感。

欢迎读者来信对本书做出评价并给出建议,我的电邮地址是hull@rotman.utoronto.ca。