前言

着云时代的来临,大数据分析技术将帮助企业用户在合理的时间内获取、处理海量数据,为企业经营决策提供积极的帮助。大数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略性新兴产业。在大数据的研究和应用中,数学是其坚实的理论基础。在数据处理、数据挖掘、评判分析等过程中,数学方法扮演着至关重要的角色。

本书致力于传播大数据分析技术的基础数学知识,以期通过理论结合实践的方式,帮助读者运用相关数学知识解决一些实际问题。

本书特色

本书将理论与实践相结合,通过示例与大量代码实现,深入浅出地介绍了大数据分析技术所需的数学基础知识,并引导读者利用所学知识解决问题。本书通过例题和课后习题帮助读者巩固所学内容,使读者能够真正理解并应用。

本书内容由浅入深,第1章介绍大数据与数学之间的联系,让读者在宏观上了解学习大数据分析技术所需要的数学知识,以及Python中常用的数学相关库;第2~5章全面地介绍微积分、概率论与数理统计、线性代数、数值计算在数据科学领域的简单应用;第6章结合前5章的知识,介绍了数据分析过程中常用的数学分析方法,并结合Python对示例进行求解分析。

本书适用对象

• 开设大数据分析课程的高校的教师和学生

目前,国内不少高校将大数据分析引入教学中,在数学、计算机、自动化、电子信息及金融等专业开设了与大数据分析技术相关的课程,但目前这一课程的前置基础课——数学的教学仍然主要局限于理论介绍。因为单纯的理论教学过于抽象,学生理解起来往往比较困难,所以教学效果也不甚理想。本书提供的基于Python语言的实践教学模式,能够使师生充分互动,实现最佳的教学效果。

• 大数据分析相关从业人员

这类人员可以通过本书理解大数据分析技术中常见算法背后的理论原理,并掌握相关实现方法等知识,从而能够对算法有全面而深入的了解,同时也能够通过阅读本书对大数据分析方法等有所认识。

• 机器学习与数据挖掘从业人员

这类人员可以通过本书更深入地理解机器学习常用算法的基本实现方法,从而设计出更加高效、流畅的算法,以辅助生产,为决策提供依据。

• 数学爱好者

本书不仅介绍了微积分、概率论与数理统计、线性代数、数值计算和多元统计分析的基础知识,还用Python实现了绝大部分的理论与算法,可满足数学爱好者的求知欲望。

代码下载及问题反馈

为了帮助读者更好地使用本书,泰迪云课堂(https://edu.tipdm.org)提供了配套的教学视频。对于本书配套的原始数据文件、Python程序代码,读者可以扫描下方的二维码关注泰迪学社微信公众号(TipDataMining),回复“图书资源”进行获取,也可登录人民邮电出版社教育社区(www.ryjiaoyu.com)下载。为方便教师授课,本书还提供了PPT课件、教学大纲、教学进度表和教案等教学资源,教师可在泰迪学社微信公众号回复“教学资源”进行获取。

我们已经尽最大的努力避免在文本和代码中出现错误,但是由于水平有限,编写时间仓促,书中疏漏和不足之处在所难免。如果您有更多宝贵意见,欢迎在泰迪学社微信公众号回复“图书反馈”进行反馈。更多本系列图书的信息可以在“泰迪杯”数据挖掘挑战赛网站(http://www.tipdm.org/tj/index.jhtml)查阅。

编者

2019年3月