本书内容及知识体系

第1篇 数据分析与Python程序语言(第1~2章)

本书第1章从数据分析的发展说起,从早期的统计分析到现今的大数据与人工智能发展,介绍计算机科学的演进如何带动数据时代的到来;接着阐述数据项目分析流程应如何制定,以及Python与数据分析的关系;最后介绍数据科学家必备的知识与技能。第2章介绍与Python相关的基础知识,为后续深入学习Python打下基础。

第2篇 数据的存取与使用(第3~4章)

第3章介绍常见的数据来源与获取方式,归纳成几种常见的形式,即文件、API与网页爬虫。第4章深入讨论网络爬虫的实操技术,从认识HTTP网站框开始到爬虫应用,全方位解析网络爬虫相关内容。

第3篇 常见数据分析工具(第5章)

第5章介绍3个将Python用于数据分析的主流套件,分别是高效能的数学运算工具NumPy、串起数据与程序设计工具Pandas和可视化呈现数据工具Matplotlib,并系统性地介绍这3个主流套件的使用方法与其核心目标。

第4篇 数据分析流程(第6~9章)

第6~9章,依照数据分析的流程—“定义问题与观察数据”“数据清理与类型转换”“数据探索与可视化”“特征工程”4个环节,解析如何使用Python与搭配适当的工具进行数据分析。

第5篇 数据分析流程示例应用(第10章)

本书第10章提供了3个项目实战案例,利用几个真实的数据集实践本书前面讨论的各种方法。