- 机器学习:软件工程方法与实现
- 张春强 张和平 唐振
- 261字
- 2021-01-07 17:12:43
5.2 常用分析方法
上节对常见变量做了基本介绍,本节将介绍变量的常用分析方法和可视化。可视化借助常用的Matplotlib、Seaborn和pandas.DataFrame.plot工具实现。
Matplotlib是一个常用的Python绘图库。使用者仅需几行代码,便可以绘制直方图、条形图、散点图以及其他更复杂的图形。Matplotlib是下面两类方法的基础。
Seaborn在Matplotlib的基础上进行了API封装,使制图更加容易。在大多数情况下,使用Seaborn就能做出很具有吸引力的图。
Pandas内置了plot等绘图API,使数据分析和可视化能协同进行,该方法底层默认调用Matplotlib的接口。
进行数据可视化时建议优先选择Seaborn和pandas.DataFrame.plot,需要绘制更复杂图形时再考虑使用Matplotlib。本节将结合一些经典数据集来讲解变量分析方法。