5.2 常用分析方法

上节对常见变量做了基本介绍,本节将介绍变量的常用分析方法和可视化。可视化借助常用的Matplotlib、Seaborn和pandas.DataFrame.plot工具实现。

Matplotlib是一个常用的Python绘图库。使用者仅需几行代码,便可以绘制直方图、条形图、散点图以及其他更复杂的图形。Matplotlib是下面两类方法的基础。

Seaborn在Matplotlib的基础上进行了API封装,使制图更加容易。在大多数情况下,使用Seaborn就能做出很具有吸引力的图。

Pandas内置了plot等绘图API,使数据分析和可视化能协同进行,该方法底层默认调用Matplotlib的接口。

进行数据可视化时建议优先选择Seaborn和pandas.DataFrame.plot,需要绘制更复杂图形时再考虑使用Matplotlib。本节将结合一些经典数据集来讲解变量分析方法。