2.1 Anaconda

Anaconda是在Linux、Windows和macOS X上执行Python数据科学和机器学习最直接的方式,全球有超过1100万用户,几乎是数据科学开发、测试和培训的行业标准环境。在一台机器上能使多个数据科学家开展如下工作:

·快速下载超过1500个Python、R数据科学包。

·使用conda管理库、依赖项和环境。

·使用scikit-learn、TensorFlow和Theano开发和训练机器学习与深度学习模型。

·使用Dask、NumPy、Pandas和Numba分析具有可伸缩性的数据。

·使用Matplotlib、Bokeh、Datashader和Holoviews可视化结果。

简单来说,Anaconda是Python的一种发行版,同时也是一个科学工具包的集合,常用的包括:conda,包与环境的管理工具,类似于pip;Jupyter Notebook,可以将数据分析的代码、图像和文档全部集成到一个Web页面中。