1.3.4 Sklearn数据建模

Sklearn是Python重要的机器学习包,建立在NumPy、SciPy和Matplotlib之上,其中封装了大量的机器学习算法,如分类、回归、降维和聚类。Sklearn拥有完善的文档,使得它具有上手容易的优势,并且内置了大量的数据集,节省了获取和整理数据集的时间。

截至2020年12月,Sklearn的新版本是0.23.2,安装命令如下:

     pip install scikit-learn

Sklearn的算法可以分为监督式机器学习和无监督式机器学习,其中主要的监督式机器学习算法如表1-1所示。

表1-1 监督式机器学习算法

Sklearn中的无监督式机器学习算法如表1-2所示。

表1-2 无监督式机器学习算法