1.3.5 机器学习中的新增功能

SQL Server R服务已重命名为SQL Server机器学习服务,该服务除了支持R语言外,还支持Python语言。可以使用机器学习服务(数据库内)在SQL Server中运行R或Python脚本,或者安装Microsoft机器学习服务器(独立)来部署和使用不需要SQL Server的R和Python模型。

SQL Server开发人员现在可访问开放源代码生态系统中提供的大量Python ML和AI库,以及Microsoft的最新功能。机器学习中的新增功能如下:

(1)Revoscalepy:此功能等效于RevoScaleR的Python包含用于线性回归和逻辑回归、决策树、提升树和随机林的并行算法,以及一组丰富的用于数据转换和数据移动、远程计算上下文和数据源的API。

(2)Microsoftml:这是一个先进的机器学习算法和Python绑定转换包,其中包含深层神经网络、快速决策树和决策树,以及用于线性回归和逻辑回归的优化算法。用户还可获得预定型模型,这些模型基于用于图像提取或情感分析的ResNet模型。

(3)使用T-SQL(Transact-SQL)进行Python操作:使用存储过程sp_execute_external_script轻松部署Python代码。通过将数据从SQL流式传输到Python进程并使用MPI环并行化来获得出色性能。

(4)SQL Server计算上下文中的Python:数据科学家和开发人员可以从其开发环境远程执行Python代码,以便在不移动数据的情况下浏览数据和开发模型。

(5)本机计分:T-SQL中的PREDICT函数可用于执行SQL Server 2017的任何实例中的计分(即使未安装R)。只需使用一个受支持的RevoScaleR和revoscalepy算法训练该模型,并将该模型保存为全新的二进制紧凑格式即可。

(6)程序包管理:T-SQL现在支持CREATE EXTERNAL LIBRARY语句,使DBA更好地管理R程序包。使用角色控制专用或共享包访问权限,在数据库中存储R包并在用户之间进行共享。

(7)性能改进:存储过程sp_execute_external_script已经过优化,支持列存储数据的批处理模式执行。