3.3.3 回归模型随机数据生成_机器学习：软件工程方法与实现-QQ阅读男生科幻网

书名：机器学习：软件工程方法与实现
作者名：张春强张和平唐振
本章字数：268字
更新时间：2025-03-31 09:29:27

3.3.3　回归模型随机数据生成

make_regression函数的主要参数如下所示。

·n_samples：样本数量，默认值100。

·n_features：特征个数，默认值20。

·n_informative：信息特征的个数，默认值2。

·n_targets：回归目标的数量，默认值1。

·bias：线性模型中的偏差项，默认值0。

·noise：高斯分布的标准差，默认值0。

·coef：是否返回回归系数，默认值False。

·shuffle：随机打乱样本，默认值True。

·random_state：随机数种子，默认值None。

使用make_regression在Jupyter Notebook环境生成分类模型随机数据代码案例如下：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_regression

# X为样本特征，Y为样本类别输出，共1000个样本，每个样本3个特征，返回回归系数
X,Y,coef=make_regression(n_samples=1000,n_features=3,noise=10,
coef=True,random_state =20)
plt.scatter(X[:, 0],Y,c='b',s=3)
plt.plot(X[:, 0],X[:, 0]*coef[0],c='r')
plt.show()

输出如图3-4所示。

图3-4　回归模型随机数据散点图

本周热推：

人工智能注意力机制：体系、模型与算法剖析机器学习算法的数学解析与Python实现造神：人工智能神话的起源和破除如何创造思维：人类思想所揭示出的奥秘智能计算系统：从深度学习到大模型