当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python cuml.datasets.make_regression用法及代码示例


用法:

cuml.datasets.make_regression(n_samples=100, n_features=2, n_informative=2, n_targets=1, bias=0.0, effective_rank=None, tail_strength=0.5, noise=0.0, shuffle=True, coef=False, random_state=None, dtype='single', handle=None) → Union[Tuple[CumlArray, CumlArray], Tuple[CumlArray, CumlArray, CumlArray]]

生成随机回归问题。

参看https://scikit-learn.org/stable/modules/generated/sklearn.datasets.make_regression.html# noqa:E501

参数

n_samplesint,可选(默认=100)

样本数。

n_featuresint,可选(默认=2)

特征的数量。

n_informativeint,可选(默认=2)

信息特征的数量,即用于构建用于生成输出的线性模型的特征数量。

n_targetsint,可选(默认=1)

回归目标的数量,即与样本相关的 y 输出向量的维度。默认情况下,输出是一个标量。

bias浮点数,可选(默认=0.0)

基础线性模型中的偏差项。

effective_rank整数或无,可选(默认=无)
如果不是无:

通过线性组合解释大部分输入数据所需的奇异向量的近似数量。在输入中使用这种奇异谱允许生成器重现实践中经常观察到的相关性。

如果没有:

输入集条件良好、居中且具有单位方差的高斯分布。

tail_strength在 0.0 和 1.0 之间浮点数,可选(默认 = 0.5)

如果 effective_rank 不是无,则奇异值轮廓的胖噪声尾部的相对重要性。

noise浮点数,可选(默认=0.0)

应用于输出的高斯噪声的标准偏差。

shuffle布尔值,可选(默认 = True)

Shuffle[洗牌]样本和特征。

coef布尔值,可选(默认=假)

如果为 True,则返回基础线性模型的系数。

random_stateint,RandomState 实例或无(默认)

用于创建数据集的随机数生成器的种子。

dtype: string or numpy dtype (default: ‘single’)

数据的类型。可能的值:float32、float64、‘single’, ‘float’ or ‘double’。

handle: cuml.Handle

如果为 None,则仅为此函数调用创建一个新的

返回

out形状为 [n_samples, n_features] 的设备数组

输入样本。

values形状为 [n_samples, n_targets] 的设备数组

输出值。

coef形状为 [n_features, n_targets] 的设备数组,可选

基础线性模型的系数。仅当 coef 为 True 时才返回。

例子

from cuml.datasets.regression import make_regression
from cuml.linear_model import LinearRegression

# Create regression problem
data, values = make_regression(n_samples=200, n_features=12,
                               n_informative=7, bias=-4.2, noise=0.3)

# Perform a linear regression on this problem
lr = LinearRegression(fit_intercept = True, normalize = False,
                      algorithm = "eig")
reg = lr.fit(data, values)
print(reg.coef_)

相关用法


注:本文由纯净天空筛选整理自rapids.ai大神的英文原创作品 cuml.datasets.make_regression。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。