當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python cuml.datasets.make_regression用法及代碼示例


用法:

cuml.datasets.make_regression(n_samples=100, n_features=2, n_informative=2, n_targets=1, bias=0.0, effective_rank=None, tail_strength=0.5, noise=0.0, shuffle=True, coef=False, random_state=None, dtype='single', handle=None) → Union[Tuple[CumlArray, CumlArray], Tuple[CumlArray, CumlArray, CumlArray]]

生成隨機回歸問題。

參看https://scikit-learn.org/stable/modules/generated/sklearn.datasets.make_regression.html# noqa:E501

參數

n_samplesint,可選(默認=100)

樣本數。

n_featuresint,可選(默認=2)

特征的數量。

n_informativeint,可選(默認=2)

信息特征的數量,即用於構建用於生成輸出的線性模型的特征數量。

n_targetsint,可選(默認=1)

回歸目標的數量,即與樣本相關的 y 輸出向量的維度。默認情況下,輸出是一個標量。

bias浮點數,可選(默認=0.0)

基礎線性模型中的偏差項。

effective_rank整數或無,可選(默認=無)
如果不是無:

通過線性組合解釋大部分輸入數據所需的奇異向量的近似數量。在輸入中使用這種奇異譜允許生成器重現實踐中經常觀察到的相關性。

如果沒有:

輸入集條件良好、居中且具有單位方差的高斯分布。

tail_strength在 0.0 和 1.0 之間浮點數,可選(默認 = 0.5)

如果 effective_rank 不是無,則奇異值輪廓的胖噪聲尾部的相對重要性。

noise浮點數,可選(默認=0.0)

應用於輸出的高斯噪聲的標準偏差。

shuffle布爾值,可選(默認 = True)

Shuffle[洗牌]樣本和特征。

coef布爾值,可選(默認=假)

如果為 True,則返回基礎線性模型的係數。

random_stateint,RandomState 實例或無(默認)

用於創建數據集的隨機數生成器的種子。

dtype: string or numpy dtype (default: ‘single’)

數據的類型。可能的值:float32、float64、‘single’, ‘float’ or ‘double’。

handle: cuml.Handle

如果為 None,則僅為此函數調用創建一個新的

返回

out形狀為 [n_samples, n_features] 的設備數組

輸入樣本。

values形狀為 [n_samples, n_targets] 的設備數組

輸出值。

coef形狀為 [n_features, n_targets] 的設備數組,可選

基礎線性模型的係數。僅當 coef 為 True 時才返回。

例子

from cuml.datasets.regression import make_regression
from cuml.linear_model import LinearRegression

# Create regression problem
data, values = make_regression(n_samples=200, n_features=12,
                               n_informative=7, bias=-4.2, noise=0.3)

# Perform a linear regression on this problem
lr = LinearRegression(fit_intercept = True, normalize = False,
                      algorithm = "eig")
reg = lr.fit(data, values)
print(reg.coef_)

相關用法


注:本文由純淨天空篩選整理自rapids.ai大神的英文原創作品 cuml.datasets.make_regression。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。