當前位置: 首頁>>代碼示例 >>用法及示例精選 >>正文


Python sklearn make_low_rank_matrix用法及代碼示例


本文簡要介紹python語言中 sklearn.datasets.make_low_rank_matrix 的用法。

用法:

sklearn.datasets.make_low_rank_matrix(n_samples=100, n_features=100, *, effective_rank=10, tail_strength=0.5, random_state=None)

生成具有 bell-shaped 奇異值的大部分低秩矩陣。

大多數方差可以用寬度為 effective_rank 的 bell-shaped 曲線來解釋:奇異值分布的低秩部分是:

(1 - tail_strength) * exp(-1.0 * (i / effective_rank) ** 2)

剩下的奇異值的尾巴是肥的,減少為:

tail_strength * exp(-0.1 * i / effective_rank).

輪廓的低秩部分可以被認為是數據的結構化信號部分,而尾部可以被認為是數據的噪聲部分,不能通過少量線性分量(奇異向量)來概括。

這種奇異的輪廓在實踐中很常見,例如:
  • 人臉灰度圖片
  • TF-IDF 從網絡上抓取的文本文檔向量

在用戶指南中閱讀更多信息。

參數

n_samples整數,默認=100

樣本數。

n_features整數,默認=100

特征的數量。

effective_rank整數,默認=10

通過線性組合解釋大部分數據所需的奇異向量的近似數量。

tail_strength浮點數,默認=0.5

奇異值輪廓的胖噪聲尾部的相對重要性。該值應介於 0 和 1 之間。

random_stateint、RandomState 實例或無,默認=無

確定數據集創建的隨機數生成。傳遞 int 以獲得跨多個函數調用的可重現輸出。請參閱詞匯表。

返回

Xndarray 形狀(n_samples,n_features)

矩陣。

相關用法


注:本文由純淨天空篩選整理自scikit-learn.org大神的英文原創作品 sklearn.datasets.make_low_rank_matrix。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。