用法:
dask_ml.datasets.make_counts(n_samples=1000, n_features=100, n_informative=2, scale=1.0, chunks=100, random_state=None)
生成用于建模计数数据的虚拟数据集。
- n_samples:int
输出数组中的行数
- n_features:int
输出数组中的列数(特征)
- n_informative:int
与结果相关的特征数量
- scale:浮点数
以此来缩放真实系数数组
- chunks:int
每个 dask 数组块的行数。
- random_state:int,RandomState 实例或无(默认)
确定数据集创建的随机数生成。跨多个函数调用传递一个 int 以实现可重现的输出。请参阅词汇表。
- X:dask.array,大小
(n_samples, n_features)
- y:dask.array,大小
(n_samples,)
非负 integer-valued 数据数组
- X:dask.array,大小
参数:
返回:
例子:
>>> X, y = make_counts()
相关用法
- Python dask_ml.datasets.make_blobs用法及代码示例
- Python dask_ml.decomposition.PCA用法及代码示例
- Python dask_ml.decomposition.TruncatedSVD.__init__用法及代码示例
- Python dask_ml.wrappers.ParallelPostFit用法及代码示例
- Python dask_ml.feature_extraction.text.CountVectorizer用法及代码示例
- Python dask_ml.preprocessing.MinMaxScaler用法及代码示例
- Python dask_ml.preprocessing.Categorizer用法及代码示例
- Python dask_ml.linear_model.LinearRegression用法及代码示例
- Python dask_ml.wrappers.Incremental用法及代码示例
- Python dask_ml.metrics.mean_squared_log_error用法及代码示例
- Python dask_ml.model_selection.GridSearchCV用法及代码示例
- Python dask_ml.preprocessing.OrdinalEncoder用法及代码示例
- Python dask_ml.feature_extraction.text.FeatureHasher用法及代码示例
- Python dask_ml.preprocessing.LabelEncoder用法及代码示例
- Python dask_ml.ensemble.BlockwiseVotingClassifier用法及代码示例
- Python dask_ml.model_selection.train_test_split用法及代码示例
- Python dask_ml.feature_extraction.text.HashingVectorizer用法及代码示例
- Python dask_ml.preprocessing.PolynomialFeatures用法及代码示例
- Python dask_ml.linear_model.LogisticRegression用法及代码示例
- Python dask_ml.xgboost.train用法及代码示例
注:本文由纯净天空筛选整理自dask.org大神的英文原创作品 dask_ml.datasets.make_counts。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。