本文简要介绍python语言中 sklearn.dummy.DummyClassifier
的用法。
用法:
class sklearn.dummy.DummyClassifier(*, strategy='prior', random_state=None, constant=None)
DummyClassifier 进行忽略输入特征的预测。
该分类器用作与其他更复杂的分类器进行比较的简单基线。
使用
strategy
参数选择基线的特定行为。所有策略的预测都会忽略作为
X
参数传递给fit
和predict
的输入特征值。但是,预测通常取决于在传递给fit
的y
参数中观察到的值。请注意,“stratified” 和 “uniform” 策略会导致不确定性预测,如果需要,可以通过设置
random_state
参数将其呈现为确定性预测。其他策略自然是确定性的,一旦适合,总是为X
的任何值返回相同的常量预测。在用户指南中阅读更多信息。
- strategy:{“most_frequent”, “prior”, “stratified”, “uniform”, “constant”},默认=”prior”
用于生成预测的策略。
“most_frequent”:
predict
方法总是返回传递给fit
的观察到的y
参数中出现频率最高的类标签。predict_proba
方法返回匹配的one-hot 编码向量。“prior”:
predict
方法总是返回观察到的y
参数中最常见的类标签,传递给fit
(如 “most_frequent”)。predict_proba
始终返回y
的经验类分布,也称为经验类先验分布。“stratified”:
predict_proba
方法从由经验类先验概率参数化的多项分布中随机采样 one-hot 向量。predict
方法返回在predict_proba
的 one-hot 向量中获得概率一的类标签。因此,这两种方法的每个采样行都是独立且同分布的。“uniform”:从在
y
中观察到的唯一类列表中随机均匀地生成预测,即每个类具有相等的概率。“constant”:始终预测用户提供的常量标签。这对于评估非多数类的指标很有用。
- random_state:int、RandomState 实例或无,默认=无
控制随机性以在
strategy='stratified'
或strategy='uniform'
时生成预测。传递 int 以获得跨多个函数调用的可重现输出。请参阅词汇表。- constant:int 或 str 或类似数组的形状 (n_outputs,),默认=无
“constant” 策略预测的显式常数。此参数仅对“constant” 策略有用。
- classes_:ndarray 形状 (n_classes,) 或此类数组的列表
y
中观察到的唯一类标签。对于multi-output 分类问题,此属性是一个数组列表,因为每个输出都有一组独立的可能类。- n_classes_:int 或 int 列表
每个输出的标签数。
- class_prior_:ndarray 形状 (n_classes,) 或此类数组的列表
在
y
中观察到的每个类的频率。对于多输出分类问题,这是针对每个输出独立计算的。- n_outputs_:int
输出数量。
n_features_in_
None
已弃用:
n_features_in_
在 1.0 中已弃用,并将在 1.2 中删除。- sparse_output_:bool
如果从 predict 返回的数组为稀疏 CSC 格式,则为真。如果输入
y
以稀疏格式传递,则自动设置为 True。
参数:
属性:
例子:
>>> import numpy as np >>> from sklearn.dummy import DummyClassifier >>> X = np.array([-1, 1, 1, 1]) >>> y = np.array([0, 1, 1, 1]) >>> dummy_clf = DummyClassifier(strategy="most_frequent") >>> dummy_clf.fit(X, y) DummyClassifier(strategy='most_frequent') >>> dummy_clf.predict(X) array([1, 1, 1, 1]) >>> dummy_clf.score(X, y) 0.75
相关用法
- Python sklearn DummyRegressor用法及代码示例
- Python sklearn DictVectorizer用法及代码示例
- Python sklearn DictVectorizer.restrict用法及代码示例
- Python sklearn DotProduct用法及代码示例
- Python sklearn DistanceMetric用法及代码示例
- Python sklearn DecisionTreeClassifier用法及代码示例
- Python sklearn DictionaryLearning用法及代码示例
- Python sklearn DetCurveDisplay.from_predictions用法及代码示例
- Python sklearn DBSCAN用法及代码示例
- Python sklearn DetCurveDisplay.from_estimator用法及代码示例
- Python sklearn DetCurveDisplay用法及代码示例
- Python sklearn DecisionTreeRegressor用法及代码示例
- Python sklearn jaccard_score用法及代码示例
- Python sklearn WhiteKernel用法及代码示例
- Python sklearn CalibrationDisplay.from_predictions用法及代码示例
- Python sklearn VotingRegressor用法及代码示例
- Python sklearn gen_batches用法及代码示例
- Python sklearn ExpSineSquared用法及代码示例
- Python sklearn MDS用法及代码示例
- Python sklearn adjusted_rand_score用法及代码示例
- Python sklearn MLPClassifier用法及代码示例
- Python sklearn train_test_split用法及代码示例
- Python sklearn RandomTreesEmbedding用法及代码示例
- Python sklearn GradientBoostingRegressor用法及代码示例
- Python sklearn GridSearchCV用法及代码示例
注:本文由纯净天空筛选整理自scikit-learn.org大神的英文原创作品 sklearn.dummy.DummyClassifier。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。