将预测添加到 DataFrame
用法
add_predictions(data, model, var = "pred", type = NULL)
spread_predictions(data, ..., type = NULL)
gather_predictions(data, ..., .pred = "pred", .model = "model", type = NULL)
参数
- data
-
用于生成预测的 DataFrame 。
- model
-
add_predictions
采用单个model
; - var
-
输出列的名称,默认值为
pred
- type
-
预测类型,传递给
stats::predict()
。请参阅给定model
的predict()
文档以确定有效值。 - ...
-
gather_predictions
和spread_predictions
采用多个模型。该名称将从参数名称或模型名称中获取。 - .pred, .model
-
gather_predictions
使用的变量名称。
值
一个 DataFrame 。 add_prediction
将一个新列添加到输入 data
中,默认名称为 pred
。 spread_predictions
为每个模型添加一列。 gather_predictions
添加两列 .model
和 .pred
,并为每个模型重复输入行。
例子
df <- tibble::tibble(
x = sort(runif(100)),
y = 5 * x + 0.5 * x ^ 2 + 3 + rnorm(length(x))
)
plot(df)
m1 <- lm(y ~ x, data = df)
grid <- data.frame(x = seq(0, 1, length = 10))
grid %>% add_predictions(m1)
#> x pred
#> 1 0.0000000 2.814380
#> 2 0.1111111 3.441413
#> 3 0.2222222 4.068446
#> 4 0.3333333 4.695478
#> 5 0.4444444 5.322511
#> 6 0.5555556 5.949544
#> 7 0.6666667 6.576577
#> 8 0.7777778 7.203610
#> 9 0.8888889 7.830642
#> 10 1.0000000 8.457675
m2 <- lm(y ~ poly(x, 2), data = df)
grid %>% spread_predictions(m1, m2)
#> x m1 m2
#> 1 0.0000000 2.814380 2.358486
#> 2 0.1111111 3.441413 3.263516
#> 3 0.2222222 4.068446 4.098546
#> 4 0.3333333 4.695478 4.863576
#> 5 0.4444444 5.322511 5.558606
#> 6 0.5555556 5.949544 6.183635
#> 7 0.6666667 6.576577 6.738664
#> 8 0.7777778 7.203610 7.223693
#> 9 0.8888889 7.830642 7.638722
#> 10 1.0000000 8.457675 7.983750
grid %>% gather_predictions(m1, m2)
#> model x pred
#> 1 m1 0.0000000 2.814380
#> 2 m1 0.1111111 3.441413
#> 3 m1 0.2222222 4.068446
#> 4 m1 0.3333333 4.695478
#> 5 m1 0.4444444 5.322511
#> 6 m1 0.5555556 5.949544
#> 7 m1 0.6666667 6.576577
#> 8 m1 0.7777778 7.203610
#> 9 m1 0.8888889 7.830642
#> 10 m1 1.0000000 8.457675
#> 11 m2 0.0000000 2.358486
#> 12 m2 0.1111111 3.263516
#> 13 m2 0.2222222 4.098546
#> 14 m2 0.3333333 4.863576
#> 15 m2 0.4444444 5.558606
#> 16 m2 0.5555556 6.183635
#> 17 m2 0.6666667 6.738664
#> 18 m2 0.7777778 7.223693
#> 19 m2 0.8888889 7.638722
#> 20 m2 1.0000000 7.983750
相关用法
- R modelr add_predictors 将预测变量添加到公式中
- R modelr add_residuals 将残差添加到 DataFrame
- R modelr typical 求典型值
- R modelr resample “惰性”重采样。
- R modelr crossv_mc 生成测试训练对以进行交叉验证
- R modelr model_matrix 构建设计矩阵
- R modelr model-quality 计算给定数据集的模型质量
- R modelr permute 生成 n 个排列重复。
- R modelr fit_with 拟合公式列表
- R modelr data_grid 生成数据网格。
- R modelr formulas 创建公式列表
- R modelr seq_range 生成向量范围内的序列
- R modelr resample_partition 生成数据帧的独占分区
- R modelr na.warn 处理缺失值并发出警告
- R modelr bootstrap 生成 n 个引导程序重复。
- R modelr resample_bootstrap 生成 boostrap 复制
- R vcov.gam 从 GAM 拟合中提取参数(估计器)协方差矩阵
- R gam.check 拟合 gam 模型的一些诊断
- R matrix转list用法及代码示例
- R as 强制对象属于某个类
- R null.space.dimension TPRS 未惩罚函数空间的基础
- R language-class 表示未评估语言对象的类
- R gam.reparam 寻找平方根惩罚的稳定正交重新参数化。
- R className 类名包含对应的包
- R extract.lme.cov 从 lme 对象中提取数据协方差矩阵
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Add predictions to a data frame。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。