從模型進行預測時,new_data
與用於擬合模型的原始數據具有相同的類通常很重要。 get_data_classes()
從原始訓練數據中提取類。
例子
get_data_classes(iris)
#> $Sepal.Length
#> [1] "numeric"
#>
#> $Sepal.Width
#> [1] "numeric"
#>
#> $Petal.Length
#> [1] "numeric"
#>
#> $Petal.Width
#> [1] "numeric"
#>
#> $Species
#> [1] "factor"
#>
get_data_classes(as.matrix(mtcars))
#> $mpg
#> [1] "numeric"
#>
#> $cyl
#> [1] "numeric"
#>
#> $disp
#> [1] "numeric"
#>
#> $hp
#> [1] "numeric"
#>
#> $drat
#> [1] "numeric"
#>
#> $wt
#> [1] "numeric"
#>
#> $qsec
#> [1] "numeric"
#>
#> $vs
#> [1] "numeric"
#>
#> $am
#> [1] "numeric"
#>
#> $gear
#> [1] "numeric"
#>
#> $carb
#> [1] "numeric"
#>
# Unlike .MFclass(), the full class
# vector is returned
data <- data.frame(col = ordered(c("a", "b")))
.MFclass(data$col)
#> [1] "ordered"
get_data_classes(data)
#> $col
#> [1] "ordered" "factor"
#>
相關用法
- R hardhat get_levels 從 DataFrame 中提取因子水平
- R hardhat validate_prediction_size 確保預測具有正確的行數
- R hardhat default_recipe_blueprint 默認配方藍圖
- R hardhat is_blueprint x 是預處理藍圖嗎?
- R hardhat validate_column_names 確保數據包含所需的列名
- R hardhat default_formula_blueprint 默認公式藍圖
- R hardhat update_blueprint 更新預處理藍圖
- R hardhat weighted_table 加權表
- R hardhat validate_outcomes_are_univariate 確保結果是單變量
- R hardhat add_intercept_column 向數據添加截距列
- R hardhat is_frequency_weights x 是頻率權重向量嗎?
- R hardhat model_offset 提取模型偏移
- R hardhat standardize 標準化結果
- R hardhat model_matrix 構建設計矩陣
- R hardhat is_importance_weights x 是重要性權重向量嗎?
- R hardhat run-mold 根據藍圖 Mold()
- R hardhat fct_encode_one_hot 將一個因子編碼為 one-hot 指標矩陣
- R hardhat new_frequency_weights 構建頻率權重向量
- R hardhat validate_no_formula_duplication 確保公式中不出現重複項
- R hardhat default_xy_blueprint 默認 XY 藍圖
- R hardhat shrink 僅對所需列進行子集化
- R hardhat validate_outcomes_are_numeric 確保結果都是數字
- R hardhat scream ? 尖叫。
- R hardhat frequency_weights 頻率權重
- R hardhat refresh_blueprint 刷新預處理藍圖
注:本文由純淨天空篩選整理自Davis Vaughan等大神的英文原創作品 Extract data classes from a data frame or matrix。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。