當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


R broom data.frame_tidiers data.frame 對象的整理器

DataFrame 整理器已棄用,並將從即將發布的 broom 版本中刪除。

用法

# S3 method for data.frame
tidy(x, ..., na.rm = TRUE, trim = 0.1)

# S3 method for data.frame
augment(x, data, ...)

# S3 method for data.frame
glance(x, ...)

來源

偏斜和峰度函數改編自中的實現moments包:
盧卡斯·科姆斯塔和弗雷 Delhi 克·諾沃梅斯基 (2015)。矩:矩、累積量、偏度、峰度和相關測試。 R 包版本 0.14。
https://CRAN.R-project.org/package=moments

參數

x

data.frame

...

其他方法的附加參數。

na.rm

一個邏輯值,指示在計算繼續之前是否應刪除 NA 值。

trim

在計算平均值之前從 x 的每一端修剪的觀測值分數(0 到 0.5)。傳遞給 meantrim 參數

data

數據,未使用

tidy.data.frame 生成一個 DataFrame ,每個原始列一行,包含每個 DataFrame 的摘要統計信息:

column

原始列名稱

n

有效(非 NA)值的數量

mean

意思是

sd

標準差

median

中位數

trimmed

修剪平均值,修剪默認為 0.1

mad

中位數絕對偏差(與中位數)

min

最小值

max

最大值

range

範圍

skew

傾斜

kurtosis

峰度

se

標準誤

glance 返回 one-row data.frame

nrow

行數

ncol

列數

complete.obs

沒有缺失值的行數

na.fraction

所有行和列中缺失的值的比例

細節

這些對 data.frame 對象執行整潔的摘要。 tidy 生成有關每列的摘要統計信息,而 glance 僅報告行數和列數。請注意,augment.data.frame 將引發錯誤。

作者

大衛·羅賓遜、本傑明·納特

例子


td <- tidy(mtcars)
#> Warning: Data frame tidiers are deprecated and will be removed in an upcoming release of broom.
td
#> # A tibble: 11 × 13
#>    column     n    mean      sd median trimmed    mad   min    max  range
#>    <chr>  <dbl>   <dbl>   <dbl>  <dbl>   <dbl>  <dbl> <dbl>  <dbl>  <dbl>
#>  1 mpg       32  20.1     6.03   19.2   19.7    3.65  10.4   33.9   23.5 
#>  2 cyl       32   6.19    1.79    6      6.23   2      4      8      4   
#>  3 disp      32 231.    124.    196.   223.    94.8   71.1  472    401.  
#>  4 hp        32 147.     68.6   123    141.    52     52    335    283   
#>  5 drat      32   3.60    0.535   3.70   3.58   0.475  2.76   4.93   2.17
#>  6 wt        32   3.22    0.978   3.32   3.15   0.517  1.51   5.42   3.91
#>  7 qsec      32  17.8     1.79   17.7   17.8    0.955 14.5   22.9    8.4 
#>  8 vs        32   0.438   0.504   0      0.423  0      0      1      1   
#>  9 am        32   0.406   0.499   0      0.385  0      0      1      1   
#> 10 gear      32   3.69    0.738   4      3.62   1      3      5      2   
#> 11 carb      32   2.81    1.62    2      2.65   1      1      8      7   
#> # ℹ 3 more variables: skew <dbl>, kurtosis <dbl>, se <dbl>

glance(mtcars)
#> Warning: Data frame tidiers are deprecated and will be removed in an upcoming release of broom.
#> # A tibble: 1 × 4
#>    nrow  ncol complete.obs na.fraction
#>   <int> <int>        <int>       <dbl>
#> 1    32    11           32           0

library(ggplot2)
# compare mean and standard deviation
ggplot(td, aes(mean, sd)) + geom_point() +
     geom_text(aes(label = column), hjust = 1, vjust = 1) +
     scale_x_log10() + scale_y_log10() + geom_abline()

相關用法


注:本文由純淨天空篩選整理自大神的英文原創作品 Tidiers for data.frame objects。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。