当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R broom data.frame_tidiers data.frame 对象的整理器


DataFrame 整理器已弃用,并将从即将发布的 broom 版本中删除。

用法

# S3 method for data.frame
tidy(x, ..., na.rm = TRUE, trim = 0.1)

# S3 method for data.frame
augment(x, data, ...)

# S3 method for data.frame
glance(x, ...)

来源

偏斜和峰度函数改编自中的实现moments包:
卢卡斯·科姆斯塔和弗雷 Delhi 克·诺沃梅斯基 (2015)。矩:矩、累积量、偏度、峰度和相关测试。 R 包版本 0.14。
https://CRAN.R-project.org/package=moments

参数

x

data.frame

...

其他方法的附加参数。

na.rm

一个逻辑值,指示在计算继续之前是否应删除 NA 值。

trim

在计算平均值之前从 x 的每一端修剪的观测值分数(0 到 0.5)。传递给 meantrim 参数

data

数据,未使用

tidy.data.frame 生成一个 DataFrame ,每个原始列一行,包含每个 DataFrame 的摘要统计信息:

column

原始列名称

n

有效(非 NA)值的数量

mean

意思是

sd

标准差

median

中位数

trimmed

修剪平均值,修剪默认为 0.1

mad

中位数绝对偏差(与中位数)

min

最小值

max

最大值

range

范围

skew

倾斜

kurtosis

峰度

se

标准误

glance 返回 one-row data.frame

nrow

行数

ncol

列数

complete.obs

没有缺失值的行数

na.fraction

所有行和列中缺失的值的比例

细节

这些对 data.frame 对象执行整洁的摘要。 tidy 生成有关每列的摘要统计信息,而 glance 仅报告行数和列数。请注意,augment.data.frame 将引发错误。

作者

大卫·罗宾逊、本杰明·纳特

例子


td <- tidy(mtcars)
#> Warning: Data frame tidiers are deprecated and will be removed in an upcoming release of broom.
td
#> # A tibble: 11 × 13
#>    column     n    mean      sd median trimmed    mad   min    max  range
#>    <chr>  <dbl>   <dbl>   <dbl>  <dbl>   <dbl>  <dbl> <dbl>  <dbl>  <dbl>
#>  1 mpg       32  20.1     6.03   19.2   19.7    3.65  10.4   33.9   23.5 
#>  2 cyl       32   6.19    1.79    6      6.23   2      4      8      4   
#>  3 disp      32 231.    124.    196.   223.    94.8   71.1  472    401.  
#>  4 hp        32 147.     68.6   123    141.    52     52    335    283   
#>  5 drat      32   3.60    0.535   3.70   3.58   0.475  2.76   4.93   2.17
#>  6 wt        32   3.22    0.978   3.32   3.15   0.517  1.51   5.42   3.91
#>  7 qsec      32  17.8     1.79   17.7   17.8    0.955 14.5   22.9    8.4 
#>  8 vs        32   0.438   0.504   0      0.423  0      0      1      1   
#>  9 am        32   0.406   0.499   0      0.385  0      0      1      1   
#> 10 gear      32   3.69    0.738   4      3.62   1      3      5      2   
#> 11 carb      32   2.81    1.62    2      2.65   1      1      8      7   
#> # ℹ 3 more variables: skew <dbl>, kurtosis <dbl>, se <dbl>

glance(mtcars)
#> Warning: Data frame tidiers are deprecated and will be removed in an upcoming release of broom.
#> # A tibble: 1 × 4
#>    nrow  ncol complete.obs na.fraction
#>   <int> <int>        <int>       <dbl>
#> 1    32    11           32           0

library(ggplot2)
# compare mean and standard deviation
ggplot(td, aes(mean, sd)) + geom_point() +
     geom_text(aes(label = column), hjust = 1, vjust = 1) +
     scale_x_log10() + scale_y_log10() + geom_abline()

相关用法


注:本文由纯净天空筛选整理自大神的英文原创作品 Tidiers for data.frame objects。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。