重新排列相关 DataFrame ,将高度相关的变量更紧密地分组在一起。
值
cor_df。请参阅correlate
。
例子
x <- correlate(mtcars)
#> Correlation computed with
#> • Method: 'pearson'
#> • Missing treated using: 'pairwise.complete.obs'
rearrange(x) # Default settings
#> # A tibble: 11 × 12
#> term mpg vs drat am gear qsec carb hp
#> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 mpg NA 0.664 0.681 0.600 0.480 0.419 -0.551 -0.776
#> 2 vs 0.664 NA 0.440 0.168 0.206 0.745 -0.570 -0.723
#> 3 drat 0.681 0.440 NA 0.713 0.700 0.0912 -0.0908 -0.449
#> 4 am 0.600 0.168 0.713 NA 0.794 -0.230 0.0575 -0.243
#> 5 gear 0.480 0.206 0.700 0.794 NA -0.213 0.274 -0.126
#> 6 qsec 0.419 0.745 0.0912 -0.230 -0.213 NA -0.656 -0.708
#> 7 carb -0.551 -0.570 -0.0908 0.0575 0.274 -0.656 NA 0.750
#> 8 hp -0.776 -0.723 -0.449 -0.243 -0.126 -0.708 0.750 NA
#> 9 wt -0.868 -0.555 -0.712 -0.692 -0.583 -0.175 0.428 0.659
#> 10 disp -0.848 -0.710 -0.710 -0.591 -0.556 -0.434 0.395 0.791
#> 11 cyl -0.852 -0.811 -0.700 -0.523 -0.493 -0.591 0.527 0.832
#> # … with 3 more variables: wt <dbl>, disp <dbl>, cyl <dbl>
#> # ℹ Use `colnames()` to see all variable names
rearrange(x, method = "HC") # Different seriation method
#> # A tibble: 11 × 12
#> term wt cyl disp hp carb drat am gear
#> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 wt NA 0.782 0.888 0.659 0.428 -0.712 -0.692 -0.583
#> 2 cyl 0.782 NA 0.902 0.832 0.527 -0.700 -0.523 -0.493
#> 3 disp 0.888 0.902 NA 0.791 0.395 -0.710 -0.591 -0.556
#> 4 hp 0.659 0.832 0.791 NA 0.750 -0.449 -0.243 -0.126
#> 5 carb 0.428 0.527 0.395 0.750 NA -0.0908 0.0575 0.274
#> 6 drat -0.712 -0.700 -0.710 -0.449 -0.0908 NA 0.713 0.700
#> 7 am -0.692 -0.523 -0.591 -0.243 0.0575 0.713 NA 0.794
#> 8 gear -0.583 -0.493 -0.556 -0.126 0.274 0.700 0.794 NA
#> 9 qsec -0.175 -0.591 -0.434 -0.708 -0.656 0.0912 -0.230 -0.213
#> 10 mpg -0.868 -0.852 -0.848 -0.776 -0.551 0.681 0.600 0.480
#> 11 vs -0.555 -0.811 -0.710 -0.723 -0.570 0.440 0.168 0.206
#> # … with 3 more variables: qsec <dbl>, mpg <dbl>, vs <dbl>
#> # ℹ Use `colnames()` to see all variable names
rearrange(x, absolute = FALSE) # Not using absolute values for arranging
#> # A tibble: 11 × 12
#> term mpg vs drat am gear qsec carb hp
#> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 mpg NA 0.664 0.681 0.600 0.480 0.419 -0.551 -0.776
#> 2 vs 0.664 NA 0.440 0.168 0.206 0.745 -0.570 -0.723
#> 3 drat 0.681 0.440 NA 0.713 0.700 0.0912 -0.0908 -0.449
#> 4 am 0.600 0.168 0.713 NA 0.794 -0.230 0.0575 -0.243
#> 5 gear 0.480 0.206 0.700 0.794 NA -0.213 0.274 -0.126
#> 6 qsec 0.419 0.745 0.0912 -0.230 -0.213 NA -0.656 -0.708
#> 7 carb -0.551 -0.570 -0.0908 0.0575 0.274 -0.656 NA 0.750
#> 8 hp -0.776 -0.723 -0.449 -0.243 -0.126 -0.708 0.750 NA
#> 9 wt -0.868 -0.555 -0.712 -0.692 -0.583 -0.175 0.428 0.659
#> 10 disp -0.848 -0.710 -0.710 -0.591 -0.556 -0.434 0.395 0.791
#> 11 cyl -0.852 -0.811 -0.700 -0.523 -0.493 -0.591 0.527 0.832
#> # … with 3 more variables: wt <dbl>, disp <dbl>, cyl <dbl>
#> # ℹ Use `colnames()` to see all variable names
相关用法
- R corrr retract 从拉伸的相关表创建 DataFrame
- R corrr rplot 绘制相关 DataFrame 。
- R corrr as_cordf 强制列表和矩阵关联数据帧
- R corrr correlate 相关 DataFrame
- R corrr pair_n 成对完整案例的数量。
- R corrr dice 返回仅包含选定字段的关联表
- R corrr stretch 将相关数据帧拉伸为长格式。
- R corrr colpair_map 将函数应用于 DataFrame 中的所有列对
- R corrr autoplot.cor_df 从 cor_df 对象创建相关矩阵
- R corrr as_matrix 将相关数据帧转换为矩阵格式
- R corrr focus_if 有条件地聚焦相关 DataFrame
- R corrr first_col 将第一列添加到 data.frame
- R corrr focus 关注相关 DataFrame 架的部分。
- R corrr shave 剃掉上/下三角形。
- R corrr fashion 设计用于打印的相关 DataFrame 架。
- R corrr network_plot 相关 DataFrame 的网络图
- R SparkR corr用法及代码示例
- R findGlobals 查找闭包使用的全局函数和变量
- R SparkR count用法及代码示例
- R SparkR column用法及代码示例
- R SparkR columns用法及代码示例
- R checkUsage 检查 R 代码是否存在可能的问题
- R showTree R 表达式的打印 Lisp 风格表示
- R compile 字节码编译器
- R SparkR cov用法及代码示例
注:本文由纯净天空筛选整理自Max Kuhn等大神的英文原创作品 Re-arrange a correlation data frame。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。