这些是从向量中提取单个值的有用帮助器。即使输入比预期短,它们也保证返回有意义的值。您还可以提供一个可选的辅助向量来定义排序。
用法
nth(x, n, order_by = NULL, default = NULL, na_rm = FALSE)
first(x, order_by = NULL, default = NULL, na_rm = FALSE)
last(x, order_by = NULL, default = NULL, na_rm = FALSE)
参数
- x
-
一个向量
- n
-
对于
nth()
,指定位置的单个整数。负整数从末尾开始索引(即-1L
将返回向量中的最后一个值)。 - order_by
-
与
x
大小相同的可选向量,用于确定顺序。 - default
-
如果
x
中不存在该位置,则使用默认值。如果是
NULL
(默认值),则使用缺失值。如果提供,则它必须是单个值,该值将被转换为
x
的类型。当
x
为列表时,default
允许为任意值。在这种情况下没有类型或尺寸限制。 - na_rm
-
在提取值之前是否应该删除
x
中的缺失值?
细节
对于大多数向量类型, first(x)
、 last(x)
和 nth(x, n)
的工作方式分别类似于 x[[1]]
、 x[[length(x)]
和 x[[n]]
。主要的例外是数据帧,它们在其中检索行,即 x[1, ]
、 x[nrow(x), ]
和 x[n, ]
。这与 tidyverse/vctrs 原则一致,该原则将数据帧视为行向量,而不是列向量。
例子
x <- 1:10
y <- 10:1
first(x)
#> [1] 1
last(y)
#> [1] 1
nth(x, 1)
#> [1] 1
nth(x, 5)
#> [1] 5
nth(x, -2)
#> [1] 9
# `first()` and `last()` are often useful in `summarise()`
df <- tibble(x = x, y = y)
df %>%
summarise(
across(x:y, first, .names = "{col}_first"),
y_last = last(y)
)
#> # A tibble: 1 × 3
#> x_first y_first y_last
#> <int> <int> <int>
#> 1 1 10 1
# Selecting a position that is out of bounds returns a default value
nth(x, 11)
#> [1] NA
nth(x, 0)
#> [1] NA
# This out of bounds behavior also applies to empty vectors
first(integer())
#> [1] NA
# You can customize the default value with `default`
nth(x, 11, default = -1L)
#> [1] -1
first(integer(), default = 0L)
#> [1] 0
# `order_by` provides optional ordering
last(x)
#> [1] 10
last(x, order_by = y)
#> [1] 1
# `na_rm` removes missing values before extracting the value
z <- c(NA, NA, 1, 3, NA, 5, NA)
first(z)
#> [1] NA
first(z, na_rm = TRUE)
#> [1] 1
last(z, na_rm = TRUE)
#> [1] 5
nth(z, 3, na_rm = TRUE)
#> [1] 5
# For data frames, these select entire rows
df <- tibble(a = 1:5, b = 6:10)
first(df)
#> # A tibble: 1 × 2
#> a b
#> <int> <int>
#> 1 1 6
nth(df, 4)
#> # A tibble: 1 × 2
#> a b
#> <int> <int>
#> 1 4 9
相关用法
- R dplyr ntile 将数值向量分为 n 组
- R dplyr nest_join 嵌套连接
- R dplyr n_distinct 计算独特的组合
- R dplyr near 比较两个数值向量
- R dplyr nest_by 由一个或多个变量嵌套
- R dplyr na_if 将值转换为 NA
- R dplyr group_trim 修剪分组结构
- R dplyr slice 使用行的位置对行进行子集化
- R dplyr copy_to 将本地数据帧复制到远程src
- R dplyr sample_n 从表中采样 n 行
- R dplyr consecutive_id 为连续组合生成唯一标识符
- R dplyr row_number 整数排名函数
- R dplyr band_members 乐队成员
- R dplyr mutate-joins 变异连接
- R dplyr coalesce 找到第一个非缺失元素
- R dplyr group_split 按组分割 DataFrame
- R dplyr mutate 创建、修改和删除列
- R dplyr order_by 用于排序窗口函数输出的辅助函数
- R dplyr context 有关“当前”组或变量的信息
- R dplyr percent_rank 比例排名函数
- R dplyr recode 重新编码值
- R dplyr starwars 星球大战人物
- R dplyr desc 降序
- R dplyr between 检测值落在指定范围内的位置
- R dplyr cumall 任何、全部和平均值的累积版本
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Extract the first, last, or nth value from a vector。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。