这是 dplyr mutate()
泛型的方法。它被转换为 [.data.table
的 j
参数,使用 :=
修改 "in place"。如果提供了.before
或.after
,则通过调用data.table::setcolorder()
来重新定位新列。
用法
# S3 method for dtplyr_step
mutate(
.data,
...,
.by = NULL,
.keep = c("all", "used", "unused", "none"),
.before = NULL,
.after = NULL
)
参数
- .data
-
一个
lazy_dt()
。 - ...
-
<
data-masking
> Name-value 对。名称给出输出中列的名称。该值可以是:
-
长度为1的向量,将被回收到正确的长度。
-
与当前组(或整个数据帧,如果未分组)长度相同的向量。
-
NULL
,删除该列。 -
DataFrame 或小标题,用于在输出中创建多个列。
-
- .by
-
<
tidy-select
> (可选)仅针对此操作选择要分组的列,作为group_by()
的替代方案。有关详细信息和示例,请参阅?dplyr_by。 - .keep
-
控制
.data
中的哪些列保留在输出中。始终保留分组列和...
创建的列。-
"all"
保留.data
中的所有列。这是默认设置。 -
"used"
仅保留...
中使用的列以创建新列。这对于检查您的工作非常有用,因为它并排显示输入和输出。 -
"unused"
仅保留...
中未使用的列以创建新列。如果您生成新列,但不再需要用于生成它们的列,这非常有用。 -
"none"
不保留.data
中的任何额外列。仅保留...
创建的分组变量和列。
注意:使用 dtplyr
.keep
将仅适用于作为符号传递的列名称,并且不适用于其他工作流程(例如eval(parse(text = "x + 1"))
) -
- .before, .after
-
<
tidy-select
> (可选)控制新列应出现的位置(默认设置是添加到右侧)。有关更多详细信息,请参阅relocate()
。
例子
library(dplyr, warn.conflicts = FALSE)
dt <- lazy_dt(data.frame(x = 1:5, y = 5:1))
dt %>%
mutate(a = (x + y) / 2, b = sqrt(x^2 + y^2))
#> Source: local data table [5 x 4]
#> Call: copy(`_DT24`)[, `:=`(a = (x + y)/2, b = sqrt(x^2 + y^2))]
#>
#> x y a b
#> <int> <int> <dbl> <dbl>
#> 1 1 5 3 5.10
#> 2 2 4 3 4.47
#> 3 3 3 3 4.24
#> 4 4 2 3 4.47
#> 5 5 1 3 5.10
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
# It uses a more sophisticated translation when newly created variables
# are used in the same expression
dt %>%
mutate(x1 = x + 1, x2 = x1 + 1)
#> Source: local data table [5 x 4]
#> Call: copy(`_DT24`)[, `:=`(c("x1", "x2"), {
#> x1 <- x + 1
#> x2 <- x1 + 1
#> .(x1, x2)
#> })]
#>
#> x y x1 x2
#> <int> <int> <dbl> <dbl>
#> 1 1 5 2 3
#> 2 2 4 3 4
#> 3 3 3 4 5
#> 4 4 2 5 6
#> 5 5 1 6 7
#>
#> # Use as.data.table()/as.data.frame()/as_tibble() to access results
相关用法
- R dtplyr lazy_dt 创建一个“惰性”data.table 以与 dplyr 动词一起使用
- R dtplyr group_modify.dtplyr_step 对每个组应用一个函数
- R dtplyr transmute.dtplyr_step 创建新列,删除旧列
- R dtplyr slice.dtplyr_step 使用行的位置对行进行子集化
- R dtplyr left_join.dtplyr_step 连接数据表
- R dtplyr fill.dtplyr_step 用上一个或下一个值填充缺失值
- R dtplyr filter.dtplyr_step 使用列值对行进行子集化
- R dtplyr distinct.dtplyr_step 子集不同/唯一行
- R dtplyr unite.dtplyr_step 通过将字符串粘贴在一起将多列合并为一列。
- R dtplyr nest.dtplyr_step 巢
- R dtplyr relocate.dtplyr_step 使用变量名称重新定位变量
- R dtplyr head.dtplyr_step 对第一行或最后一行进行子集化
- R dtplyr expand.dtplyr_step 扩展 DataFrame 以包含所有可能的值组合。
- R dtplyr group_by.dtplyr_step 分组和取消分组
- R dtplyr intersect.dtplyr_step 设置操作
- R dtplyr pivot_wider.dtplyr_step 将数据从长轴转向宽轴
- R dtplyr summarise.dtplyr_step 将每组汇总为一行
- R dtplyr count.dtplyr_step 按组计数观察值
- R dtplyr select.dtplyr_step 使用名称对列进行子集化
- R dtplyr drop_na.dtplyr_step 删除包含缺失值的行
- R dtplyr complete.dtplyr_step 完成缺少数据组合的 DataFrame
- R dtplyr collect.dtplyr_step 强制计算惰性 data.table
- R dtplyr arrange.dtplyr_step 按列值排列行
- R dtplyr separate.dtplyr_step 使用正则表达式或数字位置将字符列分成多列
- R dtplyr rename.dtplyr_step 使用名称重命名列
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Create and modify columns。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。