当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R strcapture 将字符串标记捕获到 data.frame 中


R语言 strcapture 位于 utils 包(package)。

说明

给定一个字符向量和一个包含捕获表达式的正则表达式,strcapture 会将捕获的标记提取到表格数据结构中,例如 data.frame,其类型和结构由原型对象指定。假设从每个输入字符串中捕获相同数量的标记。

用法

strcapture(pattern, x, proto, perl = FALSE, useBytes = FALSE)

参数

pattern

带有捕获表达式的正则表达式。

x

用于捕获标记的字符向量。

proto

行为类似的 data.frame 或 S4 对象。查看具体信息。

perl,useBytes

传递给 regexec 的参数。

细节

proto 参数通常是 data.frame ,其中一列按顺序对应于每个捕获表达式。捕获的字符向量被强制为列的类型,列名称将被保留到返回值中。原型中的任何数据都将被忽略。请参阅示例。

proto 类型相同的表格数据结构,因此通常是 data.frame ,包含每个捕获表达式的列。列类型和名称继承自 protox 中与 pattern 不匹配的情况在每列中都有 NA

例子

x <- "chr1:1-1000"
pattern <- "(.*?):([[:digit:]]+)-([[:digit:]]+)"
proto <- data.frame(chr=character(), start=integer(), end=integer())
strcapture(pattern, x, proto)

也可以看看

regexecregmatches 用于相关的低级实用程序。

相关用法


注:本文由纯净天空筛选整理自R-devel大神的英文原创作品 Capture String Tokens into a data.frame。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。