从句子中提取单词
参数
- string
-
输入向量。或者是一个字符向量,或者是可强制转换为一个的东西。
- start, end
-
给出要提取的单词范围(包括)的整数向量对。如果为负数,则从最后一个单词开始倒数。
默认值选择第一个单词。
- sep
-
单词之间的分隔符。默认为单个空格。
例子
sentences <- c("Jane saw a cat", "Jane sat down")
word(sentences, 1)
#> [1] "Jane" "Jane"
word(sentences, 2)
#> [1] "saw" "sat"
word(sentences, -1)
#> [1] "cat" "down"
word(sentences, 2, -1)
#> [1] "saw a cat" "sat down"
# Also vectorised over start and end
word(sentences[1], 1:3, -1)
#> [1] "Jane saw a cat" "saw a cat" "a cat"
word(sentences[1], 1, 1:4)
#> [1] "Jane" "Jane saw" "Jane saw a" "Jane saw a cat"
# Can define words by other separators
str <- 'abc.def..123.4568.999'
word(str, 1, sep = fixed('..'))
#> [1] "abc.def"
word(str, 2, sep = fixed('..'))
#> [1] "123.4568.999"
相关用法
- R stringr str_which 查找匹配索引
- R stringr str_extract 提取完整的匹配项
- R stringr case 将字符串转换为大写、小写、标题大小写或句子大小写
- R stringr str_subset 查找匹配元素
- R stringr str_escape 转义正则表达式元字符
- R stringr str_trim 删除空格
- R stringr str_sub 使用子字符串的位置获取和设置子字符串
- R stringr modifiers 使用修饰符函数控制匹配行为
- R stringr str_replace_na 把NA变成“NA”
- R stringr str_trunc 将字符串截断至最大宽度
- R stringr str_match 从匹配中提取组件(捕获组)
- R stringr stringr-data 用于练习字符串操作的示例字符向量
- R stringr invert_match 将匹配位置切换到非匹配位置
- R stringr str_like 以与 SQL 的 LIKE 运算符相同的方式检测模式
- R stringr str_length 计算长度/宽度
- R stringr str_detect 检测是否存在匹配
- R stringr str_count 计算匹配次数
- R stringr str_split 将字符串分成几段
- R stringr str_unique 删除重复的字符串
- R stringr str_remove 删除匹配的模式
- R stringr str_pad 将字符串填充到最小宽度
- R stringr str_equal 判断两个字符串是否相等
- R stringr str_view 查看字符串和匹配项
- R stringr str_glue 用胶水插补
- R stringr str_conv 指定字符串的编码
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Extract words from a sentence。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。