html_attr()
获取单个属性; html_attrs()
获取所有属性。
参数
- x
-
文档(来自
read_html()
)、节点集(来自html_elements()
)、节点(来自html_element()
)或会话(来自session()
)。 - name
-
要检索的属性的名称。
- default
-
当该属性不存在于每个元素中时用作默认值的字符串。
例子
html <- minimal_html('<ul>
<li><a href="https://a.com" class="important">a</a></li>
<li class="active"><a href="https://c.com">b</a></li>
<li><a href="https://c.com">b</a></li>
</ul>')
html %>% html_elements("a") %>% html_attrs()
#> [[1]]
#> href class
#> "https://a.com" "important"
#>
#> [[2]]
#> href
#> "https://c.com"
#>
#> [[3]]
#> href
#> "https://c.com"
#>
html %>% html_elements("a") %>% html_attr("href")
#> [1] "https://a.com" "https://c.com" "https://c.com"
html %>% html_elements("li") %>% html_attr("class")
#> [1] NA "active" NA
html %>% html_elements("li") %>% html_attr("class", default = "inactive")
#> [1] "inactive" "active" "inactive"
相关用法
- R rvest html_encoding_guess 猜测字符编码错误
- R rvest html_text 获取元素文本
- R rvest html_element 从 HTML 文档中选择元素
- R rvest html_form 解析表单并设置值
- R rvest html_children 获取元素子元素
- R rvest html_name 获取元素名称
- R rvest html_table 将 html 表解析为 DataFrame
- R rvest session 在网络浏览器中模拟会话
- R rvest minimal_html 从内联 HTML 创建 HTML 文档
- R predict.rpart 根据拟合的 Rpart 对象进行预测
- R SparkR randomSplit用法及代码示例
- R reprex un-reprex 取消渲染reprex
- R SparkR read.stream用法及代码示例
- R SparkR rbind用法及代码示例
- R readr datasource 创建源对象。
- R readr melt_delim 返回分隔文件中每个标记的熔化数据(包括 csv 和 tsv)
- R readr read_rds 读/写 RDS 文件。
- R readr read_lines 从文件中读取/写入行
- R SparkR rollup用法及代码示例
- R readr parse_number 灵活地解析数字
- R snip.rpart 剪切 Rpart 对象的子树
- R labels.rpart 为 Rpart 对象创建分割标签
- R SparkR refreshByPath用法及代码示例
- R summary.rpart 总结拟合的 Rpart 对象
- R printcp 显示拟合 Rpart 对象的 CP 表
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Get element attributes。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。