这组函数允许您模拟用户与网站交互、使用表单以及从一个页面导航到另一个页面。
-
使用
session(url)
创建会话 -
使用
session_jump_to()
导航到指定的网址,或使用session_follow_link()
访问页面上的链接。 -
提交 html_form 和
session_submit()
。 -
使用
session_history()
查看历史记录,并使用session_back()
和session_forward()
前后导航。 -
使用
html_element()
和html_elements()
提取页面内容,或使用read_html()
获取完整的 HTML 文档。 -
使用
httr::cookies()
、httr::headers()
和httr::status_code()
检查 HTTP 响应。
用法
session(url, ...)
is.session(x)
session_jump_to(x, url, ...)
session_follow_link(x, i, css, xpath, ...)
session_back(x)
session_forward(x)
session_history(x)
session_submit(x, form, submit = NULL, ...)
参数
- url
-
要导航到的 URL(相对或绝对)。
- ...
-
在整个会话中使用的任何其他 httr 配置。
- x
-
一次会议。
- i
-
用于选择第 i 个链接的整数或用于匹配包含该文本的第一个链接的字符串(区分大小写)。
- css, xpath
-
要选择的元素。根据您要使用 CSS 选择器还是 XPath 1.0 表达式,提供
css
或xpath
之一。 - form
-
要提交的html_form
- submit
-
应该使用哪个按钮来提交表单?
-
NULL
默认使用第一个按钮。 -
字符串通过名称选择按钮。
-
数字使用其相对位置来选择按钮。
-
例子
s <- session("http://hadley.nz")
s %>%
session_jump_to("hadley-wickham.jpg") %>%
session_jump_to("/") %>%
session_history()
#> Warning: Not Found (HTTP 404).
#> https://hadley.nz/
#> https://hadley.nz/hadley-wickham.jpg
#> - https://hadley.nz/
s %>%
session_jump_to("hadley-wickham.jpg") %>%
session_back() %>%
session_history()
#> Warning: Not Found (HTTP 404).
#> - https://hadley.nz/
#> https://hadley.nz/hadley-wickham.jpg
# \donttest{
s %>%
session_follow_link(css = "p a") %>%
html_elements("p")
#> Navigating to http://rstudio.com
#> {xml_nodeset (68)}
#> [1] <p class="d-inline">\n <b><a style="color: #ffffff; fon ...
#> [2] <p class="d-inline pl-0 pt-1 pr-3">\n <b class="pr-3">< ...
#> [3] <p><a style="color: #ffffff; font-size: .9em;" href="https://posit ...
#> [4] <p>The premier IDE for R</p>
#> [5] <p>RStudio anywhere using a web browser</p>
#> [6] <p>Put Shiny applications online</p>
#> [7] <p>Shiny, R Markdown, Tidyverse and more</p>
#> [8] <p>Next level training for you and your team</p>
#> [9] <p>Do, share, teach and learn data science</p>
#> [10] <p>An easy way to access R packages</p>
#> [11] <p>Let us host your Shiny applications</p>
#> [12] <p>A single home for R & Python Data Science Teams</p>
#> [13] <p>Scale, develop, and collaborate across R & Python</p>
#> [14] <p>Easily share your insights</p>
#> [15] <p>Control and distribute packages</p>
#> [16] <p>RStudio</p>
#> [17] <p>RStudio Server</p>
#> [18] <p>Shiny Server</p>
#> [19] <p>R Packages</p>
#> [20] <p>RStudio Academy</p>
#> ...
# }
相关用法
- R rvest html_encoding_guess 猜测字符编码错误
- R rvest html_text 获取元素文本
- R rvest html_element 从 HTML 文档中选择元素
- R rvest html_form 解析表单并设置值
- R rvest html_children 获取元素子元素
- R rvest html_name 获取元素名称
- R rvest html_table 将 html 表解析为 DataFrame
- R rvest html_attr 获取元素属性
- R rvest minimal_html 从内联 HTML 创建 HTML 文档
- R predict.rpart 根据拟合的 Rpart 对象进行预测
- R SparkR randomSplit用法及代码示例
- R reprex un-reprex 取消渲染reprex
- R SparkR read.stream用法及代码示例
- R SparkR rbind用法及代码示例
- R readr datasource 创建源对象。
- R readr melt_delim 返回分隔文件中每个标记的熔化数据(包括 csv 和 tsv)
- R readr read_rds 读/写 RDS 文件。
- R readr read_lines 从文件中读取/写入行
- R SparkR rollup用法及代码示例
- R readr parse_number 灵活地解析数字
- R snip.rpart 剪切 Rpart 对象的子树
- R labels.rpart 为 Rpart 对象创建分割标签
- R SparkR refreshByPath用法及代码示例
- R summary.rpart 总结拟合的 Rpart 对象
- R printcp 显示拟合 Rpart 对象的 CP 表
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Simulate a session in web browser。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。