计算并绘制核密度估计,它是直方图的平滑版本。对于来自底层平滑分布的连续数据,这是直方图的有用替代方案。
用法
geom_density(
mapping = NULL,
data = NULL,
stat = "density",
position = "identity",
...,
na.rm = FALSE,
orientation = NA,
show.legend = NA,
inherit.aes = TRUE,
outline.type = "upper"
)
stat_density(
mapping = NULL,
data = NULL,
geom = "area",
position = "stack",
...,
bw = "nrd0",
adjust = 1,
kernel = "gaussian",
n = 512,
trim = FALSE,
na.rm = FALSE,
bounds = c(-Inf, Inf),
orientation = NA,
show.legend = NA,
inherit.aes = TRUE
)
参数
- mapping
-
由
aes()
创建的一组美学映射。如果指定且inherit.aes = TRUE
(默认),它将与绘图顶层的默认映射组合。如果没有绘图映射,则必须提供mapping
。 - data
-
该层要显示的数据。有以下三种选择:
如果默认为
NULL
,则数据继承自ggplot()
调用中指定的绘图数据。data.frame
或其他对象将覆盖绘图数据。所有对象都将被强化以生成 DataFrame 。请参阅fortify()
将为其创建变量。将使用单个参数(绘图数据)调用
function
。返回值必须是data.frame
,并将用作图层数据。可以从formula
创建function
(例如~ head(.x, 10)
)。 - position
-
位置调整,可以是命名调整的字符串(例如
"jitter"
使用position_jitter
),也可以是调用位置调整函数的结果。如果需要更改调整设置,请使用后者。 - ...
-
其他参数传递给
layer()
。这些通常是美学,用于将美学设置为固定值,例如colour = "red"
或size = 3
。它们也可能是配对的 geom/stat 的参数。 - na.rm
-
如果
FALSE
,则默认缺失值将被删除并带有警告。如果TRUE
,缺失值将被静默删除。 - orientation
-
层的方向。默认值 (
NA
) 自动根据美学映射确定方向。万一失败,可以通过将orientation
设置为"x"
或"y"
来显式给出。有关更多详细信息,请参阅方向部分。 - show.legend
-
合乎逻辑的。该层是否应该包含在图例中?
NA
(默认值)包括是否映射了任何美学。FALSE
从不包含,而TRUE
始终包含。它也可以是一个命名的逻辑向量,以精细地选择要显示的美学。 - inherit.aes
-
如果
FALSE
,则覆盖默认美学,而不是与它们组合。这对于定义数据和美观的辅助函数最有用,并且不应继承默认绘图规范的行为,例如borders()
。 - outline.type
-
区域轮廓的类型;
"both"
绘制上下两条线,"upper"
/"lower"
仅绘制相应的线。"full"
在该区域周围绘制一个闭合多边形。 - geom, stat
-
用于覆盖
geom_density()
和stat_density()
之间的默认连接。 - bw
-
要使用的平滑带宽。如果是数字,则为平滑内核的标准差。如果是字符,则选择带宽的规则,如
stats::bw.nrd()
中列出。 - adjust
-
多重带宽调整。这使得在仍然使用带宽估计器的同时调整带宽成为可能。例如
adjust = 1/2
表示使用默认带宽的一半。 - kernel
-
核心。请参阅
density()
中的可用内核列表。 - n
-
要估计密度的等距点的数量,应该是 2 的幂,有关详细信息,请参阅
density()
- trim
-
如果是
FALSE
(默认值),则每个密度都是在数据的整个范围内计算的。如果是TRUE
,则每个密度都是在该组的范围内计算的:这通常意味着估计的 x 值不会line-up,因此您将无法堆叠密度值。仅当您在一张图中显示多个密度或手动调整比例限制时,此参数才有意义。 - bounds
-
已知估计数据的下限和上限。默认
c(-Inf, Inf)
意味着没有(有限)边界。如果任何边界是有限的,则默认密度估计的边界效应将通过在最近边周围反射bounds
之外的尾部来纠正。超出范围的数据点将被删除并发出警告。
方向
该几何体以不同的方式对待每个轴,因此可以有两个方向。通常,方向很容易从给定映射和使用的位置比例类型的组合中推断出来。因此,ggplot2 默认情况下会尝试猜测图层应具有哪个方向。在极少数情况下,方向不明确,猜测可能会失败。在这种情况下,可以直接使用 orientation
参数指定方向,该参数可以是 "x"
或 "y"
。该值给出了几何图形应沿着的轴,"x"
是您期望的几何图形的默认方向。
美学
geom_density()
理解以下美学(所需的美学以粗体显示):
-
x
-
y
-
alpha
-
colour
-
fill
-
group
-
linetype
-
linewidth
-
weight
在 vignette("ggplot2-specs")
中了解有关设置这些美学的更多信息。
计算变量
这些是由层的 'stat' 部分计算的,可以使用 delayed evaluation 访问。
-
after_stat(density)
密度估计。 -
after_stat(count)
密度 * 点数 - 对于堆积密度图很有用。 -
after_stat(scaled)
密度估计,缩放至最大值 1。 -
after_stat(n)
点数。 -
after_stat(ndensity)
别名为scaled
,镜像语法stat_bin()
.
也可以看看
有关显示连续分布的其他方法,请参阅geom_histogram()
、geom_freqpoly()
。有关紧凑密度显示,请参阅geom_violin()
。
例子
ggplot(diamonds, aes(carat)) +
geom_density()
# Map the values to y to flip the orientation
ggplot(diamonds, aes(y = carat)) +
geom_density()
ggplot(diamonds, aes(carat)) +
geom_density(adjust = 1/5)
ggplot(diamonds, aes(carat)) +
geom_density(adjust = 5)
ggplot(diamonds, aes(depth, colour = cut)) +
geom_density() +
xlim(55, 70)
#> Warning: Removed 45 rows containing non-finite values (`stat_density()`).
ggplot(diamonds, aes(depth, fill = cut, colour = cut)) +
geom_density(alpha = 0.1) +
xlim(55, 70)
#> Warning: Removed 45 rows containing non-finite values (`stat_density()`).
# Use `bounds` to adjust computation for known data limits
big_diamonds <- diamonds[diamonds$carat >= 1, ]
ggplot(big_diamonds, aes(carat)) +
geom_density(color = 'red') +
geom_density(bounds = c(1, Inf), color = 'blue')
# \donttest{
# Stacked density plots: if you want to create a stacked density plot, you
# probably want to 'count' (density * n) variable instead of the default
# density
# Loses marginal densities
ggplot(diamonds, aes(carat, fill = cut)) +
geom_density(position = "stack")
# Preserves marginal densities
ggplot(diamonds, aes(carat, after_stat(count), fill = cut)) +
geom_density(position = "stack")
# You can use position="fill" to produce a conditional density estimate
ggplot(diamonds, aes(carat, after_stat(count), fill = cut)) +
geom_density(position = "fill")
# }
相关用法
- R ggplot2 geom_density_2d 二维密度估计的等值线
- R ggplot2 geom_dotplot 点图
- R ggplot2 geom_qq 分位数-分位数图
- R ggplot2 geom_spoke 由位置、方向和距离参数化的线段
- R ggplot2 geom_quantile 分位数回归
- R ggplot2 geom_text 文本
- R ggplot2 geom_ribbon 函数区和面积图
- R ggplot2 geom_boxplot 盒须图(Tukey 风格)
- R ggplot2 geom_hex 二维箱计数的六边形热图
- R ggplot2 geom_bar 条形图
- R ggplot2 geom_bin_2d 二维 bin 计数热图
- R ggplot2 geom_jitter 抖动点
- R ggplot2 geom_point 积分
- R ggplot2 geom_linerange 垂直间隔:线、横线和误差线
- R ggplot2 geom_blank 什么也不画
- R ggplot2 geom_path 连接观察结果
- R ggplot2 geom_violin 小提琴情节
- R ggplot2 geom_errorbarh 水平误差线
- R ggplot2 geom_function 将函数绘制为连续曲线
- R ggplot2 geom_polygon 多边形
- R ggplot2 geom_histogram 直方图和频数多边形
- R ggplot2 geom_tile 矩形
- R ggplot2 geom_segment 线段和曲线
- R ggplot2 geom_map 参考Map中的多边形
- R ggplot2 geom_abline 参考线:水平、垂直和对角线
注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Smoothed density estimates。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。