当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


R ggplot2 geom_density 平滑密度估计


计算并绘制核密度估计,它是直方图的平滑版本。对于来自底层平滑分布的连续数据,这是直方图的有用替代方案。

用法

geom_density(
  mapping = NULL,
  data = NULL,
  stat = "density",
  position = "identity",
  ...,
  na.rm = FALSE,
  orientation = NA,
  show.legend = NA,
  inherit.aes = TRUE,
  outline.type = "upper"
)

stat_density(
  mapping = NULL,
  data = NULL,
  geom = "area",
  position = "stack",
  ...,
  bw = "nrd0",
  adjust = 1,
  kernel = "gaussian",
  n = 512,
  trim = FALSE,
  na.rm = FALSE,
  bounds = c(-Inf, Inf),
  orientation = NA,
  show.legend = NA,
  inherit.aes = TRUE
)

参数

mapping

aes() 创建的一组美学映射。如果指定且inherit.aes = TRUE(默认),它将与绘图顶层的默认映射组合。如果没有绘图映射,则必须提供mapping

data

该层要显示的数据。有以下三种选择:

如果默认为 NULL ,则数据继承自 ggplot() 调用中指定的绘图数据。

data.frame 或其他对象将覆盖绘图数据。所有对象都将被强化以生成 DataFrame 。请参阅fortify() 将为其创建变量。

将使用单个参数(绘图数据)调用function。返回值必须是 data.frame ,并将用作图层数据。可以从 formula 创建 function (例如 ~ head(.x, 10) )。

position

位置调整,可以是命名调整的字符串(例如 "jitter" 使用 position_jitter ),也可以是调用位置调整函数的结果。如果需要更改调整设置,请使用后者。

...

其他参数传递给 layer() 。这些通常是美学,用于将美学设置为固定值,例如 colour = "red"size = 3 。它们也可能是配对的 geom/stat 的参数。

na.rm

如果 FALSE ,则默认缺失值将被删除并带有警告。如果 TRUE ,缺失值将被静默删除。

orientation

层的方向。默认值 ( NA ) 自动根据美学映射确定方向。万一失败,可以通过将 orientation 设置为 "x""y" 来显式给出。有关更多详细信息,请参阅方向部分。

show.legend

合乎逻辑的。该层是否应该包含在图例中? NA(默认值)包括是否映射了任何美学。 FALSE 从不包含,而 TRUE 始终包含。它也可以是一个命名的逻辑向量,以精细地选择要显示的美学。

inherit.aes

如果 FALSE ,则覆盖默认美学,而不是与它们组合。这对于定义数据和美观的辅助函数最有用,并且不应继承默认绘图规范的行为,例如borders()

outline.type

区域轮廓的类型; "both" 绘制上下两条线,"upper" /"lower" 仅绘制相应的线。 "full" 在该区域周围绘制一个闭合多边形。

geom, stat

用于覆盖 geom_density()stat_density() 之间的默认连接。

bw

要使用的平滑带宽。如果是数字,则为平滑内核的标准差。如果是字符,则选择带宽的规则,如 stats::bw.nrd() 中列出。

adjust

多重带宽调整。这使得在仍然使用带宽估计器的同时调整带宽成为可能。例如adjust = 1/2表示使用默认带宽的一半。

kernel

核心。请参阅 density() 中的可用内核列表。

n

要估计密度的等距点的数量,应该是 2 的幂,有关详细信息,请参阅density()

trim

如果是FALSE(默认值),则每个密度都是在数据的整个范围内计算的。如果是 TRUE ,则每个密度都是在该组的范围内计算的:这通常意味着估计的 x 值不会line-up,因此您将无法堆叠密度值。仅当您在一张图中显示多个密度或手动调整比例限制时,此参数才有意义。

bounds

已知估计数据的下限和上限。默认 c(-Inf, Inf) 意味着没有(有限)边界。如果任何边界是有限的,则默认密度估计的边界效应将通过在最近边周围反射 bounds 之外的尾部来纠正。超出范围的数据点将被删除并发出警告。

方向

该几何体以不同的方式对待每个轴,因此可以有两个方向。通常,方向很容易从给定映射和使用的位置比例类型的组合中推断出来。因此,ggplot2 默认情况下会尝试猜测图层应具有哪个方向。在极少数情况下,方向不明确,猜测可能会失败。在这种情况下,可以直接使用 orientation 参数指定方向,该参数可以是 "x""y" 。该值给出了几何图形应沿着的轴,"x" 是您期望的几何图形的默认方向。

美学

geom_density() 理解以下美学(所需的美学以粗体显示):

  • x

  • y

  • alpha

  • colour

  • fill

  • group

  • linetype

  • linewidth

  • weight

vignette("ggplot2-specs") 中了解有关设置这些美学的更多信息。

计算变量

这些是由层的 'stat' 部分计算的,可以使用 delayed evaluation 访问。

  • after_stat(density)
    密度估计。

  • after_stat(count)
    密度 * 点数 - 对于堆积密度图很有用。

  • after_stat(scaled)
    密度估计,缩放至最大值 1。

  • after_stat(n)
    点数。

  • after_stat(ndensity)
    别名为scaled,镜像语法stat_bin().

也可以看看

有关显示连续分布的其他方法,请参阅geom_histogram()geom_freqpoly()。有关紧凑密度显示,请参阅geom_violin()

例子

ggplot(diamonds, aes(carat)) +
  geom_density()

# Map the values to y to flip the orientation
ggplot(diamonds, aes(y = carat)) +
  geom_density()


ggplot(diamonds, aes(carat)) +
  geom_density(adjust = 1/5)

ggplot(diamonds, aes(carat)) +
  geom_density(adjust = 5)


ggplot(diamonds, aes(depth, colour = cut)) +
  geom_density() +
  xlim(55, 70)
#> Warning: Removed 45 rows containing non-finite values (`stat_density()`).

ggplot(diamonds, aes(depth, fill = cut, colour = cut)) +
  geom_density(alpha = 0.1) +
  xlim(55, 70)
#> Warning: Removed 45 rows containing non-finite values (`stat_density()`).


# Use `bounds` to adjust computation for known data limits
big_diamonds <- diamonds[diamonds$carat >= 1, ]
ggplot(big_diamonds, aes(carat)) +
  geom_density(color = 'red') +
  geom_density(bounds = c(1, Inf), color = 'blue')


# \donttest{
# Stacked density plots: if you want to create a stacked density plot, you
# probably want to 'count' (density * n) variable instead of the default
# density

# Loses marginal densities
ggplot(diamonds, aes(carat, fill = cut)) +
  geom_density(position = "stack")

# Preserves marginal densities
ggplot(diamonds, aes(carat, after_stat(count), fill = cut)) +
  geom_density(position = "stack")


# You can use position="fill" to produce a conditional density estimate
ggplot(diamonds, aes(carat, after_stat(count), fill = cut)) +
  geom_density(position = "fill")

# }

相关用法


注:本文由纯净天空筛选整理自Hadley Wickham等大神的英文原创作品 Smoothed density estimates。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。