當前位置: 首頁>>編程示例 >>用法及示例精選 >>正文


Python tf.compat.v1.distributions.Categorical用法及代碼示例

分類分布。

繼承自:Distribution

用法

tf.compat.v1.distributions.Categorical(
    logits=None, probs=None, dtype=tf.dtypes.int32, validate_args=False,
    allow_nan_stats=True, name='Categorical'
)

參數

  • logits 一個 N-D Tensor , N >= 1 ,表示一組分類分布的對數概率。第一個 N - 1 維度索引到一批獨立分布,最後一個維度表示每個類的 logits 向量。隻應傳入logitsprobs 之一。
  • probs N-D Tensor , N >= 1 ,表示一組分類分布的概率。第一個 N - 1 維度索引成一批獨立分布,最後一個維度表示每個類的概率向量。隻應傳入logitsprobs 之一。
  • dtype 事件樣本的類型(默認值:int32)。
  • validate_args Python bool ,默認 False 。盡管可能會降低運行時性能,但檢查 True 分發參數的有效性時。當False 無效輸入可能會默默呈現不正確的輸出。
  • allow_nan_stats Python bool ,默認 True 。當 True 時,統計信息(例如,均值、眾數、方差)使用值“NaN”來指示結果未定義。當 False 時,如果一個或多個統計數據的批處理成員未定義,則會引發異常。
  • name Python str 名稱以此類創建的 Ops 為前綴。

屬性

  • allow_nan_stats Pythonbool說明未定義統計信息時的行為。

    統計數據在有意義時返回 +/- 無窮大。例如,柯西分布的方差是無窮大的。但是,有時統計數據是未定義的,例如,如果分布的 pdf 在分布的支持範圍內沒有達到最大值,則模式是未定義的。如果均值未定義,則根據定義,方差未定義。例如: df = 1 的 Student's T 的平均值是未定義的(沒有明確的方式說它是 + 或 - 無窮大),因此方差 = E[(X - mean)**2] 也是未定義的。

  • batch_shape 來自單個事件索引的單個樣本的形狀作為TensorShape.

    可能部分定義或未知。

    批次維度是該分布的獨立、不同參數化的索引。

  • dtype TensorDType 由此 Distribution 處理。
  • event_shape 單個批次的單個樣品的形狀作為TensorShape.

    可能部分定義或未知。

  • event_size 標量 int32 張量:類的數量。
  • logits 坐標邏輯的向量。
  • name Distribution 創建的所有操作前的名稱。
  • parameters 用於實例化此 Distribution 的參數字典。
  • probs 坐標概率向量。
  • reparameterization_type 說明如何重新參數化分布中的樣本。

    目前這是靜態實例 distributions.FULLY_REPARAMETERIZEDdistributions.NOT_REPARAMETERIZED 之一。

  • validate_args Python bool 表示啟用了可能昂貴的檢查。

分類分布由一組K 類的概率或log-probabilities 參數化。它是在整數 {0, 1, ..., K} 上定義的。

分類分布與OneHotCategoricalMultinomial 分布密切相關。分類分布可以直觀地理解為根據 argmax{ OneHotCategorical(probs) } 本身與 argmax{ Multinomial(probs, total_count=1) } 相同來生成樣本。

數學細節

概率質量函數 (pmf) 是,

pmf(k; pi) = prod_j pi_j**[k == j]

陷阱

類數 K 不得超過:

  • self.dtype 可表示的最大整數,即 2**(mantissa_bits+1) (IEEE 754),
  • 最大 Tensor 索引,即 2**31-1

換一種說法,

K <= min(2**31-1, {
  tf.float16:2**11,
  tf.float32:2**24,
  tf.float64:2**53 }[param.dtype])

注意:此條件僅在 self.validate_args = True 時有效。

例子

創建一個 3 類分布,其中 2 類最有可能。

dist = Categorical(probs=[0.1, 0.5, 0.4])
n = 1e4
empirical_prob = tf.cast(
    tf.histogram_fixed_width(
      dist.sample(int(n)),
      [0., 2],
      nbins=3),
    dtype=tf.float32) / n
# ==> array([ 0.1005,  0.5037,  0.3958], dtype=float32)

創建一個 3 類分布,其中 2 類最有可能。由 logits 而不是概率參數化。

dist = Categorical(logits=np.log([0.1, 0.5, 0.4])
n = 1e4
empirical_prob = tf.cast(
    tf.histogram_fixed_width(
      dist.sample(int(n)),
      [0., 2],
      nbins=3),
    dtype=tf.float32) / n
# ==> array([0.1045,  0.5047, 0.3908], dtype=float32)

創建一個 3 類分布,其中 3 類最有可能。分布函數可以根據計數進行評估。

# counts is a scalar.
p = [0.1, 0.4, 0.5]
dist = Categorical(probs=p)
dist.prob(0)  # Shape []

# p will be broadcast to [[0.1, 0.4, 0.5], [0.1, 0.4, 0.5]] to match counts.
counts = [1, 0]
dist.prob(counts)  # Shape [2]

# p will be broadcast to shape [3, 5, 7, 3] to match counts.
counts = [[...]] # Shape [5, 7, 3]
dist.prob(counts)  # Shape [5, 7, 3]

相關用法


注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.compat.v1.distributions.Categorical。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。