用法
batch(
batch_size, drop_remainder=False, num_parallel_calls=None, deterministic=None,
name=None
)
參數
-
batch_size
tf.int64
標量tf.Tensor
,表示要在單個批次中組合的此數據集的連續元素的數量。 -
drop_remainder
(可選。)一個tf.bool
標量tf.Tensor
,表示在最後一批少於batch_size
元素的情況下是否應刪除它;默認行為是不丟棄較小的批次。 -
num_parallel_calls
(可選。)tf.int64
標量tf.Tensor
,表示要並行異步計算的批次數。如果未指定,批次將按順序計算。如果使用值tf.data.AUTOTUNE
,則並行調用的數量根據可用資源動態設置。 -
deterministic
(可選。)指定num_parallel_calls
時,如果指定了此布爾值(True
或False
),它將控製轉換生成元素的順序。如果設置為False
,則允許轉換產生無序元素,以用確定性換取性能。如果未指定,則tf.data.Options.deterministic
選項(默認為True
)控製行為。 -
name
(可選。) tf.data 操作的名稱。
返回
-
Dataset
一個Dataset
。
將此數據集的連續元素組合成批次。
dataset = tf.data.Dataset.range(8)
dataset = dataset.batch(3)
list(dataset.as_numpy_iterator())
[array([0, 1, 2]), array([3, 4, 5]), array([6, 7])]
dataset = tf.data.Dataset.range(8)
dataset = dataset.batch(3, drop_remainder=True)
list(dataset.as_numpy_iterator())
[array([0, 1, 2]), array([3, 4, 5])]
結果元素的組件將有一個額外的外部維度,它將是batch_size
(或者如果batch_size
沒有將輸入元素N
的數量除以drop_remainder
是最後一個元素,則為N % batch_size
,並且drop_remainder
是False
)。如果您的程序依賴於具有相同外部尺寸的批次,則應將 drop_remainder
參數設置為 True
以防止生成較小的批次。
注意:如果您的程序要求數據具有靜態已知的形狀(例如,使用 XLA 時),您應該使用 drop_remainder=True
。如果沒有drop_remainder=True
,輸出數據集的形狀將具有未知的前導維度,因為最終批次可能較小。
相關用法
- Python tf.data.experimental.RandomDataset.bucket_by_sequence_length用法及代碼示例
- Python tf.data.experimental.RandomDataset.group_by_window用法及代碼示例
- Python tf.data.experimental.RandomDataset.cache用法及代碼示例
- Python tf.data.experimental.RandomDataset.map用法及代碼示例
- Python tf.data.experimental.RandomDataset.from_tensor_slices用法及代碼示例
- Python tf.data.experimental.RandomDataset.as_numpy_iterator用法及代碼示例
- Python tf.data.experimental.RandomDataset.get_single_element用法及代碼示例
- Python tf.data.experimental.RandomDataset.take用法及代碼示例
- Python tf.data.experimental.RandomDataset.range用法及代碼示例
- Python tf.data.experimental.RandomDataset.unbatch用法及代碼示例
- Python tf.data.experimental.RandomDataset.scan用法及代碼示例
- Python tf.data.experimental.RandomDataset.snapshot用法及代碼示例
- Python tf.data.experimental.RandomDataset.from_generator用法及代碼示例
- Python tf.data.experimental.RandomDataset.repeat用法及代碼示例
- Python tf.data.experimental.RandomDataset.choose_from_datasets用法及代碼示例
- Python tf.data.experimental.RandomDataset.shuffle用法及代碼示例
- Python tf.data.experimental.RandomDataset.window用法及代碼示例
- Python tf.data.experimental.RandomDataset.random用法及代碼示例
- Python tf.data.experimental.RandomDataset.enumerate用法及代碼示例
- Python tf.data.experimental.RandomDataset.padded_batch用法及代碼示例
注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.data.experimental.RandomDataset.batch。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。