用法
all_reduce(
reduce_op, value, options=None
)
參數
-
reduce_op
一個tf.distribute.ReduceOp
值,指定如何組合值。允許使用枚舉的字符串表示,例如"SUM"、"MEAN"。 -
value
tf.Tensor
或tf.IndexedSlices
的潛在嵌套結構,tf.nest.flatten
接受。value
的結構和形狀需要在所有副本上相同。 -
options
一個tf.distribute.experimental.CommunicationOptions
。執行集體操作的選項。如果tf.distribute.Strategy
在構造函數中采用一個,這將覆蓋默認選項。有關選項的詳細信息,請參閱tf.distribute.experimental.CommunicationOptions
。
返回
-
tf.Tensor
的嵌套結構,具有減少的值。結構與value
相同。
All-reduces value
跨所有副本。
strategy = tf.distribute.MirroredStrategy(["GPU:0", "GPU:1"])
def step_fn():
ctx = tf.distribute.get_replica_context()
value = tf.identity(1.)
return ctx.all_reduce(tf.distribute.ReduceOp.SUM, value)
strategy.experimental_local_results(strategy.run(step_fn))
(<tf.Tensor:shape=(), dtype=float32, numpy=2.0>,
<tf.Tensor:shape=(), dtype=float32, numpy=2.0>)
它支持批處理操作。您可以傳遞一個值列表,並在可能的情況下嘗試對它們進行批處理。您還可以指定 options
以指示所需的批處理行為,例如將值批處理到多個包中,以便它們可以更好地與計算重疊。
strategy = tf.distribute.MirroredStrategy(["GPU:0", "GPU:1"])
def step_fn():
ctx = tf.distribute.get_replica_context()
value1 = tf.identity(1.)
value2 = tf.identity(2.)
return ctx.all_reduce(tf.distribute.ReduceOp.SUM, [value1, value2])
strategy.experimental_local_results(strategy.run(step_fn))
([<tf.Tensor:shape=(), dtype=float32, numpy=2.0>,
<tf.Tensor:shape=(), dtype=float32, numpy=4.0>],
[<tf.Tensor:shape=(), dtype=float32, numpy=2.0>,
<tf.Tensor:shape=(), dtype=float32, numpy=4.0>])
注意所有副本都需要參與all-reduce,否則這個操作會掛起。請注意,如果有多個all-reduces,它們需要在所有副本上以相同的順序執行。根據條件調度all-reduce通常是error-prone。
已知限製:如果 value
包含 tf.IndexedSlices
,嘗試計算梯度 w.r.t value
將導致錯誤。
此 API 目前隻能在副本上下文中調用。跨副本減少值的其他變體是: * tf.distribute.StrategyExtended.reduce_to
:cross-replica 上下文中的 reduce 和 all-reduce API。 * tf.distribute.StrategyExtended.batch_reduce_to
:cross-replica 上下文中的批處理減少和all-reduce API。 * tf.distribute.Strategy.reduce
:在cross-replica 上下文中減少到主機的更方便的方法。
相關用法
- Python tf.distribute.ReplicaContext.all_gather用法及代碼示例
- Python tf.distribute.ReplicaContext.merge_call用法及代碼示例
- Python tf.distribute.ReplicaContext用法及代碼示例
- Python tf.distribute.ReductionToOneDevice用法及代碼示例
- Python tf.distribute.OneDeviceStrategy.experimental_distribute_values_from_function用法及代碼示例
- Python tf.distribute.TPUStrategy用法及代碼示例
- Python tf.distribute.experimental_set_strategy用法及代碼示例
- Python tf.distribute.experimental.MultiWorkerMirroredStrategy.gather用法及代碼示例
- Python tf.distribute.cluster_resolver.TFConfigClusterResolver用法及代碼示例
- Python tf.distribute.experimental.MultiWorkerMirroredStrategy用法及代碼示例
- Python tf.distribute.TPUStrategy.experimental_assign_to_logical_device用法及代碼示例
- Python tf.distribute.NcclAllReduce用法及代碼示例
- Python tf.distribute.OneDeviceStrategy.experimental_distribute_dataset用法及代碼示例
- Python tf.distribute.experimental.rpc.Server.create用法及代碼示例
- Python tf.distribute.experimental.MultiWorkerMirroredStrategy.experimental_distribute_dataset用法及代碼示例
- Python tf.distribute.OneDeviceStrategy.gather用法及代碼示例
- Python tf.distribute.MirroredStrategy.reduce用法及代碼示例
- Python tf.distribute.Strategy.scope用法及代碼示例
- Python tf.distribute.TPUStrategy.reduce用法及代碼示例
注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.distribute.ReplicaContext.all_reduce。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。