將集群表示為一組"tasks",組織成"jobs"。
用法
tf.train.ClusterSpec(
cluster
)
參數
-
cluster
將一個或多個作業名稱映射到 (i) 網絡地址列表,或 (ii) 將整數任務索引映射到網絡地址的字典;或tf.train.ClusterDef
協議緩衝區。
拋出
-
TypeError
如果cluster
不是將字符串映射到字符串列表的字典,也不是tf.train.ClusterDef
protobuf。
屬性
-
jobs
返回此集群中的作業名稱列表。
tf.train.ClusterSpec
表示參與分布式 TensorFlow 計算的進程集。每個tf.distribute.Server
都在一個特定的集群中構建。
要創建具有兩個作業和五個任務的集群,您需要指定從作業名稱到網絡地址列表(通常為 hostname-port 對)的映射。
cluster = tf.train.ClusterSpec({"worker":["worker0.example.com:2222",
"worker1.example.com:2222",
"worker2.example.com:2222"],
"ps":["ps0.example.com:2222",
"ps1.example.com:2222"]})
每個作業也可以指定為從任務索引到網絡地址的稀疏映射。這使得無需知道(例如)所有其他工作任務的身份即可配置服務器:
cluster = tf.train.ClusterSpec({"worker":{1:"worker1.example.com:2222"},
"ps":["ps0.example.com:2222",
"ps1.example.com:2222"]})
相關用法
- Python tf.train.Coordinator.stop_on_exception用法及代碼示例
- Python tf.train.Checkpoint.restore用法及代碼示例
- Python tf.train.Checkpoint.read用法及代碼示例
- Python tf.train.CheckpointOptions用法及代碼示例
- Python tf.train.Checkpoint.save用法及代碼示例
- Python tf.train.Checkpoint.write用法及代碼示例
- Python tf.train.Coordinator用法及代碼示例
- Python tf.train.CheckpointManager用法及代碼示例
- Python tf.train.Checkpoint用法及代碼示例
- Python tf.train.ExponentialMovingAverage用法及代碼示例
- Python tf.train.list_variables用法及代碼示例
- Python tf.transpose用法及代碼示例
注:本文由純淨天空篩選整理自tensorflow.org大神的英文原創作品 tf.train.ClusterSpec。非經特殊聲明,原始代碼版權歸原作者所有,本譯文未經允許或授權,請勿轉載或複製。