将集群表示为一组"tasks",组织成"jobs"。
用法
tf.train.ClusterSpec(
cluster
)
参数
-
cluster
将一个或多个作业名称映射到 (i) 网络地址列表,或 (ii) 将整数任务索引映射到网络地址的字典;或tf.train.ClusterDef
协议缓冲区。
抛出
-
TypeError
如果cluster
不是将字符串映射到字符串列表的字典,也不是tf.train.ClusterDef
protobuf。
属性
-
jobs
返回此集群中的作业名称列表。
tf.train.ClusterSpec
表示参与分布式 TensorFlow 计算的进程集。每个tf.distribute.Server
都在一个特定的集群中构建。
要创建具有两个作业和五个任务的集群,您需要指定从作业名称到网络地址列表(通常为 hostname-port 对)的映射。
cluster = tf.train.ClusterSpec({"worker":["worker0.example.com:2222",
"worker1.example.com:2222",
"worker2.example.com:2222"],
"ps":["ps0.example.com:2222",
"ps1.example.com:2222"]})
每个作业也可以指定为从任务索引到网络地址的稀疏映射。这使得无需知道(例如)所有其他工作任务的身份即可配置服务器:
cluster = tf.train.ClusterSpec({"worker":{1:"worker1.example.com:2222"},
"ps":["ps0.example.com:2222",
"ps1.example.com:2222"]})
相关用法
- Python tf.train.Coordinator.stop_on_exception用法及代码示例
- Python tf.train.Checkpoint.restore用法及代码示例
- Python tf.train.Checkpoint.read用法及代码示例
- Python tf.train.CheckpointOptions用法及代码示例
- Python tf.train.Checkpoint.save用法及代码示例
- Python tf.train.Checkpoint.write用法及代码示例
- Python tf.train.Coordinator用法及代码示例
- Python tf.train.CheckpointManager用法及代码示例
- Python tf.train.Checkpoint用法及代码示例
- Python tf.train.ExponentialMovingAverage用法及代码示例
- Python tf.train.list_variables用法及代码示例
- Python tf.transpose用法及代码示例
注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.train.ClusterSpec。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。