当前位置: 首页>>代码示例 >>用法及示例精选 >>正文


Python tf.linalg.LinearOperatorBlockLowerTriangular用法及代码示例


LinearOperators 组合成一个块状下三角矩阵。

继承自:LinearOperatorModule

用法

tf.linalg.LinearOperatorBlockLowerTriangular(
    operators, is_non_singular=None, is_self_adjoint=None,
    is_positive_definite=None, is_square=None,
    name='LinearOperatorBlockLowerTriangular'
)

参数

  • operators LinearOperator 对象的可迭代对象的可迭代对象,每个对象都具有相同的 dtypeoperators 的每个元素对应于一个行分区,按从上到下的顺序。每个row-partition 中的运算符从左到右填写。例如,operators = [[op_0], [op_1, op_2], [op_3, op_4, op_5]] 创建一个具有完整块结构 [[op_0, 0, 0], [op_1, op_2, 0], [op_3, op_4, op_5]]LinearOperatorBlockLowerTriangular。第 i 行中的运算符数量必须等于 i ,以便每个运算符落在块结构的对角线上或之下。 LinearOperator 落在对角线上的(每行的最后一个元素)必须是正方形的。其他LinearOperator 的域维度必须等于同一column-partition 中的LinearOperator 的域维度,并且范围维度等于同一row-partition 中的LinearOperator 的范围维度。
  • is_non_singular 期望这个运算符是非奇异的。
  • is_self_adjoint 期望这个算子等于它的厄米转置。
  • is_positive_definite 期望这个算子是正定的,意思是二次形式x^H A x对所有非零具有正实部x.请注意,我们不要求算子自伴是正定的。看:https://en.wikipedia.org/wiki/Positive-definite_matrix#Extension_for_non-symmetric_matrices
  • is_square 期望此运算符的行为类似于方形 [batch] 矩阵。如果设置为 False ,这将引发 ValueError
  • name LinearOperator 的名称。

抛出

  • TypeError 如果所有运算符都没有相同的 dtype
  • ValueError 如果operators 为空、包含错误数量的元素或包含形状不兼容的运算符。

属性

  • H 返回当前的伴随LinearOperator.

    给定 A 表示此 LinearOperator ,返回 A* 。请注意,调用self.adjoint()self.H 是等效的。

  • batch_shape TensorShape这批尺寸的LinearOperator.

    如果此运算符的作用类似于带有 A.shape = [B1,...,Bb, M, N] 的批处理矩阵 A,则返回 TensorShape([B1,...,Bb]) ,相当于 A.shape[:-2]

  • domain_dimension 此运算符的域的维度(在向量空间的意义上)。

    如果此运算符的作用类似于带有 A.shape = [B1,...,Bb, M, N] 的批处理矩阵 A ,则返回 N

  • dtype TensorDType 由此 LinearOperator 处理。
  • graph_parents 这个的图依赖列表LinearOperator. (已弃用)

    警告:此函数已弃用。它将在未来的版本中删除。更新说明:请勿调用 graph_parents

  • is_non_singular
  • is_positive_definite
  • is_self_adjoint
  • is_square 返回 True/False 取决于此运算符是否为正方形。
  • operators
  • parameters 用于实例化此 LinearOperator 的参数字典。
  • range_dimension 此运算符范围的维度(在向量空间的意义上)。

    如果此运算符的作用类似于带有 A.shape = [B1,...,Bb, M, N] 的批处理矩阵 A ,则返回 M

  • shape TensorShape这个的LinearOperator.

    如果此运算符的作用类似于带有 A.shape = [B1,...,Bb, M, N] 的批处理矩阵 A ,则返回 TensorShape([B1,...,Bb, M, N]) ,等效于 A.shape

  • tensor_rank 与此运算符对应的矩阵的秩(在张量的意义上)。

    如果此运算符的作用类似于带有 A.shape = [B1,...,Bb, M, N] 的批处理矩阵 A ,则返回 b + 2

该运算符使用嵌套的线性运算符列表进行初始化,这些线性运算符组合成一个新的LinearOperator,其基础矩阵表示为正方形,并且每个运算符都在主对角线之上或之下,其他地方为零。外部列表的每个元素是与块结构的row-partition相对应的LinearOperators列表。 row-partion i 中的 LinearOperator 的数量必须等于 i

例如,按块 3 x 3 LinearOperatorBlockLowerTriangular 使用列表 [[op_00], [op_10, op_11], [op_20, op_21, op_22]] 进行初始化,其中 op_ij , i < 3, j <= iLinearOperator 实例。 LinearOperatorBlockLowerTriangular 表现为以下块状矩阵,其中 0 表示 appropriately-sized [batch] 零矩阵:

[[op_00,     0,     0],
 [op_10, op_11,     0],
 [op_20, op_21, op_22]]

对角线上的每个 op_jj 都需要表示一个方阵,因此将具有形状 batch_shape_j + [M_j, M_j] 。分块结构的j 行中的LinearOperator 必须具有与op_jj 相同的range_dimension,并且j 列中的LinearOperators 必须具有与op_jj 相同的domain_dimension

如果对角线上的每个 op_jj 具有形状 batch_shape_j + [M_j, M_j] ,则组合运算符具有形状 broadcast_batch_shape + [sum M_j, sum M_j] ,其中 broadcast_batch_shapebatch_shape_j , j = 0, 1, ..., J 的相互广播,假设中间批次形状广播。即使组合形状被很好地定义,组合算子的方法也可能由于定义算子的方法中缺乏广播能力而失败。

例如,要创建一个由三个 2 x 2 运算符组合而成的 4 x 4 线性运算符:

>>> operator_0 = tf.linalg.LinearOperatorFullMatrix([[1., 2.], [3., 4.]])
>>> operator_1 = tf.linalg.LinearOperatorFullMatrix([[1., 0.], [0., 1.]])
>>> operator_2 = tf.linalg.LinearOperatorLowerTriangular([[5., 6.], [7., 8]])
>>> operator = LinearOperatorBlockLowerTriangular(
...   [[operator_0], [operator_1, operator_2]])
operator.to_dense()
<tf.Tensor:shape=(4, 4), dtype=float32, numpy=
array([[1., 2., 0., 0.],
       [3., 4., 0., 0.],
       [1., 0., 5., 0.],
       [0., 1., 7., 8.]], dtype=float32)>
operator.shape
TensorShape([4, 4])
operator.log_abs_determinant()
<tf.Tensor:shape=(), dtype=float32, numpy=4.3820267>
x0 = [[1., 6.], [-3., 4.]]
x1 = [[0., 2.], [4., 0.]]
x = tf.concat([x0, x1], 0)  # Shape [2, 4] Tensor
operator.matmul(x)
<tf.Tensor:shape=(4, 2), dtype=float32, numpy=
array([[-5., 14.],
       [-9., 34.],
       [ 1., 16.],
       [29., 18.]], dtype=float32)>

上面的matmul等价于:

>>> tf.concat([operator_0.matmul(x0),
...   operator_1.matmul(x0) + operator_2.matmul(x1)], axis=0)
<tf.Tensor:shape=(4, 2), dtype=float32, numpy=
array([[-5., 14.],
       [-9., 34.],
       [ 1., 16.],
       [29., 18.]], dtype=float32)>

形状兼容性

该运算符作用于具有兼容形状的 [batch] 矩阵。 x 是与 matmulsolve 的形状兼容的批处理矩阵,如果

operator.shape = [B1,...,Bb] + [M, N],  with b >= 0
x.shape =        [B1,...,Bb] + [N, R],  with R >= 0.

例如:

创建一个 [2, 3] 批 4 x 4 线性算子:

>>> matrix_44 = tf.random.normal(shape=[2, 3, 4, 4])
>>> operator_44 = tf.linalg.LinearOperatorFullMatrix(matrix_44)

创建一个 [1, 3] 批次的 5 x 4 线性运算符:

>>> matrix_54 = tf.random.normal(shape=[1, 3, 5, 4])
>>> operator_54 = tf.linalg.LinearOperatorFullMatrix(matrix_54)

创建一个 [1, 3] 批 5 x 5 线性运算符:

>>> matrix_55 = tf.random.normal(shape=[1, 3, 5, 5])
>>> operator_55 = tf.linalg.LinearOperatorFullMatrix(matrix_55)

组合创建一个 [2, 3] 批次的 9 x 9 运算符:

>>> operator_99 = LinearOperatorBlockLowerTriangular(
...   [[operator_44], [operator_54, operator_55]])
>>> operator_99.shape
TensorShape([2, 3, 9, 9])

创建一个形状 [2, 1, 9] 的向量批并将运算符应用于它。

>>> x = tf.random.normal(shape=[2, 1, 9])
>>> y = operator_99.matvec(x)
>>> y.shape
TensorShape([2, 3, 9])

创建向量的块状列表并将运算符应用于它。返回一个分块列表。

>>> x4 = tf.random.normal(shape=[2, 1, 4])
>>> x5 = tf.random.normal(shape=[2, 3, 5])
>>> y_blockwise = operator_99.matvec([x4, x5])
>>> y_blockwise[0].shape
TensorShape([2, 3, 4])
>>> y_blockwise[1].shape
TensorShape([2, 3, 5])

性能

假设operator是由Drow-partitions和Dcolumn-partitions组成的LinearOperatorBlockLowerTriangular,这样算子的总数就是N = D * (D + 1) // 2

  • operator.matmul 的复杂度等于各个运算符的matmul 复杂度之和。
  • operator.solve 的复杂度等于对角线上运算符的solve 复杂度和对角线外运算符的matmul 复杂度之和。
  • operator.determinant 的复杂度等于对角线上运算符的determinant 复杂度之和。

矩阵属性提示

LinearOperator 使用 is_X 形式的布尔标志初始化,用于 X = non_singular, self_adjoint, positive_definite, square 。它们具有以下含义:

  • 如果 is_X == True ,调用者应该期望操作符具有属性 X 。这是一个应该实现的承诺,但不是运行时断言。例如,有限的浮点精度可能会导致违反这些承诺。
  • 如果 is_X == False ,调用者应该期望操作符没有 X
  • 如果is_X == None(默认),调用者应该没有任何期望。

相关用法


注:本文由纯净天空筛选整理自tensorflow.org大神的英文原创作品 tf.linalg.LinearOperatorBlockLowerTriangular。非经特殊声明,原始代码版权归原作者所有,本译文未经允许或授权,请勿转载或复制。