关于广义Sylvester矩阵方程反自反解的有限迭代算法

2022-03-26 07:04
关键词:范数等价归纳法

邓 勇

(喀什大学数学与统计学院,新疆 喀什 844006)

0 引言

众所周知,若矩阵P∈Rn×n满足条件PT=P和P2=I,则称其为广义反射矩阵.若矩阵A∈Rn×n满足条件A=-PAP,则称其为关于广义反射矩阵P的反自反矩阵[1].

关于广义反射矩阵的反自反矩阵已广泛应用于工程和科学计算中.[2-3]文献[4-10]分别研究了不同形式的线性矩阵方程的自反和反自反解;文献[11]在MHSS方法的基础上,获得了一种求解具有非Hermitian矩阵和对称复正定(半正定)矩阵的大型稀疏Sylvester方程的广义MHSS方法;文献[12]基于求线性矩阵方程约束解的修正共轭梯度法,通过修改某些矩阵的结构,建立了特殊类型的多变量线性矩阵方程的广义自反解的迭代算法;文献[13]讨论了广义耦合Sylvester矩阵求解的迭代算法;文献[14]建立了一类Riccati矩阵方程广义自反解的双迭代算法;文献[15]研究了矩阵方程组存在广义自反和反自反解的充要条件.在上述文献研究的基础上,本文将给出计算一类新广义Sylvester矩阵方程反自反解的有限迭代算法.

考虑广义Sylvester矩阵方程

AX+BY=EXF+C.

(1)

其中:A,E∈Rm×p,B∈Rm×q,F∈Rn×n,C∈Rm×n是给定矩阵,X∈Rp×n和Y∈Rq×n是待定矩阵.

1 预备知识

(2)

的形式,其中U=[U1,U2]是正交矩阵(UUT=UTU=In)且U1∈Rn×r,U2∈Rn×(n-r)[2].

定义1.1 线性或非线性矩阵方程组称为相容的,如果至少有一组未知量的值满足其每个方程.否则,称矩阵方程组不相容,即不存在满足其所有方程的一组未知量的值.

(3)

其中:A2∈Rr×(n-r),A3∈R(n-r)×r,U和UT如(2)式所示.

设A,B,E,C∈Rm×n,F∈Rn×n,并且两个n阶广义反射矩阵P和S可表为

(4)

其中U=[U1,U2]和Z=[Z1,Z2]是正交矩阵,U1,Z1∈Rn×r,U2,Z2∈Rn×(n-r).现给出如下分解:

AU=(A11,A12),A11∈Rm×r,A12∈Rm×(n-r);EU=(E11,E12),E11∈Rm×r,E12∈Rm×(n-r);

则可证得如下定理:

定理1.1 设A,B,E,C∈Rm×n,F∈Rn×n.若P和S是两个n阶广义反射矩阵,则下列陈述等价:

(b) 矩阵方程

A11X12U12+A12X13U11-E12X13F11-E11X12F12+B11Y12Z12+B12Y13Z11=C

(5)

有反自反解.在有解的情况下,广义Sylvester矩阵方程(1)的反自反解可表为

(6)

其中:X12,Y12∈Rr×(n-r);X13,Y13∈R(n-r)×r;U,UT,Z,ZT如(4)式所示.

2 矩阵方程(5)的迭代算法

问题2.1 对给定的矩阵A11,B11,E11∈Rm×r,A12,B12,E12∈Rm×(n-r),F11,U11,Z11∈Rr×n,F12,U12,Z12∈R(n-r)×n和C∈Rm×n,求X12,Y12∈Rr×(n-r)和X13,Y13∈R(n-r)×r,使其满足

A11X12U12+A12X13U11-E12X13F11-E11X12F12+B11Y12Z12+B12Y13Z11=C.

(7)

(8)

2.1 问题2.1的算法程序

第一步输入矩阵A11,B11,E11∈Rm×r,A12,B12,E12∈Rm×(n-r),F11,U11,Z11∈Rr×n,F12,U12,Z12∈R(n-r)×n和C∈Rm×n.

第二步选择任意的X12,Y12∈Rr×(n-r)和X13,Y13∈R(n-r)×r.

第三步计算

R(1)=C-A11X12(1)U12-A12X13(1)U11+E11X12(1)F12+E12X13(1)F11-B11Y12(1)Z12-B12Y13(1)Z11,

第四步若R(k)=0,则X12(k),X13(k),Y12(k),Y13(k)就是矩阵方程(5)的解,于是终止步骤;若R(k)≠0,而P1(k)=P2(k)=Q1(k)=Q2(k)=0,则矩阵方程(5)不相容,为此需转到下一步.

第五步令‖P1(t)‖2+‖P2(t)‖2+‖Q1(t)‖2+‖Q2(t)‖2=λ(t),μ(t)=‖R(t+1)‖2/‖R(t)‖2,计算

X12(k+1)=X12(k)+(‖R(k)‖2/λ(k))·P1(k);X13(k+1)=X13(k)+(‖R(k)‖2/λ(k))·P2(k);

Y12(k+1)=Y12(k)+(‖R(k)‖2/λ(k))·Q1(k);Y13(k+1)=Y13(k)+(‖R(k)‖2/λ(k))·Q2(k);

第六步由第五步得到上述序列后再转到第四步.如此循环反复.

2.2 算法2.1的收敛性分析

引理2.2.1[2]若线性方程组Ax=b有解x*∈R(AT),则x*是其唯一的最小Frobenius范数解.

算法2.1具有下列重要性质:

引理2.2.2 设序列{R(i)},{P1(i)},{P2(i)},{Q1(i)},{Q2(i)}由算法2.1给出.若R(i)≠0,则有

(9)

证明显然,只需证明对1≤i

第一步证明当j=i+1时,有

(10)

事实上,由数学归纳法,当i=1时,有

此外,

假设对1

此即

tr(RT(t+1)R(t))=0.

(11)

同样有

(12)

第二步证明当1≤i≤s-1和1≤l≤s时,有

(13)

成立.由于l=1的情况已在第一步中证明,所以只需证明当l≤v≤s时,(13)式成立即可.

由数学归纳法分两步证明

(14)

首先,当i=1时,由算法2.1和第一步,(14)式中第1式的左边可写为

(14)式中第2式的左边也可写为

由归纳原理可知,(14)式正确.

其次,利用第一步的证明结果和算法2.1,可得

(15)

以及

(16)

重复(15)和(16)式的上述推导过程,对确定的α和β,可得

利用这两个关系并结合(14)式可知,当l=v+1时(13)式正确.

综合上述结果,由数学归纳法可知引理2.2.2成立.证毕.

(17)

其中R(i),P1(i),P2(i),Q1(i),Q2(i),X12(i),Y12(i),X13(i),Y13(i)是由算法2.1得到的序列.

证明利用数学归纳法.当i=1时,通过直接计算可得

假设当i=t时(17)式成立,即有

(18)

于是,当i=t+1时,就有

现将在算法2.1中得到的X12(t+1),Y12(t+1),X13(t+1),Y13(t+1)代入上式,可得

最后,利用(18)式得到

根据数学归纳法,对所有的i=1,2,…,引理2.2.3均成立.证毕.

注1引理2.2.3表明:若存在正数i,使得P1(i)=P2(i)=Q1(i)=Q2(i)=0但R(i)≠0,则矩阵方程(5)不相容.因此,在没有舍入误差的情况下,矩阵方程(5)的可解性可由算法2.1自动确定.

定理2.2.1 设问题2.1相容.于是,在没有舍入误差的情况下,对任意初始矩阵X12,Y12∈Rr×(n-r)和X13,Y13∈R(n-r)×r,利用算法2.1,问题2.1的解可通过有限步迭代而获得.

(19)

(20)

因此,R(1),R(2),…,R(mn)是矩阵空间Rm×n的一组正交基且R(mn+1)=0.这意味着,X12(mn+1),Y12(mn+1),X13(mn+1),Y13(mn+1)是问题2.1的反自反解.证毕.

证明矩阵方程(5)关于广义反射矩阵反自反解的可解性等价于线性方程组

的可解性[15].现在,任取矩阵D,由于

3 问题2.2的最佳逼近反自反解

设问题2.2是相容的,从而其解集S3≠∅.对给定的矩阵X12,Y12∈Rr×(n-r)和X13,Y13∈R(n-r)×r,显然,矩阵方程

A11X12U12+A12X13U11-E11X12F12-E12X13F11+B11Y12Z12+B12Y13Z11=C

(21)

等价于矩阵方程

于是,问题2.2的最佳逼近反自反解等价于矩阵方程

4 数值算例

给定广义Sylvester矩阵方程(1),取

求其最佳逼近反自反解.

将矩阵P,S分别表示为

容易证明,PXP=-X,SYS=-Y,即X和Y分别是关于广义反射矩阵P和S的反自反矩阵,并且矩阵方程存在关于广义反射矩阵P,S的反自反解.通过计算,其反自反解为

现在,利用算法2.1求解矩阵方程(11).由定理1.1知,线性矩阵方程(11)等价于矩阵方程

A11X12U12+A12X13U11-E11X12F12-E12X13F11+B11Y12Z12+B12Y13Z11=C.

(22)

其中:

选择任意初始迭代矩阵X12(1)=Y12(1)=X13(1)=Y13(1)=0.由算法2.1,可得方程(5)的近似解为

并且,其相应的残差为

其中

表1给出了方程(22)的最小Frobenius范数解的迭代次数k和相应残差的范数.

表1 最小Frobenius范数解的迭代次数和相应残差的范数

并且,其相应的残差为

并且,其相应的残差为

表2 最佳逼近解的迭代次数和相应残差的范数

猜你喜欢
范数等价归纳法
等价转化
基于同伦l0范数最小化重建的三维动态磁共振成像
n次自然数幂和的一个等价无穷大
基于加权核范数与范数的鲁棒主成分分析
高观点下的数学归纳法
用“不完全归纳法”解两道物理高考题
用“不完全归纳法”解两道物理高考题
数学归纳法在高考试题中的应用
基于非凸[lp]范数和G?范数的图像去模糊模型
将问题等价转化一下再解答