满足以上设定的矩阵范数可以有多种。由于它们都是定义在
M
m
,
n
(
K
)
{\displaystyle {\mathcal {M}}_{m,n}(\mathbb {K} )}
这个有限维向量空间上的范数,所以实质上是等价的。常见的矩阵范数通常是在矩阵的应用中自然定义或诱导的范数。
向量范数诱导的矩阵范数
编辑
考虑从向量空间
V
=
K
m
{\displaystyle V=\mathbb {K} ^{m}}
映射到
W
=
K
n
{\displaystyle W=\mathbb {K} ^{n}}
的所有线性映射的构成的空间:
L
m
,
n
(
K
)
{\displaystyle {\mathcal {L}}_{m,n}(\mathbb {K} )}
。设
V
{\displaystyle V}
和
W
{\displaystyle W}
中分别装备了两个向量范数
‖
⋅
‖
V
{\displaystyle \|\cdot \|_{V}}
和
‖
⋅
‖
W
{\displaystyle \|\cdot \|_{W}}
,则可以定义
L
m
,
n
(
K
)
{\displaystyle {\mathcal {L}}_{m,n}(\mathbb {K} )}
上的算子范数
‖
⋅
‖
L
{\displaystyle \|\cdot \|_{\mathcal {L}}}
:
∀
A
∈
L
m
,
n
(
K
)
‖
A
‖
L
=
max
{
‖
A
(
x
)
‖
W
;
x
∈
V
,
‖
x
‖
V
⩽
1
}
{\displaystyle \forall A\in {\mathcal {L}}_{m,n}(\mathbb {K} )\|A\|_{\mathcal {L}}=\max\{\|A(x)\|_{W}\;;\;\;x\in V,\;\;\|x\|_{V}\leqslant 1\}}
。
而给定了基底后,每个从
V
{\displaystyle V}
映射到
W
{\displaystyle W}
的线性映射都可以用一个
m
×
n
{\displaystyle m\times n}
的矩阵来表示,所以同样地可以定义
M
m
,
n
(
K
)
{\displaystyle {\mathcal {M}}_{m,n}(\mathbb {K} )}
上的非负映射
‖
⋅
‖
M
{\displaystyle \|\cdot \|_{\mathcal {M}}}
:
∀
A
∈
M
m
,
n
(
K
)
‖
A
‖
M
=
max
{
‖
A
x
‖
W
;
x
∈
V
,
‖
x
‖
V
⩽
1
}
{\displaystyle \forall A\in {\mathcal {M}}_{m,n}(\mathbb {K} )\|A\|_{\mathcal {M}}=\max\{\|Ax\|_{W}\;;\;\;x\in V,\;\;\|x\|_{V}\leqslant 1\}}
。
可以验证,
‖
⋅
‖
M
{\displaystyle \|\cdot \|_{\mathcal {M}}}
满足矩阵范数的定义,因此是一个矩阵范数。这个矩阵范数被称为是由向量空间范数诱导的矩阵范数,可以看作是算子范数在由有限维向量空间之间线性映射组成的空间上的特例。如果
m
=
n
{\displaystyle m=n}
,所对应的矩阵空间就是
n
{\displaystyle n}
阶方块矩阵空间
M
n
(
K
)
{\displaystyle {\mathcal {M}}_{n}(\mathbb {K} )}
。这时可以验证,诱导范数
‖
⋅
‖
M
{\displaystyle \|\cdot \|_{\mathcal {M}}}
满足一致性条件。
p-范数诱导的矩阵范数
编辑
当
V
{\displaystyle V}
和
W
{\displaystyle W}
中装备的向量范数都是
p
{\displaystyle p}
-范数的时候,诱导的矩阵范数也称为矩阵的诱导
p
{\displaystyle p}
-范数。具体来说就是:
‖
A
‖
p
=
max
x
≠
0
‖
A
x
‖
p
‖
x
‖
p
=
max
x
≠
0
(
∑
i
=
1
m
|
∑
j
=
1
n
a
i
j
x
j
|
p
)
1
/
p
(
∑
j
=
1
n
|
x
j
|
p
)
1
/
p
{\displaystyle \left\|A\right\|_{p}=\max \limits _{x\neq 0}{\frac {\left\|Ax\right\|_{p}}{\left\|x\right\|_{p}}}=\max \limits _{x\neq 0}{\frac {\left(\sum _{i=1}^{m}|\sum _{j=1}^{n}a_{ij}x_{j}|^{p}\right)^{1/p}}{\left(\sum _{j=1}^{n}|x_{j}|^{p}\right)^{1/p}}}}
。
在
p
=
1
{\displaystyle p=1}
和
p
=
∞
{\displaystyle p=\infty }
的情况下,其范数可以以下方式计算:
‖
A
‖
1
=
max
1
≤
j
≤
n
∑
i
=
1
m
|
a
i
j
|
‖
A
‖
∞
=
max
1
≤
i
≤
m
∑
j
=
1
n
|
a
i
j
|
{\displaystyle {\begin{aligned}&\left\|A\right\|_{1}=\max \limits _{1\leq j\leq n}\sum _{i=1}^{m}|a_{ij}|\\&\left\|A\right\|_{\infty }=\max \limits _{1\leq i\leq m}\sum _{j=1}^{n}|a_{ij}|\end{aligned}}}
这些与矩阵的 Schatten
p
{\displaystyle p}
-范数不同,也可以用
‖
A
‖
p
{\displaystyle \left\|A\right\|_{p}}
来表示。
当
p
=
2
{\displaystyle p=2}
(欧几里得范数)时,诱导的矩阵范数就是谱范数。矩阵
A
{\displaystyle A}
的谱范数是
A
{\displaystyle A}
最大的奇异值或半正定矩阵
A
∗
A
{\displaystyle A^{*}A}
的最大特征值的平方根:
‖
A
‖
2
=
λ
max
(
A
∗
A
)
{\displaystyle \left\|A\right\|_{2}={\sqrt {\lambda _{\text{max}}(A^{*}A)}}}
其中
A
∗
{\displaystyle A^{*}}
代表
A
{\displaystyle A}
的共轭转置。
任何诱导的矩阵范数都满足此不等式
‖
A
‖
≥
ρ
(
A
)
,
{\displaystyle \left\|A\right\|\geq \rho (A),}
其中
ρ
(
A
)
{\displaystyle \rho (A)}
是
A
{\displaystyle A}
的谱半径。事实上,可以证明
ρ
(
A
)
{\displaystyle \rho (A)}
是
A
{\displaystyle A}
的所有诱导范数的下界。
此外,我们有
lim
r
→
∞
‖
A
r
‖
1
/
r
=
ρ
(
A
)
{\displaystyle \lim _{r\rightarrow \infty }\|A^{r}\|^{1/r}=\rho (A)}
。
矩阵元范数
编辑
这些向量范数将矩阵视为
m
×
n
{\displaystyle m\times n}
向量,并使用类似的向量范数。
举例说明,使用向量的
p
{\displaystyle p}
-范数,我们得到:
‖
A
‖
p
=
(
∑
i
=
1
m
∑
j
=
1
n
|
a
i
j
|
p
)
1
/
p
{\displaystyle \Vert A\Vert _{p}={\Big (}\sum _{i=1}^{m}\sum _{j=1}^{n}|a_{ij}|^{p}{\Big )}^{1/p}\ }
注:不要把矩阵元
p
{\displaystyle p}
-范数与诱导
p
{\displaystyle p}
-范数混淆。
弗罗贝尼乌斯范数
编辑
对
p
=
2
{\displaystyle p=2}
,这称为弗罗贝尼乌斯范数(Frobenius norm)或希尔伯特-施密特范数(Hilbert–Schmidt norm),不过后面这个术语通常只用于希尔伯特空间。这个范数可用不同的方式定义:
‖
A
‖
F
=
∑
i
=
1
m
∑
j
=
1
n
|
a
i
j
|
2
=
trace
(
A
∗
A
)
=
∑
i
=
1
min
{
m
,
n
}
σ
i
2
{\displaystyle \|A\|_{F}={\sqrt {\sum _{i=1}^{m}\sum _{j=1}^{n}|a_{ij}|^{2}}}={\sqrt {\operatorname {trace} (A^{{}^{*}}A)}}={\sqrt {\sum _{i=1}^{\min\{m,\,n\}}\sigma _{i}^{2}}}}
这里
A
∗
{\displaystyle A^{*}}
表示
A
{\displaystyle A}
的共轭转置,
σ
i
{\displaystyle \sigma _{i}}
是
A
{\displaystyle A}
的奇异值,并使用了迹函数。弗罗贝尼乌斯范数与
K
n
{\displaystyle K^{n}}
上欧几里得范数非常类似,来自所有矩阵的空间上一个内积。
弗罗贝尼乌斯范数是服从乘法的且在数值线性代数中非常有用。这个范数通常比诱导范数容易计算。
极大值范数
编辑
极大值范数是
p
=
∞
{\displaystyle p=\infty }
的元素范数,
‖
A
‖
max
=
max
{
|
a
i
j
|
}
{\displaystyle \|A\|_{\max }=\max\{|a_{ij}|\}}
。这个范数不服从次可乘性(sub-multiplicative property)。
Schatten 范数
编辑
更多信息:沙滕范数
Schatten 范数出现于当
p
{\displaystyle p}
-范数应用于一个矩阵的奇异值向量时。如果奇异值记做
σ
i
{\displaystyle \sigma _{i}}
,则 Schatten
p
{\displaystyle p}
-范数定义为
‖
A
‖
p
=
(
∑
i
=
1
min
{
m
,
n
}
σ
i
p
)
1
/
p
{\displaystyle \|A\|_{p}={\Big (}\sum _{i=1}^{\min\{m,\,n\}}\sigma _{i}^{p}{\Big )}^{1/p}\ }
这个范数与诱导、元素
p
{\displaystyle p}
-范数使用了同样的记号,但它们是不同的。
所有 Schatten 范数服从乘法。它们也都是酉不变的,这就是说
‖
A
‖
=
‖
U
A
V
‖
{\displaystyle \|A\|=\|UAV\|}
对所有矩阵
A
{\displaystyle A}
与所有酉矩阵
U
{\displaystyle U}
和
V
{\displaystyle V}
。
最常见的情形是
p
=
1
,
2
,
∞
{\displaystyle p=1,2,\infty }
。
p
=
2
{\displaystyle p=2}
得出弗罗贝尼乌斯范数,前面已经介绍过了。
p
=
∞
{\displaystyle p=\infty }
得出谱范数,这是由向量
2
{\displaystyle 2}
-范数诱导的矩阵范数(见下)。最后,
p
=
1
{\displaystyle p=1}
得出迹范数(核范数),定义为
‖
A
‖
tr
=
trace
(
A
∗
A
)
=
∑
i
=
1
min
{
m
,
n
}
σ
i
{\displaystyle \|A\|_{\text{tr}}=\operatorname {trace} ({\sqrt {A^{*}A}})=\sum _{i=1}^{\min\{m,\,n\}}\sigma _{i}}
。