矩阵之方阵与行列式的关系
目录
1. 矩阵的概念及一些属性
1.1 矩阵的概念
1.2 矩阵的定义
1.3 一些矩阵类型
1.3.1 行矩阵和列矩阵
1.3.2 零矩阵(null or zero matrix)
1.3.3 方阵(square matrix)
1.3.4 对角矩阵(diagonal matrix)(方阵的特殊情况)
1.3.4 标量方阵(scalar matrix) (方阵的特殊情况)
1.3.5 单位矩阵(或恒等矩阵)(方阵的特殊情况)
1.4 线性变换
2. 行列式的既念和定义
2.1 行列式的概念
2.2 行列式的定义
3. 方阵的行列式
3.1 方阵与行列式的内在联系
3.2 方阵的行列式定义
3.3 行列式的几个结果
3.4 线性方程组的求解法
4. 理解行列式与方阵的关系
1. 矩阵的概念及一些属性
1.1 矩阵的概念
在数学中,矩阵是由数字、符号或表达式按行和列排列的矩形阵列。它是用来表示各种数学对象和关系的基本概念,尤其是在线性代数中。矩阵对于求解线性方程组、表示线性变换以及分析各个领域的数据都至关重要。一个矩阵由其维数定义,行和列的数量。
1.2 矩阵的定义
一个 mn 个(实数或复数)的集合,按照 m 行 n 列的矩形格式(二维数组或表)排列,并用方括号[]或者圆括号() 括起来,这样的矩阵阵列就称为一个 m × n 矩形(读作 m 乘 n 矩阵)。
一个 m × n 矩形表示为
,
用 表示矩阵的第行 i 第 j 列的元素,有时候也用
和
来表示矩阵 A ,即
矩阵通常用大写字母表示,比如 A, B, C, 等,而其元素通常用小写字母表示,比如,a ,b , c,等 。
1.3 一些矩阵类型
1.3.1 行矩阵和列矩阵
由单行组成的矩阵称为行矩阵或行向量,由单列组成的矩阵称为列矩阵或列向量。
1.3.2 零矩阵(null or zero matrix)
由全 0 元素组成的矩阵称为零矩阵,常用 O 表示(大写字母)。
1.3.3 方阵(square matrix)
行列数相同的矩阵称为方阵,方阵属性与行列式有关。
1.3.4 对角矩阵(diagonal matrix)(方阵的特殊情况)
仅对角线上的元素不为零的方阵称为对角阵。
1.3.4 标量方阵(scalar matrix) (方阵的特殊情况)
元素相同的对角矩阵称为标量方阵。例如
。
1.3.5 单位矩阵(或恒等矩阵)(方阵的特殊情况)
每一个对象元素都为 1 的标量方阵称为单位矩阵,又称恒等矩阵,因为其与任何同阶矩阵相乘都保持此矩阵不变。常用 表示 n × n 单位矩阵。
1.4 线性变换
矩阵可以表示线性变换,线性变换是一种映射,其保留向量加和标量乘。线性变换矩阵表示变换后的坐标系的基向量,线性变换表现为向量(或向量端点)的“跃迁”,在本质上是通过坐标系基向量的变换实现。而线性方程线的几何意义是线性变换。
2. 行列式的既念和定义
2.1 行列式的概念
行列式的概念是由日本的关孝一(Seki Takakazu)于1683年左右和欧洲的Gottfried Wilhelm Leibniz分别于1693年左右独立发展起来的。Leibniz利用行列式求解线性方程组,而Gabriel Cramer则在1750年将其公式化,提出了如今被称为Cramer法则的公式。Augustin-Louis Cauchy于1812年首次对行列式进行了全面而系统的研究,巩固了其在线性代数中的地位。
2.2 行列式的定义
行列式是由解方程引出的,反应了方程之间系数的内在关系。
一个行列式(determinants)可以看成是具有 个元素的函数, 用符号表示为
,
行列式中的元素可视为排布在一个方形块中。包含元素 的这条线称为主对角线(the principal diagonal)。
3. 方阵的行列式
3.1 方阵与行列式的内在联系
可以把矩阵乘法看作是一种变换,方阵的行列式在几何上可以看成是基在变换空间中构成的平行四边形的面积。
由于矩阵仅仅是关于(定义)域(domain)和上域(codomain)(即包含值域的那个更大的域)基的线性映射的表示,因此,矩阵是否可逆在本质上等价于从一个集合到另一个集合的函数是否可逆。而对于一个函数而言,当且仅当其是双射(既单且满)时其是可逆的(单射保证了每一个原像都被映射到不同的像,而满射保证了每一个像都有一个原像,两都合起来保证了逆映射是成立的)。碰巧的是,当你将这种双射映射转化为线性映射的线性代数时,你会得到矩阵的行列式非零,即如果逆映射存在,其对应的矩阵一定存在逆矩阵,这时其对应的行列式恰好不为零。(注:这种神奇的内在联系应该如何证明,以及是谁发现了这种内存联系尚没查到资料。)
3.2 方阵的行列式定义
一个 n × n 方阵 A 的行列式(determinant)表示为 det(A),它是一个标量,其值可按下述方式求得:
(1) 若 ,则
。
(2) 若 ,则
。
(3) 若 n > 2 ,A 的行列式可通过下述二方法之一求得:
(i) 按 i 行的行列式余子式展开式
。
(ii) 按 j 列的余子式展开式
。
其中, ,而
是通过从矩阵 A 中删除掉 i 行和 j 列后余下部分组成的矩阵的行列式。行列式
称为矩阵 A 的代数子式(minors),而
称为A 的余子式(cofactors)。det(A) 也可以表示为
。
3.3 行列式的几个结果
行列式是线性代数非常实用的理论工具。
(1) 由向量 ,
,
确定的平行六面体的体积
Volume = | det(A)| ,
其中,
。
(2) det(AB) = det(A)det(B) ,即两个方阵积的行列式等于两个方阵各自行列式之积。
(3) 对于一个 n × n 方阵 A ,当且仅当 det(A) ≠ 0 时,其具有可逆方阵。且其计算方法为
。
其中,adj(A) 表示方阵 A 的伴随(adjoint)矩阵,可通过将矩阵之行列式的每一个元素用其代数余子式替换后形成的矩阵再转置(行列互换)而求得。
(4) 对于一个 n × n 线性方程组 Ax = b ,当且仅当 det(A) ≠ 0 时,其具有唯一解。
(5) 对于一个 n × n 齐性线性方程组 Ax = 0 ,当且仅当 det(A) = 0 时,其具有无穷数量解。
3.4 线性方程组的求解法
如果一个 n × n 方阵 A 的行列式 det(A) ≠ 0 ,则可通过Cramer法则求得线性方程组 Ax = b 的唯一解。
Cramer法则:若 det(A) ≠ 0 ,则 Ax = b 的唯一解是 ,其中
表示通过当将 A 的第 k 列向量替换为 b 后得到的矩阵。
4. 理解行列式与方阵的关系
矩阵是一种简洁但通用的表示任意线性变换的方式。线性意味着和的像等于像的和。线性变换的例子有旋转、缩放和投影。它们将点,线,平面映射到点,线,平面。行列式表示线性变换的缩放比(大小表示缩放)和方向(若行列式值为负表示反方向)。矩阵的秩数表示线性变换后的空间维数,若行列式为0,则线性变换的基向量维数少于矩阵秩数,表示线性变换后的维度降低。
因此,线性变换可以用一个系数数组来表示。矩阵的大小表示域和像空间的维数。两个线性变换的合成对应于它们矩阵的乘积。线性变换的逆对应于矩阵的逆。而求矩阵的逆必须有矩阵对应的行列式不等于零,若其行列式等于零则此矩阵为奇异矩阵(singular matrix),没办法求其逆矩阵。当行列式为零时,线性变换是“奇异的”,这意味着它会损失一些维度(变换后的体积是平坦的),并且无法进行逆变换。
线性变换可以分解为纯旋转、纯(各向异性)缩放和另一个纯旋转,只有缩放会使体积变形。矩阵的每一个列向量是构成变换空间的坐标。因此,方阵的行列式在几何上度量了矩阵中列向量所构成的平行六面体(或超六面体的(hyper))体积。
例如,线性变换 在几何上可以看作将边长为1 的正方形一边拉长3倍,另一边拉长2倍而得到的矩形。
而由列向量 ,
构成的矩阵
可以看成是连接原点和两个向量构成的两边的平行四边形的面积。其行列式值为 1 ,则单位正方形其形状拉伸了,但是保持面积不变。两个向量可以看成是其坐标向量,一边长为1 ,另一边长为
。
线性变换 的列向量在同一条直线上,即其线性变换后正方形压缩为一条直线了,其面积为零,即其行列式值为 0 。