矩阵本身所具有的性质依赖于元素的性质,矩阵由最初作为一种工具经过两个多世纪的发展,现在已成为独立的一门数学分支——矩阵论。而矩阵论又可分为矩阵方程论、矩阵分解论和广义逆矩阵论等矩阵的现代理论。

矩阵(Matrix)是指纵横排列的二维数据表格,最早来自于方程组的系数及常数所构成的方阵。19世纪英国数学家凯利首先提出这个概念。在物理学中,矩阵于电路学、力学、光学和量子物理中都有应用;计算机科学中,三维动画制作也需要用到矩阵。矩阵也是高等代数学中的常见工具,常见于统计分析等应用数学学科中。

矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论及实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如准对角矩阵和稀疏矩阵,有特定的快速运算算法。在量子力学、天体物理等领域,也会出现无穷维的矩阵,是矩阵的一种推广。

中文名

矩阵论

外文名

Matrix theory

矩阵定义

纵横排列的二维数据表格

提出者

英国数学家凯利首先

提出时间

19世纪

学科

数学

发展历史

矩阵是数学中的一个重要的基本概念,是代数学的一个主要研究对象,也是数学研究和应用的一个重要工具[1]。“矩阵”这个词是由西尔维斯特首先使用的,他是为了将数字的矩形阵列区别于行列式而发明了这个述语。而实际上,矩阵这个课题在诞生之前就已经发展的很好了。从行列式的大量工作中明显的表现出来,为了很多目的,不管行列式的值是否与问题有关,方阵本身都可以研究和使用,矩阵的许多基本性质也是在行列式的发展中建立起来的。在逻辑上,矩阵的概念应先于行列式的概念,然而在历史上次序正好相反。

先把矩阵作为一个独立的数学概念提出来,并首先发表了关于这个题目的一系列文章。凯莱同研究线性变换下的不变量相结合,首先引进矩阵以简化记号。1858年,他发表了关于这一课题的第一篇论文《矩阵论的研究报告》,系统地阐述了关于矩阵的理论。文中他定义了矩阵的相等、矩阵的运算法则、矩阵的转置以及矩阵的逆等一系列基本概念,指出了矩阵加法的可交换性与可结合性。另外,凯莱还给出了方阵的特征方程和特征根(特征值)以及有关矩阵的一些基本结果。凯莱出生于一个古老而有才能的英国家庭,剑桥大学三一学院大学毕业后留校讲授数学,三年后他转从律师职业,工作卓有成效,并利用业余时间研究数学,发表了大量的数学论文。

1855年,埃米特(C.Hermite,1822~1901)证明了别的数学家发现的一些矩阵类的特征根的特殊性质,如现在称为埃米特矩阵的特征根性质等。后来,克莱伯施(A.Clebsch,1831~1872)、布克海姆(A.Buchheim)等证明了对称矩阵的特征根性质。泰伯(H.Taber)引入矩阵的迹的概念并给出了一些有关的结论。在矩阵论的发展史上,弗罗伯纽斯(G.Frobenius,1849-1917)的贡献是不可磨灭的。他讨论了最小多项式问题,引进了矩阵的秩、不变因子和初等因子、正交矩阵、矩阵的相似变换、合同矩阵等概念,以合乎逻辑的形式整理了不变因子和初等因子的理论,并讨论了正交矩阵与合同矩阵的一些重要性质。1854年,约当研究了矩阵化为标准型的问题。1892年,梅茨勒(H.Metzler)引进了矩阵的超越函数概念并将其写成矩阵的幂级数的形式。傅立叶、西尔和庞加莱的著作中还讨论了无限阶矩阵问题,这主要是适用方程发展的需要而开始的。

矩阵本身所具有的性质依赖于元素的性质,矩阵由最初作为一种工具经过两个多世纪的发展,现在已成为独立的一门数学分支——矩阵论。而矩阵论又可分为矩阵方程论、矩阵分解论和广义逆矩阵论等矩阵的现代理论。矩阵的应用是多方面的,不仅在数学领域里,而且在力学、物理、科技等方面都十分广泛的应用。

基本内容

一般矩阵论会包括如下内容:

1、线性空间的相关内容,包括线性空间的定义及其性质,线性子空间;

2、内积空间的相关内容,包括欧氏空间;

3、线性变换的相关内容,包括最小多项式理论;

4、范数理论及其应用的相关内容,包括向量范数,矩阵范数以及范数的应用;

5、矩阵分析及其应用的相关内容,包括向量和矩阵极限、微分和积分、方阵级数理论、方阵级数理论的应用等;

6、矩阵分解的相关内容,包括最大秩分解和矩阵分解的应用;

7、广义逆矩阵及其应用的相关内容,包括基本定义和相关应用;

8、特征值的估计及广义特征值的相关内容,包括特征值的估计及广义特征值和应用。

用途

矩阵论的一个重要用途是解线性方程组。线性方程组中未知量的系数可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示线性变换,即是诸如f(x)4x之类的线性函数的推广。设定基底后,某个向量v可以表示为m×1的矩阵,而线性变换f可以表示为行数为m的矩阵A,使得经过变换后得到的向量f(v)可以表示成Av的形式。矩阵的特征值和特征向量可以揭示线性变换的深层特性。

物理应用

线性变换及对称线性变换及其所对应的对称,在现代物理学中有着重要的角色。例如,在量子场论中,基本粒子是由狭义相对论的洛伦兹群所表示,具体来说,即它们在旋量群下的表现。内含泡利矩阵及更通用的狄拉克矩阵的具体表示,在费米子的物理描述中,是一项不可或缺的构成部分,而费米子的表现可以用旋量来表述。描述最轻的三种夸克时,需要用到一种内含特殊酉群SU(3)的群论表示;物理学家在计算时会用一种更简便的矩阵表示,叫盖尔曼矩阵,这种矩阵也被用作SU(3)规范群,而强核力的现代描述──量子色动力学的基础正是SU(3)。还有卡比博-小林-益川矩阵(CKM矩阵):在弱相互作用中重要的基本夸克态,与指定粒子间不同质量的夸克态不一样,但两者却是成线性关系,而CKM矩阵所表达的就是这一点。

量子态的线性组合

1925年海森堡提出第一个量子力学模型时,使用了无限维矩阵来表示理论中作用在量子态上的算子。这种做法在矩阵力学中也能见到。例如密度矩阵就是用来刻画量子系统中“纯”量子态的线性组合表示的“混合”量子态。另一种矩阵是用来描述构成实验粒子物理基石的散射实验的重要工具。当粒子在加速器中发生碰撞,原本没有相互作用的粒子在高速运动中进入其它粒子的作用区,动量改变,形成一系列新的粒子。这种碰撞可以解释为结果粒子状态和入射粒子状态线性组合的标量积。其中的线性组合可以表达为一个矩阵,称为S矩阵,其中记录了所有可能的粒子间相互作用。

简正模式

矩阵在物理学中的另一类泛应用是描述线性耦合调和系统。这类系统的运动方程可以用矩阵的形式来表示,即用一个质量矩阵乘以一个广义速度来给出运动项,用力矩阵乘以位移向量来刻画相互作用。求系统的解的最优方法是将矩阵的特征向量求出(通过对角化等方式),称为系统的简正模式。这种求解方式在研究分子内部动力学模式时十分重要:系统内部由化学键结合的原子的振动可以表示成简正振动模式的叠加。描述力学振动或电路振荡时,也需要使用简正模式求解。

几何光学

在几何光学里,可以找到很多需要用到矩阵的地方。几何光学是一种忽略了光波波动性的近似理论,这理论的模型将光线视为几何射线。采用近轴近似(英语:paraxial approximation),假若光线与光轴之间的夹角很小,则透镜或反射元件对于光线的作用,可以表达为2×2矩阵与向量的乘积。这向量的两个分量是光线的几何性质(光线的斜率、光线跟光轴之间在主平面(英语:principal plane)的垂直距离)。这矩阵称为光线传输矩阵(英语:ray transfer matrix),内中元素编码了光学元件的性质。对于折射,这矩阵又细分为两种:“折射矩阵”与“平移矩阵”。折射矩阵描述光线遇到透镜的折射行为。平移矩阵描述光线从一个主平面传播到另一个主平面的平移行为。由一系列透镜或反射元件组成的光学系统,可以很简单地以对应的矩阵组合来描述其光线传播路径。

电子学

在电子学里,传统的网目分析(英语:mesh analysis)或节点分析会获得一个线性方程组,这可以以矩阵来表示与计算。