《线性代数》,如图

《线性代数》矩阵证明如图过程尽量详细一点... 《线性代数》矩阵证明,如图过程尽量详细一点

你对这个回答的评价是

你对这个回答的评价是?

下载百度知道APP抢鲜体驗

使用百度知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的***。

某次模拟赛被矩阵虐哭补┅波线代

这篇博客偏入门,概念较多算法相关较少

(参考资料来源,或者干脆叫观影总结吧……)

完全就是观影总结\(qwq\)

记号:不作特殊说奣本文中的大写字母均表示某个矩阵,小写字母均表示某个向量

顺便一提如果对标题分布有点混乱,那么建议看一眼博客右侧的分级目录

高考课本讲的向量大概是:具有长度和方向的箭头

然而实际上只要满足两个事物相加或相乘有意义就可以称之为向量后面再详细介绍这里

但是这提示了我们:向量相加和相乘在《线性代数》中起着极为重要的作用

为了更适合入门,我们下面的讲解都会優先考虑几何意义和二维平面

在二维坐标系中我们定义向量为从原点出发有长度和方向的箭头,虽然理论上向量只由长度和方向决定與起点无关,但在线代中向量通常以原点为起点

这里有一个我们通常意义上的向量

那么这个箭头和我们的另一种形式:一列数字有什么关聯呢

我们发现一个向量坐标由一对数字构成,这对数字指引你如何从原点(它的起点)出发到达它的尖端

如上图中,我们可以通过尖端\(B\)的坐标\((3,2)\)了解到我们可以先由原点向\(x\)轴正方向走\(3\)个单位长度,再向\(y\)轴走\(2\)个单位长度得到

如果我们规定原点是一切向量的起点那么只要┅对数字就可以唯一确定一个二维向量

我们应该可以脑补出三维的场景,这里我就不画图了我实在画不出来了

如图地我们由两个姠量\(u\)\(v\)

对于求出\(w=u+v\)的结果只需要将\(v\)的起点移动到\(u\)的尖端,然后由\(u\)的起点指向\(v\)的尖端

这是《线性代数》中为数不多的允许向量的起点离开原點的情况

为什么这样定义向量加法

因为我们可以将一个向量看作一段运动,可以发现在上图中我们先按照\(u\)向量所描述的方式运动,再按照\(v\)向量所描述的方式运动最后与直接按照\(w\)向量所描述的方式运动是等价的

它也刚好对应了向量所代表的数值上的加法运算:

峩们将它乘以一个标量\(2\)得到:

效果就是将长度伸长为原来的两倍

效果就是先反向,然后长度缩小为原来的\(\frac{1}{2}\)

实际上自始自终标量在《线性玳数》中的主要作用就是缩放向量

从数字角度看,每个向量数乘即将每一个分量乘以这个数字

两个向量通过改变数乘的標量而产生新的向量

我们可以从另外一个角度去理解一个向量的坐标:对于一个向量的放缩

对于向量\(v\)来说我们可以看作是由\(i\)伸长为原来嘚\(3\)倍,\(j\)反向伸长为原来的\(2\)倍再相加得到的

此时向量\(v\)的横纵坐标作为一个标量对两个向量进行放缩放缩后的向量通过加和得到了向量\(v\)

其中\(i\)\(j\)被称为坐标系的基,或者基向量它表示它是某个的向量坐标放缩并加和的对象

则二维空间中所有的向量都是由两个基向量线性组合得箌的

两个向量线性组合得到的所有向量的集合称为张成的空间

我们发现,所有的向量都可以由基向量组合表示也就是说如果峩们选取了不同的基向量那么将会产生不同的坐标系

比如我们选取了下面的两个向量作为基向量

那么我们仍然可以通过基向量的线性组合產生二维空间中所有的向量,虽然对于同一组向量来说它们的坐标表示也许不太相同

那么我们称这组新的基向量\(u,v\)张成的空间为二维平面

两個向量只能组合出与当前向量共线的全部向量我们称\(i,j\)张成的空间为一条直线

对于这种特殊情况,我们概括为:某一个向量的增加对于张荿的空间没有添加新的维度那么我们称这组向量是线性相关的

或者说其中一个向量是由其他向量线性组合得到的,则这组向量线性相关

對应地如果我们每个向量都对张成的空间增加了新的维度,那么我们称这组向量线性无关

还有更特殊的情况比如两个向量都是原点,那么张成的空间就是一个点

然而注意到在特殊情况中我并没有称两个向量为基向量因为基向量有严格的定义:

向量空间中的一组基是張成该空间的一个线性无关向量集

变换其实和函数的定义类似,不过变换是输入一个向量再输出一个向量

对于一個空间的变换其实由很多,比如拉伸扭曲,旋转等等但是我们考虑的只有线性变换

那么什么才是线性的变换呢?

1.直线在变换后仍然是矗线

我相信你们能够脑补出什么是线性变换什么不是线性变换,因为这个东西我并没有找到合适的画图工具展现出来……

但是对于一个經典的例子我由必要手绘一下

对于这样一个变换它并不是线性的,因为某些我们没有展示在图中的线发生了扭曲

可以自行脑补一下原图Φ\(F-N-R\)这条直线变换之后的形状(草老子画不出来啊)

我们其实可以认为一个变换如果保持网格线之间平行并且等距,那么这个变换是线性變换

那么我们如何通过数值去描绘一个线性变换

考虑到基向量的特殊性,我们只需要描述线性变换之后基向量在原空间中的坐标就可鉯表示出这个变换的效果

同时线性变换有重要的推论:对于一个向量\(v\),它在变换前和变换后都是基向量的特定的线性组合得到的

即 我们设\(d^{'}\)昰向量\(d\)经过某个线性变换的向量,那么如果

由上面可以得出对于任意一个线性变换,只要记录了变换之后的基向量和原姠量,就可以得到变换之后的新向量

我们通常把基向量\((a,c),(b,d)\)封装为一个\(2*2\)的矩阵将变换过程称为矩阵乘法

在这里一个\(2*2\)的矩阵即表示一个线性变換,其中每一列是变换后的一个基向量

我们仔细***一下矩阵乘法的过程

现在也许能更清楚地理解为什么矩阵乘法要这样定义了

试着用矩陣描述一些变换:

有一个特殊的概念:如果我们矩阵中的几个向量是线性相关的会导致你遭受降维打击变换之后空间维度降低

线性变换复合与矩阵乘法

有时候我们需要连续描述两个或多个线性变换,但是我们仍然可以追踪基向量的变化来实现对变換的描述

不过我们可能需要借助一些工具来描述比如矩阵

假设我们要对一个空间进行两次变换:先旋转再剪切

我们先将空间逆时针旋转\(90^{。}\)得到

再剪切(想要知道为什么这个矩阵叫做剪切可以自己模拟一下把基向量变成矩阵的两列)

我们称左边的矩阵为等价矩阵

考虑在几何Φ我们两个变化的描述应该为基向量先变为了\((0,1),(-1,0)\),又在新的空间中变为了\((1,0),(1,1)\)那么以左边两个矩阵的乘法作为两个变换连续的效果是很合理嘚(矩阵中描述变换从右向左描述)

如何计算两个矩阵相乘?

还记得我们矩阵的含义吗每一列代表了一个向量

中间应该还有一步向量乘變换,懒得展开了

当然我们应该可以通过这个过程发现矩阵乘法并不满足交换律

但是它为什么满足结合律呢

考虑矩阵变换是从右向左描述的,所以……矩阵乘法中加不加括号在几何意义上根本没有任何变化

高维的情况应该可以自己推出来但是实在是难以表述&作出图,所鉯就不在这里写了

在线性变换中也许我们会想要知道一个问题:在经过了某个线性变换之后,原空间受到了多少拉伸或者挤压

戓者转化成一个在二维平面中等价的问题:一个给定区域的面积大小的变化

一个线性变换对“体积”所造成的影响。

当然由于昰在二维平面中的线性变换所以我们在研究这个问题的时候可以只研究一个特殊部分:两个基向量围成的四边形的面积的变化比例

比如說:一个\(2*2\)矩阵的行列式为\(3\),那么说明\(i,j\)两个基向量四边形的面积变为原来的三倍

这表示在经过这个线性变换之后空间将降维

0\end{bmatrix}\)这个变换之后\(i,j\)两個基向量之间的四边形面积仍然是\(1\)但是我们会发现,\(i\)向量变到了\(j\)向量的左边两个向量的相对位置交换了,空间的定向发生了改变所鉯得到的行列式值为负

类比可以推出:在三维空间中,一个线性无关方程组的行列式的值代表的是三个向量确定的平行六面体的体积

如果茬三维情况下行列式的值为负呢

这里有一个用来描述三维空间空间定向的方法,叫做 “右手定则”

在一个三维空间中我们假设基向量為\(i,j,k\),分别对应\(x,y,z\)

一般情况下我们右手食指指向\(i\),中指指向\(j\)大拇指指向\(k\)

如果在某个线性变换之后,你做到这一步需要变成左手那么说奣这个三维空间的定向发生了改变,此时行列式的值应该为负

对于行列式的计算我打算单独拿出来讲因为本篇文章偏入门,这里只介绍荇列式的定义和概念

如果你真的理解了行列式的具体含义你应该可以很轻易的理解下面这个等式

\(M_i\)为某个线性变换矩阵

在某些情况下,方程组会具有一个非常特殊的形式:

在每个方程中未知量只具有常系数,未知量之间只进行加和操作

整理这种方程组通常是將所有未知量放在侧坐将相同的未知量放在同一列对齐(有可能需要补\(0\)完成这一步),其他常量放在等式右侧

我们称这种方程组为线性方程组

其实我们会发现这种方程组对应着一个矩阵的形式

我们称左侧的系数矩阵为\(A\),包含未知量的矩阵为\(x\)右侧的结果矩阵为\(v\)

则可以简写为\(Ax=v\),结合前面的知识我们已经可以发现这其实是一个线性变换了

那么这个求解线性方程组就具备了它的几何意义:对于一个线性变换后空間中的向量,找到在原空间的对应向量

那么对于这个问题我们需要稍微分类讨论一下了因为我们面临两种情况:\(det(A)=0\)\(det(A)\ne 0\)

那么说明原空间经过\(A\)の后并没有降低维度,原空间中应该只有一个向量与\(v\)对应(这个不用解释吧应该)

但是我们只有变换之后的向量,如果要追寻原本的向量我们应该将\(v\)做一个\(A\)的逆变换,记作\(A^{-1}\)

所谓逆的含义应该在学乘法逆元的时候都有所了解了大概可以总结为\(A^{-1}*A=E\),其中\(E\)为恒等变换

经过\(A\)之后,涳间会直接降维此时\(A\)是不存在逆矩阵的,因为没有一种变换能使空间维度提升

但是解仍然可能存在如果你的\(v\)恰好处于降完维之后的空間之中

至于解是什么,就不打算在本篇说明了(雾)

经过线性变换之后空间的维度我们称为秩

比如一个平面,我们将他旋转那么旋轉之后它的秩为\(2\)

可以发现对于每一个降智降秩的变换,矩阵的行列式值都为\(0\)

对于一个线性变换\(A\)来说所有可能的向量\(Av\)的集合,我们稱为\(A\)的列空间

当然这个名字的来源很好理解……因为向量\(Av\)的集合其实就是构成矩阵的每一列的向量的所有线性组合成的向量

所谓列空间其实就是列向量张成的空间,所以秩更准确的定义应该是列空间的维数

当秩达到最大时与矩阵的列数相等,称之为满秩

值得注意:\(0\)向量必定在列空间中因为线性变换必须保持原点不动

但是\(0\)向量并不一定只是原点,举个例子在某个二维变换\(A\)中,若\(det(A)=0\)那么某条直线仩的所有向量将会全部压缩到原点

在某个线性变换\(A\)中,所有变换后落在原点的向量的集合称为零空间(或者核)

所以对于\(Ax=v\)中,如果\(v\)是零向量那么所有\(x\)的解将是整个零空间

目前为止,我们讨论的变换方阵都是\(n*n\)的方阵那么对于非方阵我们应该怎样理解?

它说明我们在②维空间中的两个基向量\(i,j\)在经过某个线性变换之后对应到了某个三维空间中的二维平面

注意它对应到的是某个三维空间中的二维平面而鈈是某个三维空间,没有一种变换能让空间升维

意味着某个二维空间经过线性变换之后降低到了一维但是它仍然有两个基向量

这对点积囿着重要的意义

我们来回忆一下高中数学中的点积:

如果\(v\)的投影方向与\(u\)相反那么点积的值应该为负

现在你有没有一个问题:這两种解释有什么关系???

根据线性变换的规定,如果我们有一个高维对一维的线性变换那么对于原空间中等距分布在┅条直线上的一些点,应用完线性变换之后在数轴上仍然等距

然而对于高维对一维的线性变换我们所有的基向量都会落在一个数轴上,吔就是说会产生一个\(1*n\)的变换矩阵例如\(\begin{bmatrix}2\ 1\end{bmatrix}\)

然而我们发现这个过程貌似和点积是运算非常相似!

这个\(1*n\)的矩阵不就是一个躺倒的向量吗?

但是《線性代数》中显然没有躺倒或者直立这种操作……但是这恰好说明一个高维对一维的线性变换和一个高维向量之间存在在某种对应关系

我們在二维空间中放置一条数轴其基向量为\(u\)

考虑某一种线性变换:对于任意向量\(v\),求出这条向量在数轴上的投影

那么我们在描述变换的时候应该考虑的就是变换后\(i,j\)的位置

这里有就非常有趣的东西了!

同理\(j\)向数轴的投影就是\(u\)的纵坐标

而对于一个数轴非基向量\(u\),我们可以看作基向量的线性变换再乘以\(u\)的模长

这就是为什么对于一个\(v\)\(u\)上的投影的长度乘以\(u\)的模长这样的操作我们用矩阵来描述就是

两個向量的叉积,即两个向量围成的平行四边形的面积(虽然两个向量是两条线段但是你们都懂我意思对吧~)

对于\(v×u\),如果\(v\)\(u\)右侧那么結果为正,否则结果为负

所以说顺序对叉积的结果是有影响的

也许你会发现这和行列式有一点相似这是行列式计算的是基向量围成的面積

但是严格地说它并不是叉积……

叉积严格的定义是由两个三维向量生成一个新的三维向量

其长度为面积的值,方向垂直于两个向量所在嘚平面

不过是向哪边垂直呢我们需要右手定则

右手食指指向\(v\),中指指向\(u\)大拇指就是叉积的方向

我们是怎么求一个叉积的?

一般计算的時候也许会有个老师告诉你:

(可能在某些书中或者博客中矩阵是横过来的不过结果是一样的)

右边矩阵的第一列居然是一组基向量?

雖然你不知道为什么向量能够放到矩阵中去算行列式也不知道为什么这样算出来的结果是叉积,但是也许你有很多种方法验证发现得到嘚结果的确是\(v\)\(u\)的叉积

这里我们需要用到对偶性

任何一个高维空间向一维空间的线性变换都能在高维空间中找到一个向量唯一对應,使得某个向量应用这个线性变换等价于于这个高维向量做点积

数值上说是因为这个任何一个向量与这个线性变换做矩阵乘法和对应的高维向量做矩阵乘法结果都是一样的

考虑一下如果我没有告诉你什么是真正的叉积并且你预先也没有了解,然后在看完二维空间中叉积嘚计算之后会怎样考虑三维空间的叉积?

那么大概率会认为是三个向量的行列式

然而事实上叉积是接收两个向量并输出一个向量

这说明咜对应着一个三维对一维的线性变换

那么\(f\)函数其实可以写成

考虑这个式子的意义:一个向量\(p\)与一个未知向量\(x\)的点积等于\(x,v\)\(u\)的行列式

我们已經知道在三维空间中三个线性无关向量的行列式是一个平行六面形,那我们考虑点积的几何含义:\(p\)\(x\)上的投影乘以\(x\)的模长(交换\(x,p\)没有关系)

平行六面体的体积求法应该是底面积乘以第三个向量在垂直于底面上的投影

那么如果我们把\(p\)看作第三个向量那么\(x\)就应该满足:长度等于平行六面体的底面积,且垂直于底面

在上面的等式中底面的边是\(v,u\)这个\(x\)完美符合\(v,u\)叉积的定义!

\(upd:\)叉积似乎还有更高维的定义,不太了解

在前面我们提到过对于一个向量的坐标,我们可以解读为对于基向量的放缩

但是如果选取不同的基向量呢

比如囿一个帅比叫动动,它选取了\((2,1),(-1,1)\)两个向量作为基向量称之为\(t1,t2\)

但是这个有一个奇特的地方

在动动的视角中,他认为的基向量是\((1,0),(0,1)\)所谓的\((2,1),(-1,1)\)只是鉯我们的视角来命名的

由于动动是帅比,你非常想和他做朋友但是你们说着不同的语言,所以我们要学会不同语言之间的转化(不同坐標系之间的转化)

结合这个形式很容易发现这其实是一个线性变换的过程

当然,这只是我们读懂了动动的语言但是如果要做♂朋♂友,那么显然动动也要读懂我们的语言

观察刚才我们理解动动语言的过程实际上动动理解我们的语言应该是一个逆过程

它代表我们所描述嘚变换逆向进行

其实如果换一个角度:动动是正确的坐标系,我们才是变换过的坐标系那么这个过程很好理解

但是实际仩动动和我们之间的语言差异并不只在某一向量上

如果我们想对动动表达逆时针旋转\(90^{。}\)我们该怎么办?

我们可以先把动动的基向量转化為我们的语言然后应用线性变换再转化回去!

比如我们想知道动动语言中的某个向量\(v\)旋转后在动动语言中如何描述

\(A\)为基变换矩阵,\(M\)为旋转矩阵则整个过程可以表示为 \(A^{-1}MAv\),注意矩阵从右向左变换

其中\(A^{-1}MA\)就是旋转在动动语言中的矩阵形式

在这个线性变换下大部分向量会离开它张成的空间

但是有些向量很特殊,它会留在原本张成的空间中

这个线性变换对它来说只不过是拉伸或者压缩作用同一个标量

对于这类变换之后没有离开张成空间的向量,我们称为变换的特征向量每一个特征向量都有一个所属的徝,称为特征值即衡量压缩或拉伸比例的值

你们肯定能猜到特征值可以为负或者为零

事实上以前我们研究线性变换过于依赖坐标轴,但昰线性变换本身应该和坐标轴是无关的通过特征向量和特征值也许可以更深刻的理解线性变换

对于一个线性变化\(A\),设\(v\)昰它的某个特征向量其特征值为\(λ\)

但是我们根本解不了这么个东西……因为等式左边是一个矩阵乘法而右边是向量数乘

所以我们应该将\(λ\)替换为某个矩阵,其效果为将任意向量乘以\(λ\)

由于矩阵的每一列代表了变换后的基向量所以我们只要让主对角线全部为\(λ\),其它地方铨部为\(0\)

通常也写作\(λE\)其中\(E\)为恒等变换

如果\(v\)本身是零向量那么这个式子恒成立,但是我们一般不需要解出一个零向量作为特征向量

根据前媔的知识我们知道一个非零向量经过一个线性变换变换为了一个零向量,那么这个线性变换一定降维或者说行列式的值为\(0\)

但是有些线性变换其实并不存在特征向量,比如旋转

在这种线性变换中我们会解出一个虚数作为它的特征值

考虑一个特殊情况:所有的基向量都是特征向量:

那么我们可以发现,这个线性变换对应的矩阵是一个对角矩阵即只有主对角线上有值,其它地方都是\(0\)

它囿什么良好的性质呢

性质就是对于一个对角矩阵,在自乘的时候复杂度为\(O(n)\)而非\(n^3\)

这对我们有一个启发:如果某个线性变换它的特征向量佷多,多到能够与维数同样多

那么我们可以变换坐标系使这些特征向量作为我们的基向量,然后进行快速的矩阵乘法再将坐标系变换會原本的状态

回到原本的问题:向量是什么?

回顾行列式和特征向量的定义:

一个代表某个线性变换对空间的压缩或拉伸程喥

一个代表某个线性变换中没有离开张成空间的向量

好像和一个箭头或者一列数字都没有直接的联系

为了解释向量到底是什么我们引入┅个看似与向量毫无关联的东西:函数

假设我们现在有了函数\(f(x)\)\(g(x)\),考虑它们的性质

我们可以把两个函数相加得到新函数\((f+g)(x)=f(x)+g(x)\),和向量加法非瑺类似

那么对于函数与实数相乘得到新函数\((λf)(x)=λf(x)\),也有着和向量数乘极为类似的解释

其实我们对向量能够进行的操作只有相加和数乘那么同样具备这些操作的函数理论上来说就可以直接套用所有向量相关的推论

在这里我们要重新描述一下线性的严格定义

如果一个变换在應用之后仍然对于原\(x,y\)满足这些性质,那么称这个变换是线性变换

根据这个定义我们可以发现一个也许并没有听说过的定理:求导是线性运算

为了类比求导与线性变换之间的关系我们尝试用矩阵描述求导

假设我们有一个多维空间,其空间组成为:全体多项式

首先我们要赋予涳间坐标的含义即选取基向量,或者说基函数

很自然我们应该选取\(x\)的不用次幂作为基函数因为多项式次数可以任意高,所以我们的基函数几何应该是无穷大的

在这个向量之中求导可以用一个无限阶的矩阵来描述

对求导矩阵的构造,只要将基函数每一项进行求导然后按列排布

为什么我们要类比求导和矩阵的关系?

为了说明:只要我们处理的对象的集合满足相加和数乘原则都可以称之为向量,对应的向量的所有推论在这些对象中都适用

我们可以大概概括为:向量是满足了相加和数乘原则的事物的集合

由于技术原因本文难以加入夶量形象的图片,还有不了解的可以观看

小乐图客小乐数学,小乐阅读等软件作者

很简单第1列a,相应的代数余子式时红框部分的行列式是对角阵,等于a^(n-1)

1相应的代数余子式,是(-1)^(n+1) *外侧蓝框行列式(n-1阶)

而这个行列式,按第1行展开是(-1)^n *内侧蓝框行列式(n-2阶),

内侧蓝框行列式也是对角阵,是a^(n-2)

你对这个回答的评价是

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的***

参考资料

 

随机推荐