线性代数什么意思怎么得到这一步

签箌排名:今日本吧第个签到

本吧因你更精彩,明天继续来努力!

成为超级会员使用一键签到

成为超级会员,赠送8张补签卡

点击日历上漏签日期即可进行补签

超级会员单次开通12个月以上赠送连续签到卡3张

该楼层疑似违规已被系统折叠 

跪求最后一步两个矩阵相除是怎麼得到这个矩阵的



该楼层疑似违规已被系统折叠 

矩阵没有除法,这个不叫相除这是一个数乘以矩阵


扫二维码下载贴吧客户端

     代数K-理论在很大程度可以视为线性代数什么意思的二次推广第一次推广是矩阵元素或者说是系数可以是交换环乃至更一般的非交换环,即所谓的高等线性代数什么意思第二次推广是通过对角线嵌入正向极限的方法把矩阵群推至无穷维,通过无穷维矩阵群的若干特征来刻画原先的环

    约定:R是含单位元1嘚环,但不要求交换记R*=GL(1,R)是其单位群一般R-模均指左R-模。

    我们先从K_0群开始设R是含单位元1的环,它是K_0群就是有限生成投射R-模范畴P(R)上的Grothendieck群具体定义为K_0(R)=F/R,其中F是P(R)上同构类的自由Abel群R则表示由[P+Q]-[P]-[Q]生成的子群(这里关于环与模等代数结构的加号表示直和,下同)

    一般而言,对任何有限生成投射R-模P总能够找到R-模Q,使得对某个自然数nP+Q=R^n. 这个定义的本质就是从R^n中把多余的Q减掉。对此我们有一个一般叫做群完备化的模式:设S是含单位元的交换半群,其群完备化是定义为(xy)∈S×S的等价类,其等价关系为:

    这里的定义要求投射模“囿限生成”因为对无限生成的投射模P,我们总能找到投射模Q使得P+Q=Q,这样得到P的等价类平凡最后的K_0群永远都也平凡的。

(R)对任何n≥1.

我们从最简单的域(或更一般的除环)k开始计算,其上的(投射)模形如k^n这样K_0群就是由指数n决定的,群完备化之后即有K_0(k)=Z更进一步若R是(可能非交换的)局部环,依然有K_0(R)=Z这个同构可以通过R→R/m诱导。

通过这样思路我们还可以得到半局部环的情形。若R是半局部環则S=R/J(R)是半单的,因此是若干除环D_i(1≤i≤n)的矩阵环的积这里n为R的极大理想数。由K-群的Morita性质可得K_0(S)=Z^n,因此由K-群的函子性K_0(R)=Z^kk≤n.

     R是PID的情形与之类似,由PID上有限生成模的结构定理我们可得R上的有限生成投射模都是自由模,因此就有K_0(R)=Z. 作为此情形的一个推论我們有下面的Quillen-Suslin定理:系数为域的多项式环上的有限生成投射模是自由模。

    这里的关键就是把有限生成投射模转化为自由模先定义R是PF环,若R嘚任何有限生成投射左R-模都是自由模此外,还隐藏了一个IBN性质即R^n=R^m→n=m,它保证了自由模的秩是唯一的若R∈IBN∩PF,则K_0(R)=Z.

    对PF环我们还可鉯进一步分成两步:R是PSF环,若R的任何有限生成投射左R-模均为稳定自由模;R是SSF环若R的任何有限生成稳定自由左R-模都是自由模,这样一来峩们有PF=PSF∩SFF,其中对K_0群有贡献的只是PSF最后得到的结论是:R∈IBN∩PSF iff

若R是Dedekind整环,则K_0(R)=Z+Cl(R)其中Cl(R)是R的理想类群。这个主要Dedekind整环的理想性质決定的在Dedekind整环内,对任何两个分式理想I与J作为R-模有I+J=R+IJ,因此R的任何秩为k的投射R-模均可表示为R^(k-1)+I的形式R的K_0群同构恰由R^(k-1)+I→(k,[I])给出

    这里嘚类群是代数数论中的概念,它使得K_0群可以出现挠元这里只介绍一个最简单的例子R=Z [√?5],其类群是由J=(21+√-5)给出的二阶挠群,因此K_0(R)= Z+Z/2.

对于交换环R我们还可以定义:

这样得到的特殊K_1群与K_1群有如下关系:

    对K_1群的计算,在交换的条件下是比较好的对一般的交换环,设R是茭换环则行列式det:GL(n,R)→R*可扩张为满射GL(R)→R*由此给出可裂满射K_1(R)→R*.

    接下来我们自然会想,上述可裂满射在什么时候是同构的峩们从最简单的域k开始,设F是任何域则有K_1(F)=F*. 这个结论只要通过矩阵的对角化就可以得到,是一个典型的线性代数什么意思技巧此时還可以看出同构实际上是由行列式算子det诱导的。沿着这个思路我们可以得到对(交换的)欧式环R,K_1(R)=R*.

其中SK_1(R)是挠群这是因为对任哬R的极大理想R/P是有限域,因此存在k使得a^k≡1 mod b.

    对非交换的情形,先看最简单的除环若R是除环,由包含R*→GL(R)可诱导出满射R*ab→K_1(R). 主要可以通过行初等变换把GL(n,R)变为diag[a1,…1],注意到K_1(R)是Abel的因此可以通过因子化得到此满射。

    接下来的情况会出现一些微妙的变化主偠问题是此时的矩阵没有良好的行列式概念。比如对{1i,jk}生成的四元数代数,有对角矩阵的乘积:diag(ii) diag(j,j) = diag(kk),但对应的行列式却是不成立的解决这个问题的办法就是Abel化,考虑所谓的Dieudonne行列式

    仔细观察,我们会发现这些性质实际上就是各初等矩阵e_ij(a)i≠j所具囿的,其中x_ij(a)表示对角线为1第(i,j)项为a其余元素为零的矩阵。因此可定义自然满射φ_n:St_n(R)→E_n(R),x_ij(a)→e_ij(a)通过自然包含,我们定义R上的Steinberg群St(R)=lim

此外G有万有中心扩张 iff G是完全的。

    可以证明St(R)与St_n(R),n≥3是完全的;St(R)与St_n(R)n≥5无不可裂中心扩张。因此上面的扩张(*)就是E(R)的万有中心扩张,我们有

    对K_2群我们主要处理的是交换环上的Steinberg符号。设R是交换环可构造对K_1(R)⊙ _(K_0(R)) K_1(R),设α,β∈E(R)交换定义积α★β = [π(α),π(β)],这样定义的乘积满足下列条件:

space)离散拓扑群G的分类空间BG,可以视为Eilenberg-MacLane空间K(G1),即满足基本群为G高阶同伦群平凡的道路连通空间。这样的分类作用B实际上是群与同态范畴到拓扑空间(或CW复形的完全子范畴)与连续映射同伦类的函子

    接下来是Quillen的加法结构,其中需要用到一些拓扑学构造这里只给出最后的结论,想了解细节的可以参考【2】与【3】設X是连通CW复形,N≤π_1(X)是完全正规子群则存在空间X+与连续映射i:X→X+,满足条件:

     对任何环R将GL(R)视为带离散拓扑的拓扑群,记BGL(R)為其分类空间可以定义

这样的定义与前面的K_1,K_2群的一致的其验证如下:

其中第一个同构等号是因为BE(R)+是BGL(R)+的万有复叠空间,第二個同构等号是Hurewicz定理第三个同构是上文中K_2群的性质。

    我们还可以引导出K_3(R)的定义首先由正合列(*)得到同伦纤维化:BK_2(R)→BSt(R)+→BE(R)+,类似于K_2群可得:

可诱导出同伦意义上结合交换的直和+:BGL(R)+×BGL(R)+→BGL(A)+因此BGL(A)+构成同伦交换的H-空间。

     高阶K-理论的计算是相当困難的这里也只给出q元素有限域的结果,计算过程可以参考【4】的定理2.25:

   下面我们把代数K-理论推广到范畴上假定读者已经了解关于Abel范畴嘚初步知识。设A是Abel范畴A的全加法子范畴P称为带正合列的范畴,简称正合范畴(exact category)若它满足下列两个条件:

    (2)环R上的有限生成投射模范畴Proj R,它一般不是Abel范畴因为投射模的余核未必投射。

    (ii)[(Mγ)]=[(M,α)]+[(Mβ)],若存在正合列0→L→M→N→0使得α∈Aut(L),β∈Aut(N)γ∈Aut(M)诱导正合列的交换图(请读者自己画出)。

    G_i(R)的作用在于可以在正合范畴上模拟同调代数由此得到关于多项式环与Laurent环的G_i-群,若原先的环R是左正则的那么就可以由此来计算K_i(R),i=01. 下面我们介绍几个最基本的结论,详细证明可以参考【2】.

则有下面的代数K-理論基本定理:对任何环R与任何n∈N存在自然分裂:

    在范畴的基础上,我们还可以定义高阶代数K-理论的Q-结构首先我们要把范畴转化为拓扑涳间。设C是小范畴C的神经(nerve)NC指这样的单纯集,其单形是由C的各对象与态射组成的图X_0→X_1→…→X_n第i阶面算子通过删去X_i将其前后箭头复合嘚到,第i阶退化算子为通过id:X_i→X_i代替X_i后得到

既然有了单纯型的结构,我们就可以把神经NC视为拓扑空间也就是所谓的几何实现,于是就嘚到范畴C的分类空间BC这样的分类空间与前面拓扑群G的分类空间有这样的联系,若C是只有一个对象*的且Hom(**)=G的范畴,则BC就是BG的模型即BC昰满足π_1(BC,*)= G且所有高阶群为零的连通CW复形可以证明,范畴的等价将会导出分类空间的同伦等价

    通过一系列复杂的证明,可以得到┅个“Q=+”的定理:对任何环R有

这里的Ω是代数拓扑中的悬架,其作用是让K-群指标减1,因此就可以得到:

 因此由Q-结构定义的K-群与前面所萣义的K-群是一致的。

   最后个人来小结一下,到底什么是代数K-理论实际上,低阶代数K-理论就是通过环上附加结构来研究环本身这一点鈳以类比几何学通过流形上的向量束来研究流形。对于K_0群的情形流形上的向量束就是相当于环上的有限生成投射模,对此我们还真有Serre-Swan定悝说紧Hausdorff空间X上的向量束范畴等价于C(X)上的有限生成投射模范畴。 对于代数K_1群与K_2群需要把舞台从有限生成投射模扩展到环上的(无穷維)矩阵群,似乎就找不到直接的几何解释了

    当这样附加结构发展到一定程度,就不再只是为了研究环的性质而存在而是变成一种独竝存在的数学对象。各种高阶K-理论的建立把讨论的舞台转向代数拓扑,特别是同伦论与范畴论的领域可以说标志着代数K-理论结构的真囸独立。

    【1】佟文廷. 代数K-理论[M]. 南京大学出版社, 2005. (唯一的中文参考书主要介绍低阶代数K-理论与代数数论方面的应用)

(代数K-理论短篇讲义,兼顾拓扑K-理论与代数几何)


加载中请稍候......

编者按:AI的核心是算法扒开来看就是代数、计算数学、概率论、统计学等各种数学理论的结合。因此对于研究人工智能来说,数学基础是第一个、也是最大的门槛

商汤科技联合创始人,港中文-商汤联合实验室主任林达华教授在回顾自己的研究历程时,感触颇深作为2012年从美国麻省理工学院(MIT)计算机科学博士毕业的计算机系学生,他却不经意间深入了数学的旅程本文是林达华教授读书期间的自述文章,他分享了数学如何一步步從初级向高级发展更高级别的数学对于具体应用究竟有何好处,以深入浅出的阐述方式让我们感受到数学的迷人魅力

如下是林达华教授的自述:

为什么要深入数学的世界

作为计算机的学生,我没有任何企图要成为一个数学家我学习数学的目的,是要想爬上巨人的肩膀希望站在更高的高度,能把我自己研究的东西看得更深广一些说起来,我在刚来这个学校(MIT)的时候并没有预料到我将会有一个深叺数学的旅程。

我的导师最初希望我去做的题目是对外观(Appearance)和运动(Motion)建立一个统一的模型。这个题目在当今计算机视觉百花齐放的世界中并沒有任何特别的地方事实上,使用各种概率图模型(Graphical Model)把不同方面联合在一起的框架在近年的论文中并不少见

概率图模型是对复杂现象建模的有力工具,但是我认为它不是万能药,它并不能取代对于所研究问题的深入钻研如果统计学习包治百病,那么很多“下游”的学科也就没有存在的必要了事实上,开始的时候我也是和这个领域的很多人一样,想着去做一个概率图——我的导师指出这样的做法呮是重复一些标准的流程,并没有很大的价值

经过很长时间的反复,另外一个路径慢慢被确立下来——我们相信一个图像是通过大量“原子”的某种空间分布构成的,原子群的运动形成了动态的可视过程微观意义下的单个原子运动,和宏观意义下的整体分布的变换存茬着深刻的联系——这需要我们去发掘

在深入探索这个题目的过程中,遇到了很多很多的问题如何描述一个一般的运动过程,如何建竝一个稳定并且广泛适用的原子表达如何刻画微观运动和宏观分布变换的联系,还有很多在这个过程中,我发现了两个事情:

我原有嘚数学基础已经远远不能适应我对这些问题的深入研究

在数学中,有很多思想和工具是非常适合解决这些问题的,只是没有被很多的應用科学的研究者重视

于是,我决心开始深入数学这个浩瀚大海希望在我再次走出来的时候,我已经有了更强大的武器去面对这些问題和挑战我的游历并没有结束,我的视野相比于这个博大精深的世界依旧显得非常狭窄在这篇文章里,我希望基于我有限的认识谈┅谈在我的眼中,数学如何一步步从初级向高级发展更高级别的数学对于具体应用究竟有何好处。

集合论:现代数学的共同基础

现代数學有数不清的分支但是,它们都有一个共同的基础——集合论——因为它数学这个庞大的家族有个共同的语言。集合论中有一些最基夲的概念:集合(Set)关系(Relation),函数(Function)等价 (Quivalence),是在其它数学分支的语言中几乎必然存在的

对于这些简单概念的理解,是进一步学习别的数学的基础我相信,理工科大学生对于这些都不会陌生不过,有一个很重要的知识就不见得那么家喻户晓了——那就是“选择公理” (Axiom of Choice)这个公理的意思是“任意的一群非空集合,一定可以从每个集合中各拿出一个元素”——似乎是显然得不能再显然的命题。

这个貌似平常的公理却能演绎出一些比较奇怪的结论比如巴拿赫-塔斯基分球定理 (Banach–Tarski paradox)——“一个球,能分成五个部分对它们进行一系列刚性变换(平移旋转)后,能组合成两个一样大小的球”

正因为这些完全有悖常识的结论,导致数学界曾经在相当长时间里对于是否接受它有着激烈争論现在主流数学家对于它应该是基本接受的,因为很多数学分支的重要定理都依赖于它在我们后面要说到的学科里面,下面的定理依賴于选择公理:

实分析(测度理论):Lebesgue 不可测集的存在性

在集合论的基础上现代数学有两大家族:分析(Analysis)和代数(Algebra)。至于其它的比如几何囷概率论,在古典数学时代它们是和代数并列的,但是它们的现代版本则基本是建立在分析或者代数的基础上因此从现代意义说,它們和分析与代数并不是平行的关系

分析:在极限基础上建立的宏伟大厦

1.微积分:分析的古典时代 —— 从牛顿到柯西

先说说分析(Analysis)吧,它是從微积分(Caculus)发展起来的——这也是有些微积分教材名字叫“数学分析”的原因不过,分析的范畴远不只是这些我们在大学一年级学习的微积分只能算是对古典分析的入门。

分析研究的对象很多包括导数(Derivatives),积分(Integral)微分方程(Differential Equation),还有级数(Infinite Series)——这些基本的概念在初等的微积分裏面都有介绍。如果说有一个思想贯穿其中那就是极限——这是整个分析(不仅仅是微积分)的灵魂。

一个很多人都听说过的故事就昰牛顿(Newton)和莱布尼茨 (Leibniz)关于微积分发明权的争论。事实上在他们的时代已经有很多微积分的工具开始运用在科学和工程之中,但是微积分的基础并没有真正建立

那个长时间一直解释不清楚的“无穷小量”的幽灵,困扰了数学界一百多年的时间——这就是“第二次数学危机”

直到柯西(Cauchy)用极限的观点重新建立了微积分的基本概念,这门学科才开始有了一个比较坚实的基础直到今天,整个分析的大厦还是建立茬极限的基石之上

柯西为分析的发展提供了一种严密的语言,但是他并没有解决微积分的全部问题在19世纪的时候,分析的世界仍然有著一些挥之不去的乌云而其中最重要的一个没有解决的是“函数是否可积的问题”。

我们在现在的微积分课本中学到的那种通过“无限汾割区间取矩阵面积和的极限”的积分,是大约在1854年由黎曼(Riemann)提出的叫做黎曼积分。但是什么函数存在黎曼积分(黎曼可积)呢?

数學家们很早就证明了定义在闭区间内的连续函数是黎曼可积的。可是这样的结果并不令人满意,并不是所有函数都符合这样的条件

2.實分析:在实数理论和测度理论上建立起现代分析

在19世纪中后期,不连续函数的可积性问题一直是分析的重要课题对于定义在闭区间上嘚黎曼积分的研究发现,可积性的关键在于“不连续的点足够少”只有有限处不连续的函数是可积的,可是有很多数学家们构造出在无限处不连续的可积函数

显然,在衡量点集大小的时候有限和无限并不是一种合适的标准。

在探讨“点集大小”这个问题的过程中数學家发现实数轴——这个他们曾经以为已经充分理解的东西——有着许多他们没有想到的特性。

在极限思想的支持下实数理论在这个时候被建立起来,它的标志是对实数完备性进行刻画的几条等价的定理(确界定理区间套定理,柯西收敛定理Bolzano-Weierstrass Theorem和Heine-Borel Theorem等等)——这些定理明確表达出实数和有理数的根本区别:完备性(很不严格的说,就是对极限运算封闭)

随着对实数认识的深入,如何测量“点集大小”的問题也取得了突破勒贝格创造性地把关于集合的代数,和Outer content(就是“外测度”的一个雏形)的概念结合起来建立了测度理论(Measure Theory),并且进一步建立了以测度为基础的积分——勒贝格积分(Lebesgue Integral)在这个新的积分概念的支持下,可积性问题变得一目了然

上面说到的实数理论,测度理論和勒贝格积分构成了我们现在称为实分析 (Real Analysis)的数学分支,有些书也叫实变函数论对于应用科学来说,实分析似乎没有古典微积分那么“实用”——很难直接基于它得到什么算法而且,它要解决的某些“难题”——比如处处不连续的函数或者处处连续而处处不可微的函数——在工程师的眼中,并不现实

但是,我认为它并不是一种纯数学概念游戏,它的现实意义在于为许多现代的应用数学分支提供堅实的基础下面,我仅仅列举几条它的用处:

黎曼可积的函数空间不是完备的但是勒贝格可积的函数空间是完备的。简单的说一个黎曼可积的函数列收敛到的那个函数不一定是黎曼可积的,但是勒贝格可积的函数列必定收敛到一个勒贝格可积的函数

在泛函分析,还囿逼近理论中经常需要讨论“函数的极限”,或者“函数的级数”如果用黎曼积分的概念,这种讨论几乎不可想像我们有时看一些PaperΦ提到L^p函数空间,就是基于勒贝格积分

勒贝格积分是傅立叶变换(这东西在工程中到处都是)的基础。很多关于信号处理的初等教材鈳能绕过了勒贝格积分,直接讲点面对实用的东西而不谈它的数学基础但是,对于深层次的研究问题——特别是希望在理论中能做一些笁作——这并不是总能绕过去

在下面,我们还会看到测度理论是现代概率论的基础。

现代概率论:在现代分析基础上再生

自从柯尔莫果洛夫(Kolmogorov)在上世纪30年代把测度引入概率论以来测度理论就成为现代概率论的基础。在这里概率定义为测度,随机变量定义为可测函数條件随机变量定义为可测函数在某个函数空间的投影,均值则是可测函数对于概率测度的积分

值得注意的是,很多的现代观点开始以泛函分析的思路看待概率论的基础概念,随机变量构成了一个向量空间而带符号概率测度则构成了它的对偶空间,其中一方施加于对方僦形成均值角度虽然不一样,不过这两种方式殊途同归形成的基础是等价的。

在现代概率论的基础上许多传统的分支得到了极大丰富,最有代表性的包括鞅论(Martingale)——由研究赌博引发的理论现在主要用于金融(这里可以看出赌博和金融的理论联系,:-P)布朗运动(Brownian Motion)——连續随机过程的基础,以及在此基础上建立的随机分析(Stochastic Calculus)包括随机积分(对随机过程的路径进行积分,其中比较有代表性的叫伊藤积分(Ito Integral))囷随机微分方程。

对于连续几何运用建立概率模型以及对分布变换的研究离不开这些方面的知识

3.拓扑学:分析从实数轴推广到一般空间——现代分析的抽象基础

随着实数理论的建立,大家开始把极限和连续推广到更一般的地方的分析事实上,很多基于实数的概念和定理並不是实数特有的很多特性可以抽象出来,推广到更一般的空间里面

对于实数轴的推广,促成了点集拓扑学(Point Set Topology)的建立很多原来只存在於实数中的概念,被提取出来进行一般性的讨论。在拓扑学里面有4个C构成了它的核心:

在现代拓扑学的公理化体系中,开集和闭集是朂基本的概念一切从此引申。这两个概念是开区间和闭区间的推广它们的根本地位,并不是一开始就被认识到的经过相当长的时间,人们才认识到:开集的概念是连续性的基础而闭集对极限运算封闭——而极限正是分析的根基。

连续函数在微积分里面有个用Epsilon-Delta语言给絀的定义在拓扑学中它的定义是“开集的原像是开集的函数”。后者和前者是等价的只是用更抽象的语言进行了改写。我个人认为咜的第三个(等价)定义才从根本上揭示连续函数的本质——“连续函数是保持极限运算的函数” ——比如y是数列x1, x2, x3, … 的极限, 那么如果f是連续函数那么f(y)就是f(x1),f(x2),

连续函数的重要性,可以从别的分支学科中进行类比比如群论中,基础的运算是“乘法”对于群,最重要的映射叫“同态映射”——保持“乘法”的映射在分析中,基础运算是“极限”因此连续函数在分析中的地位,和同态映射在代数中的地位昰相当的

在拓扑学上,连通空间(Connected Space)是定义为“一个不能被***为两个不想交的非空开集的空间”比它略为窄一点,但是更通俗易懂的概念叫(Path Connected)就是空间中任意两点都存在连续路径相连。连通性有两个重要的用场:一个是用于证明一般的中值定理(Intermediate Value

Compactness似乎在初等微积分里面没有專门出现不过有几条实数上的定理和它其实是有关系的。比如“有界数列必然存在收敛子列”——用Compactness的语言来说就是——“实数空间Φ有界闭集是紧的”。它在拓扑学中的一般定义是一个听上去比较抽象的东西——“紧集的任意开覆盖存在有限子覆盖”

这个定义在讨論拓扑学的定理时很方便,它在很多时候能帮助实现从无限到有限的转换对于分析来说,用得更多的是它的另一种形式 ——“紧集中的數列必存在收敛子列”——它体现了分析中最重要的“极限”

Compactness在现代分析中运用极广,无法尽述微积分中的两个重要定理:极值定理(Extreme Value Theory),和一致收敛定理(Uniform Convergence Theorem)就可以借助它推广到一般的形式从某种意义上说,点集拓扑学可以看成是关于“极限”的一般理论它抽象于实数理論,它的概念成为几乎所有现代分析学科的通用语言也是整个现代分析的根基所在。

4.微分几何:流形上的分析

拓扑学把极限的概念推广箌一般的拓扑空间但这不是故事的结束,而仅仅是开始通过在更一般的拓扑空间和标准的欧几里得空间建立局部化的桥梁,一个现代數学中非常重要的数学分支——微分几何(Differential Geometry)建立起来了

从教学上说,微分几何的教材有两种不同的类型,一种是建立在古典微机分的基礎上的“古典微分几何”主要是关于二维和三维空间中的一些几何量的计算,比如曲率

还有一种是建立在现代拓扑学的基础上,这里姑且称为“现代微分几何”——它的核心概念就是“流形”(Manifold)流形就是一种具有局部欧氏空间特性(每一个邻域都和欧氏空间的一个开集哃胚)的特殊拓扑空间。通过局部和欧氏空间的同胚映射(Homeomorphism)我们可以在流形上建立微分运算。

现代微分几何是一门非常丰富的学科仳如一般流形上的微分的定义就比传统的微分丰富,我自己就见过三种从不同角度给出的等价定义——这一方面让事情变得更为复杂但昰另外一个方面它给了同一个概念的不同理解,往往在解决问题时会引出不同的思路除了推广微积分的概念以外,还引入了很多新概念:Tangent Space,Cotangent Space,Push Forward,Pull

曾经有一段时间流形(Manifold)在机器学习领域相当时髦但是,坦率地说要弄懂一些基本的流形算法,甚至“创造”一些流形算法并不需要哆少微分几何的基础。

对我的研究来说微分几何最重要的应用就是建立在它之上的另外一个分支:李群和李代数——这是数学中两大家族分析和代数的一个漂亮的联姻。分析和代数的另外一处重要的结合则是泛函分析以及在其基础上的调和分析。

回过头来再说说另一個大家族——代数。

如果说古典微积分是分析的入门那么现代代数的入门点则是两个部分:线性代数什么意思(Linear Algebra)和基础的抽象代数(Abstract Algebra)——国內一些教材称之为近世代数。

代数——名称上研究的似乎是数在我看来,它主要研究的是运算规则一门代数,其实都是从某种具体的運算体系中抽象出一些基本规则建立一个公理体系,然后在这基础上进行研究一个集合再加上一套运算规则,就构成一个代数结构

茬主要的代数结构中,最简单的是群(Group)——它只有一种符合结合律的可逆运算通常叫“乘法”。如果这种运算也符合交换率,那么就叫阿贝尔群 (Abelian Group)如果有两种运算,一种叫加法满足交换率和结合律,一种叫乘法满足结合律,它们之间满足分配率这种丰富一点的结构叫做环(Ring), 如果环上的乘法满足交换率就叫可交换环(Commutative Ring)。

如果一个环的加法和乘法具有了所有的良好性质,那么就成为一个域(Field)基于域,峩们可以建立一种新的结构能进行加法和数乘,就构成了线性空间(Linear Space)

代数的好处在于,它只关心运算规则的演绎而不管参与运算的对潒。它基于几条最简单的规则比如结合律,就能导出非常多的重要结论——这些结论可以应用到一切满足这些简单规则的地方——这是玳数的威力所在我们不再需要为每一个具体领域重新建立这么多的定理。

抽象代数主要有两个流派:研究有限的离散代数结构(比如有限群和有限域)这部分内容通常用于数论,编码和整数方程这些地方;另外一个流派是研究连续的代数结构,通常和拓扑与分析联系茬一起(比如拓扑群李群)。我在学习中主要聚焦于后者

1.线性代数什么意思:“线性”的基础地位

在机器学习领域,我们接触最多的莫过于线性代数什么意思——这也是我们在大学低年级就开始学习的线性代数什么意思,包括建立在它基础上的各种学科最核心的两個概念是向量空间和线性变换。线性变换在线性代数什么意思中的地位和连续函数在分析中的地位,或者同态映射在群论中的地位是一樣的——它是保持基础运算(加法和数乘)的映射

在机器学习中,我们经常需要非线性来描述复杂的现实世界但是无论什么时候,线性都是具有根本地位的没有线性的基础,就不可能存在所谓的非线性推广

我们常用的非线性化的方法包括流形和核化(Kernalization),这两者都需要茬某个阶段回归线性流形需要在每个局部建立和线性空间的映射,通过把许多局部线性空间连接起来形成非线性;而Kernerlization则是通过置换内积結构把原线性空间“非线性”地映射到另外一个线性空间再进行线性空间中所能进行的操作。

而在分析领域线性的运算更是无处不在,微分积分,傅立叶变换拉普拉斯变换,还有统计中的均值通通都是线性的。

2.泛函分析:从有限维向无限维迈进

在大学中学习的线性代数什么意思它的简单主要因为它是在有限维空间进行的,因为有限我们无须借助于太多的分析手段。但是有限维空间并不能有效地表达我们的世界。比如函数构成了线性空间,可是它是无限维的

对函数进行的最重要的运算都在无限维空间进行,比如傅立叶变換和小波分析这表明了,为了研究函数(或者说连续信号)我们需要打破有限维空间的束缚,走入无限维的函数空间——这里面的第┅步就是泛函分析。

Analysis)研究的是一般的线性空间包括有限维和无限维,但是很多东西在有限维下显得很Trivial真正的困难往往在无限维的时候出现。在泛函分析中空间中的元素还是叫向量,但是线性变换通常会叫作“算子”(Operator)除了加法和数乘,这里进一步加入了一些运算仳如加入范数去表达“向量的长度”或者“元素的距离”,这样的空间叫做“赋范线性空间”(Normed Space)再进一步的,可以加入内积运算这样的涳间叫“内积空间”(Inner Product Space)。

大家发现当进入无限维的时间时,很多老的观念不再适用了一切都需要重新审视。

(1) 所有的有限维空间都是完备嘚(柯西序列收敛)很多无限维空间却是不完备的(比如闭区间上的连续函数)。在这里完备的空间有特殊的名称:完备的赋范空间叫巴拿赫空间(Banach Space),完备的内积空间叫希尔伯特空间(Hilbert Space)

(2) 在有限维空间中,空间和它的对偶空间的是完全同构的而在无限维空间中,它们存在微妙的差别

(3) 在有限维空间中,所有线性变换(矩阵)都是有界变换而在无限维,很多算子是无界的(Unbounded)最重要的一个例子是给函数求导。

(4) 在有限维空间中一切有界闭集都是紧的,比如单位球而在所有的无限维空间中,单位球都不是紧的——也就是说可以在单位球内撒入无限个点,而不出现一个极限点

(5) 在有限维空间中,线性变换(矩阵)的谱相当于全部的特征值在无限维空间中,算子的谱的结构仳这个复杂得多除了特征值组成的点谱(Point Spectrum),还有Approximate Point Spectrum和Residual Spectrum虽然复杂,但是也更为有趣。由此形成了一个相当丰富的分支——算子谱论(Spectrum Theory)

(6) 在有限维空间中,任何一点对任何一个子空间总存在投影而在无限维空间中,这就不一定了具有这种良好特性的子空间有个专门的名称切仳雪夫空间(Chebyshev Space)。这个概念是现代逼近理论的基础(Approximation Theory)函数空间的逼近理论在Learning中应该有着非常重要的作用,但是现在看到的运用现代逼近理论的攵章并不多

3.继续往前:巴拿赫代数,调和分析李代数

基本的泛函分析继续往前走,有两个重要的方向第一个是巴拿赫代数 (Banach Algebra),它就是茬巴拿赫空间(完备的内积空间)的基础上引入乘法(这不同于数乘)

比如矩阵——它除了加法和数乘,还能做乘法——这就构成了一個巴拿赫代数

除此以外,值域完备的有界算子平方可积函数,都能构成巴拿赫代数巴拿赫代数是泛函分析的抽象,很多对于有界算孓导出的结论还有算子谱论中的许多定理,它们不仅仅对算子适用它们其实可以从一般的巴拿赫代数中得到,并且应用在算子以外的哋方

巴拿赫代数让你站在更高的高度看待泛函分析中的结论。但是它在机器学习的实际问题中能比泛函分析能多带来什么东西还有待思考。

最能把泛函分析和实际问题结合在一起的另一个重要方向是调和分析 (Harmonic Analysis)我在这里列举它的两个子领域,傅立叶分析和小波分析我想这已经能说明它的实际价值。它研究的最核心的问题就是怎么用基函数去逼近和构造一个函数它研究的是函数空间的问题,因此不可避免的必须以泛函分析为基础

除了傅立叶和小波,调和分析还研究一些很有用的函数空间比如Hardy Space,Sobolev Space这些空间有很多很好的性质,在工程中和物理学中都有很重要的应用对于计算机视觉而言,调和分析在信号的表达图像的构造,都是非常有用的工具

当分析和线性代數什么意思走在一起,产生了泛函分析和调和分析;当分析和群论走在一起我们就有了李群(Lie Group)和李代数(Lie Algebra)。它们给连续群上的元素赋予了代數结构我一直认为这是一门非常漂亮的数学:在一个体系中,拓扑、微分、和代数走到了一起

在一定条件下,通过李群和李代数的联系它让几何变换的结合变成了线性运算,让子群化为线性子空间这样就为Learning中许多重要的模型和算法的引入到对几何运动的建模创造了必要的条件。我相信李群和李代数对于计算机视觉以及其它需要对连续变换进行分析的课题都有着重要意义只不过学习它的道路可能会佷艰辛,在它之前需要学习很多别的数学

解析财经新热点,挖掘财富流行趋势请关注[新财经生活]

紧急关注:平台大整理以防失联,

各位读者朋友可以关注我的另一个公众号:

参考资料

 

随机推荐