[Terence Tao访谈] 概述 | 10%的问题 | 制造爆炸 | 生命游戏是一个离散方程

发布于:2025-06-29 ⋅ 阅读:(17) ⋅ 点赞:(0)

参考链接:

[1]https://www.youtube.com/watch?v=HUkBz-cdB-k
[2]https://github.com/teorth/equational_theories

“ 数学是上帝用来书写宇宙的一种语言。”


陶哲轩罕见接受了一次长访谈,把他关于数学、AI、教育和人类智慧的最新认知,都对外分享了。

作为菲尔兹奖得主,陶哲轩一直被认为是当世最伟大的数学家之一,而这次在与MIT技术背景的播客大神Lex Fridman的对话,也是他近年来首次接受超3小时非学术机构访谈,内容覆盖数学前沿、AI形式化验证、科研方法论等多个硬核议题。

不仅谈论分享了数学和物理相关的专业性观点,还结合当下AI技术迅速发展的背景,作出了很多像基础教育和AI应用的大众话题思考……

陶哲轩金句频出,比如:

  • AI和菲尔兹奖的距离,只差一个研究生了。
  • 复数意义上的人类共同体将创造出最顶尖的超级智能体,比单个数学家更有可能实现数学领域的突破。
  • 数学的关键在于不仅是找到一个有效的技术路径,而是在几十种可能适用的方法中排除错误答案
  • 科学通常是三者之间的相互作用:现实世界、我们对现实世界的观察,以及我们认为世界如何运作的模型。
  • 在理解和看待世界的方式上,数学从公理出发关注模型,物理由结论驱动注重收集结果
  • 在AI的协助下,数学在未来将会有更多的实验,而不仅仅是理论。
  • 数学之美在于你可以随心所欲地改变规则,这是其它任何领域都无法做到的一点。
  • 解决困难问题就像香港动作片,逐个击破,方得大成。
  • 陶哲轩认为,AI正在重塑人类科学范式,数学和物理的终极问题上,AI将成为人类探索这些范式的重要伙伴,但无法取代人类的直觉与创造力

而关于数学,他也深入浅出地谈论了以下世界级数学难题——

  • Kakeya猜想
  • 纳维-斯托克斯正则性问题
  • 塞迈雷迪定理
  • 万物理论
  • 广义相对论
  • 庞加莱猜想
  • 孪生素数猜想
  • 克拉兹猜想
  • 黎曼假设
  • 费马大定理

这是一次高智力、高密度和高强度的三高对话,如果你也做好了“大脑尖叫”的准备,一起来看这篇访谈全文吧~


本科教育只需要解决10%的问题

Q:你遇到的第一个真正困难的研究级数学问题是什么?

陶哲轩:在本科教育中,你会学到那些真正困难的、甚至看起来是不可能解决的问题,比如黎曼假设、孪生素数猜想。但事实上这并不算什么,真正有趣的是,那些现有技术能完成大约90%的工作,而你只需要解决剩下10%的问题。

在博士期间,Kakeya问题引起了我的注意,事实上这个问题刚刚得到解决,这也是我在早期研究中投入很多的一个问题。历史上,它源于日本数学家Soji Kakeya在1918年左右提出的一个小谜题。

这个谜题是:假设你在平面上时有一根针,或者想象成在路上开车时要执行一个U型转弯,你想在尽可能小的空间内,让这根针调转方向。

但这根针的移动是无限的,所以可以把它视作一个围绕中心旋转的单位指针。这需要一个面积为π/4的圆盘。

或者你可以做一个三点掉头,实际上只需要π/8的面积。所以,它比旋转更高效。因此,一段时间内,人们认为这是调转指针方向最有效的方法。

但是Besicovitch证明了,事实上可以用任意小的面积来让这根针掉头,比如0.001。所以可以有多种花哨的来回掉头操作,来实现这一点,这样就能让针在掉头过程中穿过每一个中间方向。

这发生在二维平面上。我们理解二维中的一切,那么接下来的问题是,在三维空间中会发生什么?

假设哈勃太空望远镜是太空中的一根管子,如果你想观测宇宙中的每一颗恒星,就需要旋转望远镜以指向每一个方向。

做一个不切实际的构想:假设空间非常宝贵,虽然实际并不是如此,你需要占据尽可能小的体积来旋转你的针,也就是望远镜。那么需要多小的体积才能做到这一点?你可以试图修改基本构造,让望远镜厚度为零,这样就可以使用任意小的体积。

但问题是,如果你的望远镜不是零厚度,而是很薄的厚度delta,那么作为delta的函数,能够看到所有方向所需的最小体积会是多少?

以及随着delta变小,针变细,体积也会减小,但下降速度有多快呢?当时的猜想是它下降得非常非常慢,就像呈对数速度下降,这一点在经过大量工作后也得到了证实。

这个问题有趣的点在于,结果证明它与偏微分方程、数论、几何、拓扑学、组合学中的许多问题都有着惊人的联系。

例如,在波传播中,当你向周围泼洒一些水并溅起水波,它们会向周围各个方向传播,但波同时表现出粒子和波的行为,得到所谓的“波包”,它在空间中非常局限,并随着时间向某个方向移动。如果在空间和时间上绘制它,会显示出一个管状区域。

因此可能会出现,一个最初非常分散的波,在稍后的某个时间节点上,全部聚焦到一点。就像将一颗鹅卵石扔进池塘,涟漪会扩散开。但如果你对该场景进行时间逆转,并且要知道波动方程是时间可逆的,你就可以想象涟漪会汇聚到一个点上,然后发生巨大的飞溅,甚至可能产生奇点。

从几何学上讲,光线也是如此。如果这个波代表光,将波看作是光子的叠加,且光子都沿着光线传播,并且都最终聚焦在一点上。

因此你可以在空间和时间的某个点上,将一个非常分散的波聚焦成一个非常集中的波,但之后它又会再次散开并分离。

但如果该猜想有一个负解,那么这意味着有一种非常高效的方法,可以将指向不同方向的管子打包汇集到一个非常狭窄的小体积区域。

那么你也将能够创造出一些波,它们开始时非常分散,但它们最终不仅会集中在一个点上,在时空中也会有大量的集中点,你将创造出所谓的爆炸,波的振幅将变得相当大,以至于它们所依靠的物理定律不再是波动方程,而是更复杂和非线性的东西。

所以在数学和物理中,我们非常关心某些波动方程是否稳定,是否能够产生奇点

在波动方程中,**奇点**指的是方程解在某个点或区域出现失控状态(如能量密度无限大、速度无限大等极端情况),导致数学描述失效或物理规律无法适用的临界点

例如,当波的能量在有限时间内无限集中于一点时,方程的解就会“爆炸”形成奇点,破坏系统的稳定性。


通过改变物理规律来制造爆炸

Q:您能否谈一下纳维-斯托克斯问题?

陶哲轩:有一个著名的未解决问题,叫做纳维-斯托克斯正则性问题,即控制水等不可压缩流体的流动。

问题在于,如果你从一个平滑的水流速度场开始,它是否会集中到如此大的程度,以至于从某一点开始速度变得无穷大,而这一点就是奇点。当然现实生活中我们不会亲眼看到。

事实上,近年来人们已经达成了共识,对于某些非常特殊的初始构型,比如水,可以形成奇点,只是还未能真正证实。

在克莱基金会的七个千禧年问题中,解决其中一个问题就可获得一百万美元奖金,而这就是其中之一。当中只有庞加莱猜想已经被解决。

所以虽然Kakeya猜想与纳维-斯托克斯问题没有直接联系,但理解Kakeya猜想有助于我们理解波集中这样的问题,这可能会间接帮助我们更好地理解纳维-斯托克斯问题。

这就是数学家区别于几乎所有其他人的地方。如果某件事在99.99%的情况下成立,那么对大多数事情来说,这就足够了。但数学家会关心是否100%涵盖所有情况。大多数时候,水不会爆炸,但也许能设计一个非常特殊的初始状态让它爆炸。

克莱奖问题涉及所谓的不可压缩纳维-斯托克斯方程,它控制像水这样的流体。还有所谓的可压缩纳维-斯托克斯方程,支配像空气这样的流体。

在天气预报中就有很多流体动力学计算,需要收集大量数据以便能够初始化纳维-斯托克斯方程,甚至尽可能求解它,所以它在实际生活中非常重要。

Q:为什么证明方程的一般性结论会如此困难?

陶哲轩:举个例子就是麦克斯韦妖。麦克斯韦妖是热力学中的一个概念,假设你有一个同时装有氧气和氮气的盒子,彼此之间没有隔板阻碍,理应保持混合。

而此时也许会有一个叫做麦克斯韦妖的微观恶魔,促使每次氧气和氮气原子碰撞时,会以某种方式反弹,让氧气全都飘到一侧,而氮气流向另一侧。

这是一种统计学上的不可能构型,但在数学上经常发生。

例如圆周率π的位数 3.14159……。这些数字看似没有规律,实则从长远看,能看到和4、5、6一样多的1、2、3,理论上不应当偏向某一个数字,但也许π中也存在一个恶魔,当你计算越多位数时,它都会偏向某个数字,但我们目前的技术无法证明。

所以回到纳维-斯托克斯问题,流体具有一定的能量,并且因为流体在运动,能量会被四处传递,同时水具有粘性,如果能量分散在许多不同的位置,流体的自然粘性就会使能量衰减并趋于零。

这在我们实际用水做实验时常会发生,比如泼水时出现的湍流或波浪,最终会稳定下来,振幅越低,速度越小,就越平静。

但也许存在某种恶魔,它不断地将流体的能量推向越来越小的规模,移动速度越来越快,在更快的速度下,粘度影响较小。

因此它可能会创造一种所谓的自相似爆破场景,其中流体的能量从某个大尺度开始,都转移至流体中的一个较小区域,然后以更快的速度移动到更小的区域,依此类推。

每次花费的时间可能是前一次时间的一半,然后可以在有限时间内收敛到集中于一点上的所有能量,即有限时间爆破。

所以如果你有一个大的水漩涡,它往往会分裂成更小的漩涡,但它不会把所有的能量从一个大漩涡全部转移到某一个小漩涡,而是分散转移到三四个小漩涡,小漩涡再各自分裂成三四个更小的漩涡。能量被分散到粘性可以控制一切的程度。

但如果能以某种方式集中所有能量,并且做得足够快,以至于粘性效应没有足够的时间来平息一切,那么爆炸就会发生。

所以有些论文声称,只需要考虑能量守恒,并小心使用粘性,你就可以控制纳维-斯托克斯方程,甚至还可以控制许多类似类型的方程。

所以过去人们多次尝试获得纳维-斯托克斯的全局正则性,这与有限时间爆炸相反,速度需要保持平滑,但所有尝试都失败了,总是存在一些无法挽救的符号错误或其它错误。

所以我感兴趣的是,为什么我们无法证伪有限时间爆破。如果能平均纳维-斯托克斯运动方程,那么我就能关闭某些水的相互作用方式,只保留部分需要的。

特别是如果有一个流体,它可以将能量从一个大涡流转移到小涡流,我会关闭将能量转移到其它漩涡的通道,而只引导它进入该小漩涡,同时仍然保持能量守恒定律。

我希望通过改变物理规律来制造爆炸,这是数学家可以做到的事情。

但也存在数学障碍,所以我做的工作是,当关闭方程的某些部分,它的非线性程度会降低,也会更趋向规则,不太容易爆炸。但我也发现,通过关闭一组精心设计的相互作用,我可以迫使所有能量在有限时间内完成爆炸。

这意味着,如果想要证明纳维-斯托克斯方程的全局正则性,必须利用真实方程所具有的某些特征,而这些特征是我的人工方程所无法满足的。因此某些方法得以排除。

所以数学的关键在于,它不仅仅是找到一个有效的技术并应用它,而是你需要避开那些无效的技术。对于真正困难的问题,通常有几十种你可能认为适用的方法,但只有在积累了大量经验后,你才能意识到这些方法根本行不通。

所以为邻近问题寻找反例,就可以排除掉它,从而节约时间,不会将精力浪费在根本不可能成功的事情上。

我的技术利用的就是超临界性。在偏微分方程中,方程之间就像不同力量在拔河。而在纳维-斯托克斯方程中,有两个相互竞争的项:耗散项和传输项。如果来自粘性的耗散项占主导,那么你会得到正则性。如果传输项占主导,这将是一个不可预测的非线性情况。

但这些力在小尺度上保持平衡,但在大尺度上不平衡。纳维-斯托克斯方程就是超临界方程。在越来越小的尺度上,传输项比耗散项强得多,所以粘性使事物平静下来。

这就是为什么在二维中问题很棘手,苏联数学家Ladyshenskaya在60年代就证明了在二维中没有爆炸,纳维-斯托克斯方程在二维是临界的,即使在非常小的尺度上,传递效应和粘性效应的强度始终大致相同。

我们目前有很多技术来处理临界和次临界方程,并证明其正则性,但对于超临界方程,情况尚不清楚。我对此做了很多工作,也有很多后续研究表明,对于许多其他类型的超临界方程,你可以构造出各种各样的爆炸示例。

一旦非线性效应在小尺度上主导了线性效应,各种坏事都可能发生。所以超临界性与临界性和次临界性会造成了很大的差异。

这是一个关键的定性特征,它区分出一些好的、可预测的方程,比如某些方程可以预测数百万年或者至少数千年的行星运动。但我们无法将天气预测到未来两周以上,因为这是一个超临界方程。因此方程在精细尺度上的非线性非常有趣。

而对于解决纳维-斯托克斯方程,有一种天真的方法,就是不断推动它进入下一个尺度,试图强制让其爆炸。事实证明,这在五维或更高维度中行得通。

但在三维中,我发现了一个有趣的现象,如果你改变物理定律,总是试图将能量推入更小的尺度,能量虽然确实扩展出去了,但上一个尺度上仍然残留有部分能量。结果这使它更容易受到粘性的影响,因此这种直接推进是不可行的。

所以我需要编程一个类似于气闸的延迟,让它在能量推入下一个尺度前一直停留,直到所有能量都被传递到该尺度上,才会开启进入下一个更小尺度的闸门。这样能量就可以逐级推进,抵抗粘性的影响。

当然这需要构造一个相当复杂的非线性项,类似电子电路,利用电阻器和电容器的堆叠,创造一个门,然后利用时钟建立阈值。这类似于鲁布·戈德堡机械,却是用数学描述的,这最终奏效了。

我意识到,也许能在实际方程中完成同样的事情,例如将水的方程式想象成一种蒸汽朋克的东西。类比现代计算机由电子通过非常细小的电线,并与其他电子相互作用实现驱动。

想象水脉冲也以特定速度移动,可能存在两种不同的构型,分别对应开或关。如果让两个运动水体碰撞,它会产生新的构型,比如“与门”或“或门”,这样输出将以一种可预测的方式依赖于输入。

将它们链接起来,也许能创造一台图灵机,一台完全由水制成的计算机。接下来就可以做机器人技术,比如液压等。可以创造一些流体模拟的机器,即冯·诺依曼机。

根据冯·诺依曼移民火星的提议,仅仅光机器运送人力的成本就高得离谱。但如果能运送一台机器到火星,它可以自行开采火星材料并冶炼新机器,那么移民是可行的。

也就是建造一个流体机器,在某种寒冷状态下可以创建自身的更小版本。大的水态机器人会将所有能量转移到更小的构型,然后关机进行自我清理。然后新构型,它会启动并做相同的事情,但更小更快。

而方程具有一定的缩放对称性,可以实现不断迭代。但实际上会让纳维-斯托克斯方程创造一个爆炸。

但现在这只是一个空想,因为有太多缺失的东西使它无法成为现实,例如无法创造基本的逻辑门、没有特殊的水构型、模拟计算总是存在错误、如何关闭大机器的电源而不干扰小机器的写入等等。

它不违背任何物理定律,所以原则上一切都可以发生。当然现在也有其他小组正在追求使纳维-斯托克斯爆炸的方法,他们实际上正在追求更接近直接自相似模型的东西,可以不完全按原样工作,也可能存在有比我刚才描述的更简单的方案来实现它。


生命游戏是一个离散方程

陶哲轩:数学的关键在于,它非常擅长发现一些完全不同的问题之间的联系。

只要数学形式相同,就能建立联系。所以以前有很多关于元胞自动机的工作,其中最著名的是康威生命游戏。

存在一个无限的离散网格,在任何给定时间内,网格要么被一个细胞占据,要么是空的,并且有一个非常简单的规则,会告诉你这些细胞如何演化。所以,有时候细胞是存活的,有时候它们是死亡的。

这曾是一个非常流行的屏幕保护程序,实际上就是持续播放这些动画,它们彼此之间相当混乱,甚至有时看起来会像湍流。

但在某个时刻,人们在这个生命游戏中发现了越来越多有趣的结构,例如滑翔机。滑翔机是一个由四五个细胞组成的微小构型,它会像漩涡环一样朝着某个方向进化。

当然这是一个类比,生命游戏是一个离散方程,而纳维-斯托克斯则是一个连续方程,但在数学上它们存在相似的特征。所以随着时间的推移,可以在生命游戏中构建更多有趣的东西。

它是一个非常简单的系统。只需要大约三四个规则就可以实现。再比如有个叫滑翔机枪的东西,它除了吐出一个接一个的滑翔机之外,什么都不做。然后经过科学家的大量努力,终于设法为滑翔机构建了“与门”和“或门”。

这将是一个巨大的荒谬结构,即如果有一串滑翔机流入,另一串滑翔机也流入,那么也许将会有一串新生成的滑翔机流出。但如果只有其中一串含有滑翔机,则不会有输出。

所以一旦你可以构建这些基本门,那么仅仅通过软件工程,你就几乎可以构建任何东西,甚至一台巨大的蒸汽朋克类型的图灵机。

后来人们也确实在生命游戏中生成了可自我复制的巨大机器,一台冯·诺依曼机器,在很长一段时间内,人们认为它的内部就像滑翔机枪在完成计算,因为它会自我创建另一个可以复制的自己。

实际上,这其中很多工作都是由业余数学家们一起完成的。这也是启发我提出在纳维-斯托克斯方程中做同样事情的部分原因。

当然,模拟要比数字差得多,不能直接把生命游戏中的构造放进去。但它也再次说明,这是存在可能性的。

Lex Fridman:细胞自动机中会发生类似于流体的涌现,大规模运作的局部规则可以创造出极其复杂的动态结构。那么其中有任何部分适合进行数学分析的吗?或者是否存在工具加以解释。

陶哲轩: 问题是,只有通过非常精心准备的初始条件,才能获得这种涌现的复杂结构。对于滑翔机枪、门和自推进机器,如果只是随机放置细胞,那么将不会出现此类结构。

这与纳维-斯托克斯方程的情况类似,在典型的初始条件下,不会进行任何奇怪的计算。但通过工程或者以非常特殊的方式专门设计,就可以做出足够聪明的构造。

这在数学中是一个反复出现的挑战,可以称之为结构与随机性之间的二分法,即数学中的大多数生成对象都是随机的,只有极少数事物存在固定模式。

但现在,我们可以通过构造来证明某物存在模式,只要能够证明它确实每隔一段时间就会重复自己一次。例如,你可以证明大多数数字序列都没有模式。只要随机选取数字,就会出现大数定律,它会说明,从长远来看,你会得到和2一样多的1。

但如果给定一个特殊模式,比如π的数字,该如何证明它没有某种奇怪的模式呢?于是我花了很多时间,做的另一项工作是证明所谓的结构定理或逆定理,这些定理将会为事物何时可以变得非常结构化而提供检验。

有些函数是含有加性的,比如你有一个自然数映射函数,可以将2映射到4,3映射到6等。函数的加性意味着如果把两个输入叠加,输出也会相加,例如如果你把a+b乘以10,就等同于把a乘以10和把b乘以10然后相加。

但有些函数并不是完全可加的,例如取数n为10,乘以√2,然后取整,结果约为14点几,取整到14。n为20时则算下来取整到28。此时加性成立,10+10得20,14+14得28。

这种取整方式有时也会存在舍入误差,当把a+b相加时,函数给出的结果并不完全等于两个单独输出的和,而是和加上或减去一。所以此时它几乎是加性的但又不完全加性。

因此我在这上面做了很多工作,大致是如果一个函数表现出类似结构,那么基本上是有原因的,即附近存在一些其他函数。而它自己实际上是完全结构化的。

所以如果你能明确出逆定理,就会创造出二分法,即要么该研究对象完全没有结构,要么它们以某种方式与结构化的东西相关。

但无论是哪一种情况,你都可以取得进展。


网站公告

今日签到

点亮在社区的每一天
去签到