第78章 Krylov空间矩阵
- 塌房的我从成为高考状元开始
- 愿而安宁
- 2270字
- 2023-11-27 19:14:02
ps:(上一道题的题目稍微改了一下,改成了一道Krylov空间矩阵的问题,这样主角可以开挂用随机矩阵的方式解出,但如果是稀疏线性方程组的求解问题,以目前主角的知识储备想要令两位大佬刮目相看,恐怕有些违和感。
所以为了使这个逼装的圆润一些,还是改了题目,见谅)
以下是正文部分:
“设G是 n×8的实矩阵,其每个元素均独立地以ō(m)/n的概率满足标准正态分布,以 1−ō(m)/n的概率取零,我们想要证明 Krylov空间矩阵 K:=[G∣AG∣A²G∣......∣A^(m-1)G]的条件数在高概率下有 exp(ō(m))的上界。”
看着这道题目,萧然眉头不自觉的皱了起来,Krylov空间矩阵是一个非典型的随机矩阵,条件数是最大奇异值和最小奇异值的比例。
最大奇异值是矩阵的一种范数,可以理解为问题的数据规模,而最小奇异值可以理解为这个矩阵非退化的程度,所以这可以理解为矩阵退化的相对程度。
在这道题中,最大奇异值不难估计,难点是怎么去估计这个随机矩阵的最小奇异值。
挠了挠头,萧然逐渐被这道题吸引了全部的心神。
......
“老陆,你不是说你在家里说一不二吗?怎么嫂子一过来你就跟老鼠见了猫一样?”等到师母走远,老刘才瞥了老陆一眼,语气中充满了鄙视。
老陆闻言缓缓地吐出一口气,面色凝重:“我在家里确实是只敢说一句话,不敢再说第二句,说一不二,有什么问题吗。”
老刘:......
“不是我说啊,你这好歹是一家之主,有时候该硬气的时候还是要硬气点!”老刘恨铁不成钢地拍了拍老陆的肩膀,给他传授经验。
你又比我好到哪里去?
老陆斜着看了他一眼,慢悠悠地说道:“改天我去你家里和苏梅妹子聊一下,问问她你是如何硬气的。”
老刘放在老陆肩膀上的手突然一顿,随后若无其事地收了回来:“.......咦?萧然在看什么呢,这么入迷,半天了都不说话?”
说着埋头自顾自地朝萧然那边走去,好似那边有什么吸引他的地方。
此时的萧然已经完全入神了,草稿纸上全都是他潦草混乱的公式和想法,一时间连老刘什么时候来到他的身旁都没发现。
“咦!”
走到萧然身旁,看清他在写什么的老刘顿时扬了扬眉毛,惊咦一声,“这是在研究我和老陆争论的Krylov空间矩阵问题?”
摩挲了一下下巴,他再次诧异地看了眼埋头书写的萧然,又低头看了眼他写出来的各种行列式,“老陆,过来!”
老刘头也不抬地对着不远处的老陆招了招手。
“怎么了?”老陆走了过来,摸不着头脑。
“小声点,你学生正在研究我们刚才讨论的那道题。”
“我看看。”老陆闻言连忙探过头看了一眼,“嗯,还真是,这孩子倒真是对数学爱的纯粹,来我家里也不忘钻研数学。”
语气间对萧然一万个满意。
“还真让你捡到宝了。”老刘酸溜溜地说道,神色间说出去的羡慕。
老陆得意地摆了摆手,故作矜持道:“以我的水平估计也只能再教他两三年的时间,到那时他想要在数学上取得突破,就要靠他自己的造化了。”
“行了行了,装给谁看呢!”老刘笑骂一声,接着又低下头看了眼萧然的草稿,若有所思:“你觉得萧然能不能解出这道题?”
老陆闻言也仔细看了眼萧然列出的各种行列式,皱了皱眉头:“这道题有点怪,它的元素满足的是稀疏高斯分布,而要证明结果要满足的却是高斯分布,这意味着我们需要一个工具建立这两者之间的联系......”
“可这个工具到底该用什么,说实话,我也只有一些粗浅的想法,我想的是使用Markov不等式估计概率,这主要是利用到联合高斯分布的性质是服从联合高斯分布的两个独立向量的和,依然服从联合高斯分布,但这之后,我并不确定高斯分布替换成均匀分布或者伯努利分布之后还能否得到多项式界......”
“另外,这道题的难点主要在于如何估计这个随机矩阵的最小奇异值,而想要估计随机矩阵的最小奇异值,最主要的难点是如何突破随机矩阵理论中元素之间的独立性,如果无法解决这一步,这道题的证明也就无从谈起。”
随机矩阵理论起源于对物理模型的研究,人们在早期实验中发现,一些大型随机矩阵的特征值与奇异值的分布常常趋近于某些特定的分布,并由此提出了如半圆律、圆律与 Marchenko-Pastur律之类关于极限分布的定律。
这些定律的假设和结论类似于经典概率论里的中心极限定理(即大量相互独立的随机数之和的分布常常趋近于正态分布),这需要假设矩阵元素除了特定结构以外相互独立,再让维度趋于无穷。
尽管如此,极限毕竟是极限,从不等式估计的角度来看,用起来还是不太顺手的。
大约从上世纪 80年代末开始,人们开始研究非渐进意义下的奇异值的估计,其中最核心的部分就是对于最小奇异值的估计。
随机矩阵的发展也从一开始首先处理了独立同分布的矩阵元素服从高斯分布的情形,逐渐放松要求,开始不要求高斯分布,不要求同分布,并且得到了越来越精准的估计。
但这其中最难放松的条件依旧是独立性,这要求,一是改成要求矩阵的各行相互独立。
二是要求矩阵有额外的结构,如对称性,而除此以外相互独立。
三是要求矩阵元素之间的相关性随在矩阵中的位置的距离而指数级衰减......
“从萧然的草稿上来看,他似乎使用的是VC-维数对示性函数应用熵方法,但这对最小奇异值的要求更加严格,在这种条件下他使用熵方法恐怕不能得到有效的结果......”
“除非他能找到一个工具来估计 VC-维数并绕过熵方法......”
老陆越看,眉头皱的越紧。
抬起头,他问道:“老刘,你是从哪找到的这么个难题?”
老刘有些不好意思地笑道:“这是今年菲尔兹奖的得主在上个月的国际数学家大会上做报告时,偶然提出的一个问题,我当时对这个问题有些感兴趣,就拿了过来,准备借这个问题发一篇SCI论文。”
说着,他叹了口气,无奈道:“可是研究了半天,依旧无法解决这其中各元素之间独立性的问题,这时我才想到你,你在随机矩阵方面的研究比我深一点,想着看你有什么办法给我提供点灵感。”
“结果发现,算是白来了!”老刘说着白了老陆一眼,悠悠道:“算了,我还是自己回去研究吧。”