§1.6 模式气候系统
为了让他人明白一个事件和过程或记录一个事件和过程,可用图解的方法、数学公式的方法和文字描述的方法。对全球气候系统,我们用了文字描述的方法。对物理气候系统,我们用了图解的方法。到此为止,我们还没有用到公式的方法,即数学模型描述方法。为了有效地刻画问题和解决问题,以致让人们理解问题,往往这三种方法会同时使用。
数学模型可依据不同的视角而有不同的分类。按变量是否随时间变化,可分为静态模型和动态模型。
最简单的数学模型或模式系统就是线性回归方程
这里,y和x分别是因变量和自变量;A为斜率(常数),表示线性趋势;B为回归系数。
从上面的单变量可以扩展到多变量,设变量y与变量组x1, x2, …, xn有线性关系:
但参数b0, b1, …, bn待估。若已知y, x1, …, xn的m次观测值yi, x1i, x2i, …, xni(i=1, …, m),即可用线性最小二乘法估计参数b0, b1, …, bn。x1i, x2i, …, xni是一组自变量的观测值,其对应的计算值为
显然我们选择的参数b0, b1, …, bn应使^yi与yi尽可能一致,即(^y1, …, ^ym)与(y1, …, ym)的距离最小:
最小点的条件为
即
解此方程,可得原线性模型的最小二乘估计。
最小二乘法的矩阵表示如下,令
则
ε=(ε1, …, εm)′, ε1, …, εm为独立的残差,最小二乘的准则有
解之
当n=1时,x1i=xi,有
当模型y=f(x, θ)具有非线性结构时,θ的估计就不得不用非线性最优化技术。假定一组自变量的输入x1, …, xm,相应的输出值为y1, y2, …, ym,如果θ已知,就可以计算一组y的计算值f(x1, θ), f(x2, θ), …, f(xm, θ),它们应与y1, …, ym尽可能靠近,即下述平方和函数为最小。
这一函数的最小化可以用最优化的方法求解。
我们再回到系统动力学的框架中来。系统是有边界的,外界对系统的作用只能通过边界进行。只要仪器高度灵敏,边界上的任何参数又都是可测的,那么边界是已知的。在相应的外界作用下,系统内部通过非线性动力学和耗散两方面的作用可以出现各种各样的变化。为描述系统内部随时间的变化,人们给出了不同的描述方法。
我们先考察微观变量描述。系统总是由物质组成的,作为物质的质点总是存在运动,即在三维几何空间中具有速度u, v, w。我们假定有R个变量就可以描述这个系统了,而且对任一个变量,如速度分量u是直接地或间接地与其他R-1个变量有关,反过来就是说也只有通过这R-1个变量的共同作用才能反映u的变化。这个系统内除这R个变量外,可能还存在另外的变量,但这另外的变化与这R个变量没有丝毫的关系。这个系统如果是大气的某一部分,我们可设系统中R个变量的集为
这里,角标T表示转置,d1, d2, …, dR分别为u, v, w等。R个变量都是时间的函数。如果用一个变量代表空间上的一个方向,那么任一变量di(t)随时间的变化就表达了相对原点的瞬时距离。为直观起见,我们先考虑只有三个变量(T, P, W)的系统,则t0时刻在这个三维空间上,对应有一点S0(T, P, W),随时间t的变化就构成了这个三维空间中的一条曲线(图1.6.1)。我们称这个三维空间为相空间,这条曲线称为相空间中的轨线。现在有R(>3)个变量,于是我们抽象出存在R维相空间。在这个R维相空间中,每个时刻有,也只有一个点,这个点是时间t的函数,所有时刻的点就构成了相空间中的轨线。
这条轨线随时间的变化是唯一的。在一个时段内这条轨线表现出的,可能是周期性的,也可能是非周期性的。
所谓系统动力学的描述不能缺少三个方面:一是这个系统受外界的强迫;二是系统内部存在某种制约机制;三是要能方便地描述系统在相空间中的变化。这一系统动力学我们可以用下式描述:这里,S就是状态变量的全体;F是外界对系统的强迫源,可以是一个矩阵,也可以是时间的函数;N为控制系统内部状态变化的非线性算子,L为线性算子,D为耗散算子。
图1.6.1 三维相空间中变量的轨线
如果式(1.6.12)中不考虑(N+L+D)的作用,则有
问题变得非常简单,如S=(u, v, w)T只是一个质点的速度,则式(1.6.13)为
这就是质点运动的牛顿第二定律。
只要这个系统是由大于等于两个质点组成的外源强迫运动,这就构成了天文上的三体或多体问题,此时就不能忽略(N+L+D)的作用,也就是多体问题中就有了非线性的作用,何况我们要研究的大气和海洋或全球气候系统是一个由无穷多个质点组成的系统。
如果我们只是忽略非线性的作用,则(1.6.12)式成为
这是一个线性方程,S是时间和空间的函数,数学上已有确定的解法,是可以得到解析解(通解)的。
又如果无外源(F=0)和内部耗散(D=0),则由式(1.6.15)可得
式(1.6.16)描写的是一个孤立系统。这是大学阶段大气动力学研究的基本内容,如著名的长波公式就是从类似的公式得到的。如果在某一确定的时段里可以把S看做不随时间变化,则有
是系统中变量之间的平衡关系,即可得到
其中f为一线性关系,d1, d2, …, dR中不含di。
从以上的定性分析可见,系统的复杂性和不可解性源于式中的非线性项。
对(1.6.12)式,如果我们已经对某一系统有了完全的认识,也就是掌握了这个系统的内部动力学规律(N+L+D),外界对系统的作用又有了确定和全面的描述,对初值S0可以精确地测量到每个分子的程度,我们又有了容量无穷大和小数有效位无穷的计算机,那么理论上我们可以精确地得到任一时刻S在相空间中的位置,其中也知道了每个分子的位置。实际上这些都是做不到的。对稍为复杂一点的系统,我们对(N+L+D)不是完全认识的,外界作用F也不是完全确定和精确描述的,初值S0是不可能测量到每个分子的,计算机的有效位数也只能是有限的。因此,系统的不确定性是不可避免的。
理想的做法是,要对全球气候系统的文字描述、图解描述和模式描述都是尽善尽美的。但实际是做不到的,写出的数学模式不一定能够描述实际的系统。对大气的运动写出描述它的大气运动方程组,就形成了大气环流模式。同样,对海洋也可写出海洋环流模式。把大气和海洋之间的作用关系用数学的方法连接起来,就可形成耦合的大气-海洋模式。把海冰模式与大气模式耦合起来可以形成冰-气模式。把全球气候系统中的5大圈层模式耦合起来就形成了全球气候系统模式。这里包括生态模式、大气化学模式等等。人们正在向这个耦合目标的模式努力。
如前面给出的一个线性回归方程y=-Ax+B,这里可以令A=aΔt, a类似算子L,它的物理意义是耗散算子;B=bΔt, b类似于外强迫F。可见,有些统计模式就有动力学的意义,是动力学模式的统计描述。由于在很多情况下外源强迫F和线性与耗散算子(L+D)是时间的函数,我们以后要说明F的变化是气候吸引子变化的直接原因。因此,自回归方程预报的时间间隔不宜太长。同时这也可以解释为什么台站研制的有些长期预报统计模式用过几年后效果会变差的原因。
大家知道真实的气候系统是一个非线性动力系统,人们自然也希望除了能保证找到吸引子外,还能有效地用统计方法描写真实系统的非线性部分。人们也不可能得到那么多变量的时间序列。怎样用有限的变量序列,甚至一个变量的序列建立非线性的统计模式呢?
下面简单地介绍非线性统计模型(模式)的构造原理。非线性预测方法依赖于动力系统的历史演变,即历史观测的多时刻序列:Si, i=1,2, …, ns。按照时间延迟方法可以由此序列构造一个dG维欧氏空间,使得系统的动力学性质得到重构(李晓东,朱亚芬,2003)。从单变量时间序列Si出发,我们得到相点-dG维矢量。
式中,τ为时间延迟,dG是全局嵌入维。设相点xn, n=1,2, …, nx在一个描述了系统动力学性质的吸引子上演变,在吸引子上从相点xn到相点xn+1的演化为
由于两个相点间的映射时间增量与时间间隔τ无关,从一个相点的邻域到给定演变时间Te后的相点邻域的映射表达式:
我们只有整数时间点Te=mτ上的观测数据,其中m是整数。一般地,在相空间中从点n到n+Te的演变是一个非线性方程。引入径向基函数(RBF)来解决系统中的反问题,方程如下:
其中,φ(r)为径向基(非线性)函数,如φ(r)=-r 2 ln r; p i(x)是n d 维空间多项式的基,λi和μ i是由时间序列确定的参数。这个方程将现在和未来的时间序列的值与先前的值联系起来,并且描述了支撑它的动力系统的演化。
最后可以利用下式来预报相点:
在把局部的和全局的径向基函数方法应用到气候预报试验中,由于代用资料的序列长度有限,需要利用交叉检验来进行预报试验。利用尽可能多的相点(训练集或学习集)来建立预报方程。在试验中,可用一部分相点(学习集)来重建模式,而将余下的相点(检测集)用于预报。非线性统计模型还有其他的构造方法,主要是选择非线性函数。