3.4 计盒维数

分形盒维数是应用性最强的维数之一。盒维数定义为:

  (3-11)

式中 A——n维欧氏空间En的一个子集;

DA)——集合A的计盒维数;

δ——覆盖集合A的盒子的直径;

NδA)——覆盖集合A所需直径最大为δ的集的最少数目。

实际应用中为了计算盒维数,通常用尺度为L的盒子(盒子应广义地理解为任意的欧氏维数的盒子)去覆盖分形体,然后数出能完全覆盖住分形体的最少盒子数NL)。由不同的盒子尺度L可得到不同的盒子数NL)与其对应。最后,将这一系列的NL)、L数据做lnNLln(1/L)图,如能得到一条直线,就说明NL)与L具有如下关系:

  (3-12)

式中 D——分形体的计盒维数;

L——覆盖分形体的盒子的长度;

NL)——完全覆盖住分形体的最少盒子数。

如果lnNLln(1/L)图上只有一部分呈直线时,则此图形的自相似性只存在于直线部分的测度范围内。一般而言,实际分形只存在于有限的范围内。

利用分形盒维数法来研究污染物时间序列在各强度阈值上的标度性质,其具体方法为[32,33,34]:首先,用不同的阈值(Th)将原始空气污染序列转变为点集Tht)。图3-1所示为将原始PM2.5浓度数据在阈值Th=75μg/m3下转变为点集的过程。例如,若阈值为数据的平均值(记为1·mean),则表示原时间序列中,每个数值大于平均值的数据才能被认为是一个点。图3-1以PM2.5污染浓度序列为例,设定阈值为Th=75μg/m3,将高于75μg/m3的污染浓度序列转化为时间轴上分布的点集。然后,用一系列的特征时间尺度(L)将整个原始序列空间划分成不重复的许多个小段(即盒子)。随后统计出覆盖整个数据集所需要的盒子个数NL),即所有包含有点的盒子个数。如果表达式NL)=成立,则数据集存在标度不变性。此时,若以lg(L)为横轴,lg[NL)]为纵轴作图,所得曲线则为一直线,其斜率的负值为DB。此时得到的DB是在一定的阈值下PM2.5污染浓度的分形盒维数。因此,这种方法直接刻画了原时间序列中高污染浓度在时间上的分布特征。

图3-1 PM2.5浓度在阈值Th=75μg/m3下转变为点集的过程