- 物理学中的数学方法:从热力学熵到香农熵
- 吴新瞻
- 5344字
- 2024-11-03 23:31:23
3.2 从经典统计热力学认识熵
3.2.1 跨进统计热力学之门
统计热力学研究极大数量的粒子(原子和分子)组成的体系(有时也称为系统),粒子的数量一般都极大,例如,一克氢气含有NA=6×1023个氢原子,NA被称为阿伏伽德罗常数。
对多粒子体系进行宏观测量而得到的参量,确定一个体系的宏观状态。考虑体系的下列宏观参量:能量E,体积V和粒子个数N,它们都可以用宏观的方法来测量。在经典统计热力学中,体系的微观状态是指体系中每个粒子的位置及动量,只要已知N个粒子在初始时刻t0的位置及动量(如果可以测出的话),根据哈密顿正则(运动)方程(与牛顿运动方程完全等价)就可以确定此后任意时刻这N个粒子的状态(位置及动量)。体系的微观状态运动规律遵从经典的牛顿力学方程,这是经典统计热力学的基础。由于粒子的数量极大,用这种方法直接计算所有粒子的微观状态当然是不现实的。
如果粒子可以在三维空间内活动,称其自由度r=3,用3个位置坐标和3个动量坐标就可以确定粒子的状态,N个粒子则需要2rN=6N个坐标,用数学的语言,N个粒子的微观状态可以用6N维空间中的一个“点”表示。在物理学中把这个6N维空间称为相空间。
统计热力学从体系的微观构成出发,推求体系的宏观性质。体系的宏观性质对应于或取决于体系特定的微观状态。由于大量粒子的状态呈现统计规律性,也就是说,体系的各种微观状态以一定的概率出现,以及所有微观状态遵从一定的概率分布出现。体系的宏观性质实际上就是体系的微观状态的统计平均值。
这里需要说明一个重要的基本概念,所谓对体系的微观状态量进行统计平均是什么意思?
第一种意思:既然体系中所有粒子出现各种微观状态遵从一定的概率分布,那么,可以把大量相似的体系归入同一个集合加以考察,这里集合(ensemble)这个词,表示物理学引进的一个概念,国内把它译为统计“系综”。它相当于概率论通称的样本总体,一个体系只是系综中的一个样本,进行统计分析时假定所有的样本(体系)都来自同一个样本总体(系综)。我们完全可以把它与概率论的概念统一起来。在统计热力学中由物理学家吉布斯于1905年首先引进统计系综的概念。
上面已经说明,N个粒子的体系其微观状态可用2rN维空间中的一个点表示,这个2rN维空间在物理学中称为系综的相空间,在概率论中称为样本总体的状态空间或简称样本空间。系综中所有体系的微观状态出现在相空间(状态空间)各个区域,遵从一定的概率分布。对大量相似的体系进行测量的结果加以统计平均,在理论上就等于根据这个概率分布求系综中体系的微观状态在相空间中的数学期望,我们称这种统计平均为系综的微观状态相空间平均,在概率论中称为总体平均或理论平均(数学期望)。
第二种意思:对系综中的任一体系,其全部粒子时时刻刻都处于连续的运动中,因此,体系在任一时刻的微观状态表示为相空间中的一个“点”,并随着时间变化在相空间中形成一条轨道,在概率论中又称为样本函数,我们可以对这条轨道各个点的微观状态求统计平均值,我们称这种统计平均为体系微观状态的时间平均。
实际上,我们在测量一个体系的宏观状态时,一般得到的都是该体系微观状态在一个(微观尺度看)很长的时间段内的统计平均值,即体系微观状态的时间平均。
一般都假定:系综的微观状态相空间平均等于一个体系微观状态的时间平均,即各态历经(ergodic)假设。
在各态历经假设下,我们可以认为体系的宏观状态等于系综的宏观状态理论值(系综的微观状态相空间平均)。但是,对一般随机过程,在理论上还没有完全解决各态历经假设(随机过程的总体平均等于样本函数的时间平均)是否成立的问题。
3.2.2 玻尔兹曼最概然(最大概率)分布与熵
统计热力学起初研究极大数量同类型粒子组成的体系,指N个原子组成的理想气体(这些气体都是以原子的形式出现的,其内部的原子的运动相互独立,且原子间没有相互作用力),或者N个彼此间近似独立的粒子(分子和原子)组成的气体(稀薄的气体合乎这个要求)。
由于可以把N个粒子视为同类型且彼此间互相独立,在描述N个粒子的微观状态时,相空间只用一个2r维空间(r是粒子位置的自由度),不必用2rN维空间。一个粒子在某一时刻的微观状态对应相空间中的一个点(包括位置坐标和动量坐标),称为一个代表点。N个粒子在相空间中用N个代表点表示。
粒子(代表点)在相空间中的实际活动范围受到体系的宏观状态约束:孤立体系的总能量E不变,以及体系处于限定的容器体积V,这两个因素限制体系中的粒子只能在相空间的特定子空间内活动,也就是体系中粒子的微观状态只能在这个特定子空间内,称为体系可到达的(微观)状态。
这里要澄清一个概念。粒子的微观状态在相空间表示为一个代表点,那么,粒子在容许子空间内可到达的微观状态数量为无穷多个。当然,实际上原子占有一个极微小的空间体积,我们近似假定为d,在体积为V的三维空间内粒子的位置就有V/d种。对粒子的动量也有相似的考虑,在体系内能为E的限制下,粒子的动量可能的状态数近似假定为E/e多种。因此,粒子在相空间中可达的微观状态数量不仅取决于V和E,还依赖设定值d与e。所幸,对于研究多粒子系统的统计特性而言,我们并不需要计算体系真正的微观状态数量。
根据所研究实际问题的特点,我们把体系粒子实际活动范围分割为许多小的体积单元,称为相格,作为相空间的一个粗粒近似,其中每个相格有相应的位置间隔、动量间隔。假定共包含M个小相格,第k个相格中有。
N个粒子在M个相格上的分布,指在第k个相格内有ak个代表点(k = 1,…,M),且。注意,分布只计及每个相格中有几个代表点,而不考虑是哪些代表点。这是因为N个粒子同类型且彼此独立,从宏观性质来说,无须对相格内的代表点加以区分。一般而言,任何时刻体系的宏观状态对应于N个粒子在M个相格上的分布。
另外,从微观构成来说,我们对体系中的每个粒子(相应地,它在相空间中的代表点)加以标记的编号,以便可以区分。于是,把N个粒子在M个相格上进行任何一种配置,在数学上即把N个互异的对象在M个位置上进行一种可能的组合,物理上又称为N个粒子在M个相格上的一种配容。
可以看出,体系在M个相格上的一种分布对应体系在M个相格上的多种配容,因为只要把分布中任意两个相格中的代表点互换一次,就产生一种新的配容,而分布并未改变。
在相空间中划分出相格,是为了分析问题而采取的一种手段,如果脱离物理的实质,据此进行无区别的纯数学推导,进行的分析可能不足为训。
物理学教科书有时把N个粒子在M个相格上的配容称为体系的微观状态,当然,它只反映体系在给定的相格划分上的微观构成,并非全面表示体系的微观状态。
对于一种配容,其一个相格可包含一个以上代表点,不是一个粒子的微观态。若多个粒子(代表点)在同一相格内,则不区分这些粒子各自的微观态(即使实际上这些粒子有各自不同的微观态)。正因为如此,N个粒子在M个相格上的一种配容,就是N个粒子在M个相格上的一种组合配置。
基本假定3-1:体系中任何一个粒子处于体系任何一个可到达状态具有相同的概率,或者说,粒子处于可到达的子相空间内各个相同“体积”的单元具有相同的概率。
对于体系在M个相格上给定的一种分布,其包含的配容(组合)数为
其各个配容出现的概率相同,均等于
这是因为任意代表点进入第k个相格的概率与相格的体积∆vk成正比(记体系的可达体积为v),等于。
因此,分布出现的概率W就为
基本假定3-2:体系的宏观平衡态是出现概率最大的宏观态。求平衡态对应的分布就变成求出现概率W最大的分布,也称为最概然分布。
在数学上这相当于在给定的宏观参量N、v、E的条件(约束)下,求出使W达到极大的分布。我们不去推导具体的公式。
考虑最典型的情况。划分的相格都有相同的体积,故任一粒子处于各个相格具有相同的概率。由于假定体系中N个粒子是独立的,因此,N个粒子在M个相格上的任一种配容都具有相同的概率。所有可能的配容(组合)共有MN种,因此,任一种配容出现的概率为
奥地利物理学家玻尔兹曼最早提出上面两个基本假定,并且分析上述最典型的情况。由于体系的一种宏观状态(N个粒子在M个相格上的一个分布)对应于非常多的微观状态(这里实际指N个粒子在M个相格上的配容),而且在一个孤立系统内,各个微观状态(配容)出现的可能性(概率)是相同的,因此,该宏观状态所对应的微观状态(配容)数Ω为
若除以全部的微观状态(配容)数MN,即得该宏观状态出现的概率。
据此,玻尔兹曼定义了体系任一种宏观状态的熵S,它与该宏观状态所对应的微观状态数量Ω(取对数)成正比关系
后来,普朗克在上述公式中引进比例系数k,将公式表示为
k称为玻尔兹曼常数,上式称为玻尔兹曼熵公式。
从式(3-38)可以看出,Ω取对数后把Ω中的常数因子变成了加或减一个常数,当计算两种宏观状态的熵差时,常数项被抵消。因此,系统的状态量熵和物体的位势一样,只能确定两个状态间的差值,或者预先设定某一状态下熵的基准值。正因为Ω中的常数因子可以不计,我们才可以把相空间划分成相格进行分析。选定比例系数k,则确定了熵的单位。
与香农信息熵相对照,可看出玻尔兹曼熵公式给出的熵等于概率为的均匀分布的信息熵(加负号)。物理学中把Ω称为热力学概率。
对应微观状态数Ω越大的宏观状态,其出现的概率也越大,玻尔兹曼熵也越大。气体分子的自由移动朝着概率最大的宏观状态发展,也就是朝着熵最大的宏观状态发展,直至达到并处于熵最大的状态,称为平衡状态,孤立系统中的自然过程总是沿着概率增大(熵增大)的方向进行,这种发展趋势被称为最大熵原理。
对应于微观状态数最多的宏观状态,即分布为的宏观状态,就是孤立系统的平衡状态,此时系统的熵达到极大值:
3.2.3 理想气体的自由膨胀及其熵变例子
玻尔兹曼熵和克劳修斯熵有何关系呢?
以理想气体的自由膨胀过程为例,分别计算克劳修斯熵与玻尔兹曼熵,它们的结果相同,这初步说明玻尔兹曼熵和克劳修斯熵的一致性。
问题3-1:考虑一个与外界绝热的真空密闭容器,此容器被一阀门分隔为左、右体积相等的两部分,最初把n摩尔理想气体放置在容器的左边,然后打开阀门,让气体可以自由地进入整个容器,直至达到平衡状态。问气体从初始状态到达终止状态产生的熵变为多少?
解:
首先计算克劳修斯熵。
更详尽地分析理想气体的自由膨胀过程。设密闭容器左边的体积为vi,开始时左边装入理想气体,压强为pi,而右边是真空。将阀门打开后,左边的气体迅速扩散进入右边容器。在达到平衡状态以前的任意时刻,各处的压强都不一致,显然气体不可能处于平衡,因而整个过程是非准静态过程(不可逆过程)。我们无法应用平衡状态的气体方程来描述气体变化中间的状态。
整个容器的气体达到平衡状态后,气体的体积为,压强为pf。由于气体进入右边的真空,它没有对外做功,外界也没有对气体做功;与外界没有热量交换,气体的内能保持不变,初始温度与最终温度没变。
为了确定理想气体自由膨胀从初始状态到达终止状态时产生的熵变,我们设计一个理想气体的可逆等温膨胀过程,它具有与上述理想气体的自由膨胀相同的初始状态和终止状态。通过这个可逆过程,计算从初始状态到终止状态产生的熵变。
利用我们对理想气体的可逆等温膨胀过程已经得到的结果,从初始状态到终止状态,气体熵的改变量为
式中,n为容器中所含气体的摩尔数,R为标准摩尔气体常量。
其次计算玻尔兹曼熵。
根据题设,已知容器中气体的摩尔数为n,故容器中气体的分子数量N=nNA,其中NA为阿伏伽德罗常数。另外,玻尔兹曼常数。气体分子可以到达容器内的空间,包括左、右相等的两半。
气体分子的微观状态包含每个分子的位置与动量,由于分子的动量与分子的位置彼此独立,而气体的总动能没有改变,我们仅考虑分子的位置就可以了。针对实际问题的需要,把相空间分为体积相同的左右两个相格。若N个分子中有n1个在左边,n2个在右边,。这表示N个分子在2个相格上的分布,记作,它对应气体的一种宏观状态。
对这种最简单的情况,我们不妨用概率论的语言加以描述。
对N个分子在容器左右两边出现的一种数量配置(只记录分子数,不区分分子种类),在概率论中称为一个“事件”(上面所称的一种分布),包括左边容器有0个、1个、2个……,直至N个气体分子,共有N+1个不同的事件。
如果对N个分子在容器左右两边出现的配置不仅从数量上区分,还区分是哪些分子,就进一步把所有不同(包括数量和分子构成)的配置区分为不同的“基本事件”(前面所称的配容,又称为微观状态)。可以看出,一个事件对应一些基本事件的组合。
可以认为每个气体分子可以在容器内自由地游动,出现在容器左右两边都相互独立且概率相等,因而假定所有基本事件(配容)出现的概率相同。
从组合分析可知,与宏观状态[分布]对应的所有基本事件(对应的配容)的数量Ω,等于从N个不同个体中任取n1个的组合数,即
这种宏观状态的玻尔兹曼熵为
气体一开始完全处在容器的左边,其宏观状态为(N,0),微观状态数量,初始熵S0=0。自由膨胀后最终达到内部平衡的均匀状态,容器左右两边的气体均等,其宏观状态可表示为,可以验证这是Ω的极大值。这种宏观状态的玻尔兹曼熵为
在上式中代入渐近等式,从而,当N充分大时,充分近似地成立
故
可以看到,气体自由膨胀最终达到平衡后,波尔兹曼熵与克劳修斯熵的计算结果一致。气体在向平衡状态转变的中间过程,克劳修斯熵没有定义,而波尔兹曼熵在非平衡状态下仍然有定义。