宁夏春大豆新品种(系)的多元统计评价及聚类分析研究

随着育种工作的开展,面对众多的大豆品种(系),只有了解品种(系)的特性和相互之间的关系,才能更好地为选择亲本,培育更优质品种服务。研究多个数量性状之间的关系及对受多个性状影响的群体进行分类时,日益广泛地使用聚类分析和主成分分析。聚类分析是在不同品种的各性状综合为相似距离的基础上进行的。主成分分析可以将多个相互关联的数量性状综合为少数几个主成分。通过对变量之间的相关系数矩阵内部结构的研究,找出数目较少能控制所有变量的主成分。冷建田等对全国166个参试品系、8个主要农艺性状进行聚类分析和主成分分析,表明遗传分歧的多向性与其地理分布有平行关系。李向华等对89个中国春大豆按遗传距离聚类分为6大类,最后选取了6个综合性状对品种进行综合评价。胡立成等在黑龙江大豆中选取了50个品种,对6个主要生物学性状进行聚类分析,判别大豆品种的多样性和遗传分歧的多向性。李永忠对东北春大豆区的30个主要亲本进行聚类分析,得出地理远缘和遗传差异之间并不具有必然联系。张玉革等对10个大豆品种进行聚类分析,评价了大豆的适应性及如何科学选择品种。这些研究主要是针对各地区不同区域分布的主要大豆品种,对大豆的遗传学性状进行聚类和主成分分析。本文在借鉴以往研究方法的基础上,选择本研究所近年选育的30个春大豆新品系,借助聚类分析和主成分分析的数学方法,对这些品系的类型及适应性进行评价,拟为宁夏春大豆品种更新和筛选工作提供理论依据,为作物品种的区域适应性评价提供参考方法。主成分分析中选择方差累计贡献率>85%的前k个主成分作为描述大豆品种生物学性状的主要因子;聚类分析的原始数据经标准化和中心化变换,选用欧氏距离,用Ward的离差平方和法进行多次程序运行,得出聚类分析结果。

1.材料和方法

(1)参试材料

表1 参试材料名称及编号

(2)试验设计 试验随机区组排列,重复3次,小区播种面积12.5 m2,每小区种植5行区,行长5 m,行距0.5 m,666.7 m2试验密度1.2万株。生育期间调查出苗期、开花期、成熟期、收获期及生育日数(X1),成熟时在每个小区中间连续取10株进行室内考种,考察株高(X2)、底荚高(X3)、主茎节数(X4)、有效分枝数(X5)、单株总荚数(X6)、单株有效荚数(X7)、单株无效荚数(X8)、单株粒数(X9)、每荚粒数(X10)、单株产量(X11),收获后测百粒重(X12)。

(3)田间管理 试验设在宁夏农林科学院农作物研究所试验基地,试验地土质为黄河灌淤土,前茬3年连续种植大豆,666.7 m2大豆产量200 kg以上。2010年10月30日秋翻,11月10日进行冬灌。2012年3月2日结合耙、耱,666.7 m2基施磷酸二铵5 kg、有机复合肥50 kg、尿素7.5 kg。5月1日人工小锄头开沟点播,5月23日人工间定苗,666.7 m2留苗密度1.2万株。试验地人工中耕除草4次,机械中耕除草1次。6~8月大豆生育期间灌水3次,农药防治大豆蚜虫2次、防治大豆红蜘蛛3次。9月25日人工镰刀收割、机械脱粒。

(4)数据分析 选择株高、结荚高度、主茎节数、有效分枝、单株荚数、单株粒数、每荚粒数、单株粒重、百粒重等12个生物学性状及产量指标进行主成分分析和聚类分析。主成分分析中选择方差累计贡献率>87%的前k个主成分作为描述大豆品种生物学性状的主要因子;聚类分析的原始数据经标准化和中心化变换,选用欧氏距离、Ward离差平方和法进行多次程序运行,得出聚类分析结果。试验数据用Excel 2003统计、利用DPS9,5软件进行统计分析。

2.结果与分析

(1)主成分分析 如果主成分分析中所提取的多个主成分的特征值贡献率能达到70%以上,就可以用这几个主成分对事物的属性进行概括性分析,基本可以得出影响事物性质的主要因素。试验提取前5个主成分累计贡献率可达87.02%(表2),可以概括不同大豆品系主要生物学性状的绝大部分信息。

表2 30个大豆品种生物学性状的主成分分析

从表2可知,第1主成分贡献率33.953 1%为最大,第2主成分的贡献率为22.261 6%,第3主成分的贡献率为13.958 1%,第4主成分的贡献率为10.154 5%,第5主成分的贡献率为6.694 4%。这5个主成分的特征值分别为4.074 4、2.671 4、1.675 0、1.21 85、0.803 3。第1主成分特征值最大,它所含的性状信息较多,但其贡献率33.953 1%,这是因为本研究中的12个生物学性状包含的农艺性状、产量性状,性状差异大,线性关系少,故此主成分分析得到多个主成分,且累积贡献率达到87.021 7%。各性状主成分初始因子估计值见表3。

表3显示了各性状在5个主成分中的权重系数,可以看出以下几点,

表3 初始因子估计值

第1主成分中单株单株有效荚数、总荚数、主茎节数、底荚高等系数较大,其次是株高和生育期、单株粒数的系数较大且比较接近;表明,当品种第1主成分大时,表现为植株高大,主茎节数多,单株荚数多、粒数多、单株粒重高,产量较高。第2主成分系数较大的是株高、底荚高、主茎节数、百粒重,其次系数较大的为生育期;表明,当品种第2主成分大时,则单株生育期较长,百粒重大,分枝少,产量较高。第3主成分中荚粒数、百粒重、单株产量系数大。表明荚粒数多、百粒重高、单株产量高。第4主成分有效分枝、无效荚系数高;分枝多时,无效荚多。第5主成分荚粒数、生育日数、百粒重系数大。经方差极大正交旋转得因子载荷矩阵(见表4)。

表4 因子载荷矩阵

注:因子载荷矩阵方差>0,4748 1。

由表4因子载荷矩阵可知,第一主因子主要有X6、X7、X9、X11所决定;第二主因子主要由X1、X2、X3、X4所决定;第三主因子主要由X10所决定;第四主因子主要由X12所决定;第五主因子主要由X5所决定。

(2)聚类分析 利用Excel 2003对30份大豆品种(品系)的生物学性状调查数据进行整理,得到12个农艺性状的平均值。利用DPS9.5进行聚类分析,得聚类树(见图1),人为地将30个品种分为4个类群。

从聚类树图1可以看出,归入同一类的品种彼此的遗传距离较小,不同类群之间的品种具有较大的差异。根据李向华等大豆主要生物学性状划分等级标准(见表5)进行聚类分析,将30个品系划分为4大类,并对各类别特征进行系统描述(见表6)。

图1 30个大豆品系的欧式距离聚类树

表5 大豆主要生物学性状等级划分

表6 各类群内的品种与类型

3.讨论

(1)因子分析结果表明,可以用5个主成分来概括大豆新品系的12个生物学性状。经方差最大正交旋转,使主因子的意义更为明确。通过离差平方和聚类法,把30个供试品种划分成各具一定特征的4类,说明供试的大豆品种表现出多样性和遗传分歧的多向性。

(2)经过主成分分析、聚类分析,30个春大豆新品系划分为4大类,第1类是生育期140 d的晚熟类型品系有8个;第2类是生育期136 d中晚熟类型的品系有6个;第3类是生育期127 d中熟类型的品系有12个;第4类是生育期110 d早熟类型的品系有4个。

(3)用主成分分析对大豆品系进行评价,以高产为主综合性状好的品种特点是:植株比较高大,主茎节数多、荚数多、单株总荚数多、单株粒数多、粒重大、中晚熟品种。

原文发表于《安徽农业科学》2012年第40卷,第29期,作者为赵志刚,罗瑞萍,姬月梅,连金番,郝吉兵。