基于BP神经网络的一季稻发育期预测模型

时间:2023-09-14 13:20:06 来源:网友投稿

樊 闯,赵子皓,张雪松,杨沈斌

(南京信息工程大学 应用气象学院,江苏省农业气象重点实验室,气象灾害预报预警与评估协同创新中心,江苏 南京 210044)

作物发育期预报是针对作物某一发育期的到来日期进行的一种农业气象预报。准确及时的发育期预报可以为农业生产部门适时、科学地进行田间管理、合理引种,以及开展农作物各生长发育时期的农业气象条件鉴定提供依据[1]。作物发育期预报作为一项基础且重要的农业气象预报,与农产品的产量形成和品质紧密联系,事关农业气象防灾减灾和农业可持续发展工作全局。

在土壤条件、栽培技术和作物品种的生物学特性相对稳定的情况下,作物的发育进程主要受气象要素,尤其是温度或积温的影响[2]。早在1735年,研究人员就发现,作物完成某一生育阶段的日平均气温累计值基本保持在一定范围内,并由此提出积温理论[3]。1923年,有效温度的概念提出[4]。自此,有效积温便广泛地应用于作物发育期预报、作物产量形成和作物病虫害发生发展预测等方面[5],并成为作物模型中必不可少的变量[6]。目前,积温仍处于作物发育期模拟的核心地位。例如,EPIC[7-8]、CERES-Wheat[9]、ALMANAC[10]等模型仍然主要依靠热量积累模拟作物物候发育阶段。20世纪80年代以来,我国的农业气象研究人员也总结了许多农作物发育期的经验统计预报方法,其中,积温法应用得最广泛[11-12]。在积温法的基础上,李昊宇等[13]综合气候适宜度,统筹考虑温度、土壤水分和降水对冬小麦不同发育期的影响,开展冬小麦发育期预报。

作物的发育速度与温度呈非线性关系。受制于温度影响函数的局限性,目前所总结的大部分作物发育规律仅适用于适宜温度区间的作物发育期模拟,当出现高温胁迫时,作物发育期的模拟误差较大[14-15]。机器学习模型擅于处理非线性问题,在作物物候发育模拟中效果较好[16]。BP神经网络(back propagation neural network)是机器学习模型人工神经网络算法研究中最成熟的一种,广泛用于函数拟合、模拟预测、图像识别等学科领域中。梁帆等[17]将株高、叶冠投影面积等参数输入BP神经网络模拟油菜的成熟度,准确度达95%;
张久权等[18]使用神经网络、内插法和逐步回归3种方法构建模型,预测大豆生长阶段的具体日期,结果表明,神经网络的预测准确度最高;
Elizondo等[19]将每日的最高、最低气温和光照时间等要素输入BP神经网络,预测大豆的开花时间,模拟误差小于1 d。此外,BP神经网络在害虫预测、作物需水量、蒸散量模拟等方面也都展现出较为理想的效果[20-23]。

本研究以长江中下游地区常年主栽一季稻品种为研究对象,利用多年气象数据和农业气象观测资料,基于BP神经网络建模研究方法,研究一季稻发育期的模拟预测技术,以期克服作物发育对温度非线性响应的局限,为开展农业气象防灾减灾业务、指导一季稻生产管理、提高作物模型模拟应用水平、服务乡村振兴等提供科学依据。

1.1 数据来源与处理

本文所使用的数据资料来源于我国气象站点1952—2016年共65 a的常规气象要素观测数据和对应站点一季稻的农业气象观测数据。研究区包括长江中下游一季稻主要种植区的湖北、安徽、江苏、浙江4省共30个站点。根据农业气象物候期观测数据,计算每个物候发育阶段所对应的日平均温度积温、日最高温度有效积温、日最低温度有效积温、累计降水量、累计相对湿度、累计日照时数,获得后续模型建立所需的基础数据。

1.2 BP神经网络模型

1.2.1 模型原理

BP神经网络的模型包含输入层、输出层、中间层3层结构,以及输入信号的正向传播和误差(Error)的反向传播两个过程。当完成一次模拟后,模型将误差向后传递至输入层,并改变各步骤相应的权值后重新训练模型,直到输出结果的误差在模型的预期范围之内,模型停止训练[24]。

1.2.2 模型的构建

首先,建立有效积温模型。将各站物候期资料等分为训练集与测试集,以Oryza2000作物模型采用的8 ℃作为下限温度,计算训练集各物候发育阶段内有效积温均值,作为该站一季稻完成该物候期所需要的有效积温,再计算测试集各站点各年份各物候发育阶段达到有效积温所需天数,得到测试集物候发育时间的模拟结果,以验证有效积温模型的效能。

其次,应用Matlab2018a软件建立基于BP神经网络的一季稻发育期模拟模型。输入自变量包括有效积温、累计降水量、平均相对湿度、累计日照时数,以及利用有效积温模型预测得到的物候期。在构建神经网络模型时,选取每个站点80%的年份作为训练集,每个站点剩余的20%年份作为测试集。利用式(1)[25]选取中间层节点数目。选取Sigmoid函数作为核函数,当模拟误差到达允许范围或循环达到设定次数时自动停止训练。

(1)

式(1)中:l是中间层的节点数目;
m是输入层的节点数目;
n是输出层的节点数目;
a是调节数,取值范围为1~10。

1.3 模型评价指标

采用均方根误差(RMSE)、相关系数(r)、平均绝对误差(MAE)对模拟值与实测值的符合度进行分析与评价。RMSE能反映模拟值与实测值的平均偏离程度,即总误差情况,其值越小,说明模拟效果越好;
r的取值范围为[0,1],值越大,说明模拟值与实测值的相关程度越高;
MAE能直观描述模拟值与实测值的偏差。RMSE、MAE的单位均与预测变量一致。

2.1 研究区气象条件与水稻生育期分布

基于相关数据,测算1952—2016年研究区一季稻生育期内气象要素(气温、降水量、相对湿度和日照时数)的多年均值、气候倾向率。研究区一季稻生育期内年均温为19.6~26.7 ℃,其中,湖北东南部的年均温较高;
温度变率为-0.07~0.10 ℃·a-1,大部分地区存在升温趋势;
多年降水量均值为276.1~570.7 mm,其中,湖北西部降水较多;
降水变率介于-10.36~13.03 mm·a-1,湖北中部、东部,浙江大部降水量总体下降,江苏北部降水量呈增加趋势;
相对湿度为73.2%~82.2%,年相对湿度变率为-0.76%~0.03%,大部分站点的相对湿度呈下降趋势;
日照时数为4.3~6.9 h,日照时数变率为-0.06~0.02 h·a-1,大部分站点的日照时数呈下降趋势。

1952—2016年,研究区一季稻主要物候期的空间分布特征相似,播种、抽穗、成熟时间都呈现西早东晚的总体特点,东西部地区同一物候期最大相差可达50 d以上,这一差异可能与东西部降水分配不均有关。各地一季稻的平均播种时间为5月1日,平均出苗时间为5月7日,平均移栽时间为6月9日,平均拔节时间为7月21日,平均抽穗时间为8月17日,平均成熟时间为9月24日。

2.2 一季稻发育期模拟模型

2.2.1 有效积温模型

将利用有效积温模型得到的物候出现时间的模拟值与观测值进行对比分析(表1),可以看出:研究区整体各物候期出现时间的模拟值与观测值的均方根误差稍大,但相关性较好[r值全部达到0.75以上,且均通过极显著水平(P<0.01)的检验]。具体到各物候期来说:出苗时间的MAE最小,仅为1.6 d;
但移栽时间的MAE较大,为6.4 d,不能满足农业气象业务需求。上述结果说明,利用有效积温模型模拟预测一季稻物候发育期具有可行性,但仍需改进。

表1 有效积温模型的评价结果

2.2.2 BP神经网络模型

经测算,本研究中BP神经网络的中间层节点数为20~30个。设置模型训练次数为15万次。将有效积温、有效积温模型模拟结果分为训练集与测试集,输入BP神经网络模型,建立温度模型(T模型);
将累计降水量作为自变量加入到T模型中,建立温度-降水(T-P)模型;
将相对湿度作为自变量加入到T模型中,建立温度-相对湿度(T-RH)模型;
将日照时数作为自变量加入到T模型中,建立温度-日照时数(T-S)模型。对以上4种模型训练得到的各发育期天数输出值进行反归一化,利用观测值进行验证。

将BP神经网络训练集的模型评价结果整理于表2。与有效积温模型相比,4种模型对5个发育阶段的模拟评价指标都有明显改善,相关系数(r)均在0.86以上,且全部通过极显著(P<0.01)水平的检验。与T、T-P、T-S模型相比,T-RH模型的RMSE、MAE值更小,且拟合精度最高(决定系数R2都在0.93以上,图1)。

表2 BP神经网络在训练集和测试集上的模型评价结果

a,播种-出苗;
b,出苗-移栽;
c,移栽-拔节;
d,拔节-抽穗;
e,抽穗-成熟。图2同。a, Sowing-emergence;

b, Emergence-transplanting;

c, Transplanting-jointing;

d, Jointing-heading;

e, Heading-mature. The same as in Fig.2.图1 T-RH模型在训练集上的拟合效果Fig.1 Fitting effect of T-RH model on training set

各模型在测试集上各评价指标的变化与训练集上基本一致,同样以T-RH模型的表现最好(图2)。

图2 T-RH模型在测试集上的拟合效果Fig.2 Fitting effect of T-RH model on test set

2.3 最优模型的参数优化

以T-RH模型作为选定的最优模型,继续对其参数进行优化。

2.3.1 中间层节点数的调试

将模型训练次数设置为10万次,改变模型中间层节点数为1~100个,输出模型训练集和测试集的RMSE,计算不同节点数时模型RMSE的平均值(图3)。移栽-拔节阶段,随着模型中间层节点数的增加,训练集的RMSE先迅速减小,说明随着节点数的增加,模型的学习能力逐渐增强,当中间层节点数达到10个以上后,RMSE趋于稳定;
但在测试集上,随着中间层节点数的增加,RMSE总体呈增大趋势。这说明,随着中间层节点数的增加,模型的泛化能力降低;
因此,在移栽-拔节阶段,中间层节点数不宜过多。参照式(1)计算得到,移栽-拔节阶段中间层节点数的最小值为20个。考虑到模型的学习能力和泛化能力的平衡,即以此值作为该发育阶段的最佳中间层节点数。

a、b,移栽-拔节;
c、d,拔节-抽穗;
e、f,抽穗-成熟。a、c、e,训练集;
b、d、f,测试集。图4同。a, b, Transplanting-jointing;

c, d, Jointing-heading;

e, f, Heading-mature. a, c, e, Training set;

b, d, f, Test set.The same as in Fig.4.图3 不同中间层节点数的模型评价结果Fig.3 Evaluation result of models with different number of nodes in middle layers

同理,确定拔节-抽穗、抽穗-成熟阶段的最佳中间层节点数均为30个。

2.3.2 模型训练次数的调试

在确定最佳中间层节点数后,对模型训练1万~20万次,分别输出模型训练集、测试集的RMSE,以及模型训练过程中的输出结果误差(Error)(图4,为更好地显示收敛过程,只展示部分训练次数的结果)。RMSE能在1万次训练之内迅速收敛,Error值在20次训练内迅速收敛。考虑到模型输出结果的稳定性和计算速度的平衡,最终确定移栽-拔节、拔节-抽穗、抽穗-成熟阶段模型的训练次数分别为2万、3万、3万次。

图4 不同训练次数的模型评价结果Fig.4 Evaluation result of models with different training times

2.4 最优模型的模拟分析

用经过BP神经网络参数优化后的最优模型,对一季稻发育期开展模拟。除出苗-移栽、移栽-拔节阶段有1~2个站点的MAE在2~3 d外,其他地区一季稻各发育期的MAE都小于2 d,模型预测精度完全可以满足农业气象业务不超过5 d的需求。经过参数优化后,T-RH模型的模拟效果进一步提升(表3),对一季稻各发育期预测模拟值的MAE都小于1 d。

农作物产量受关键生育期内气象灾害的影响很大[26-27]。同时,农业生产活动需要结合作物发育进行合理的安排和布局。温度作为热量的度量,是影响农作物发育期最重要的环境因子[28]。随着积温学说的发展,温度这一指标在农业生产上得到更加广泛的应用[29-30]。积温稳定性假说与发育模型的线性程度关系密切,将不稳定的线性积温模型应用在发育期预报中可能会形成较大的误差[28]。现代农业对作物发育期的精准预报提出了更高的要求。随着作物模拟技术日趋成熟,以积温为核心的作物发育期预报作为构建作物生长发育机理模型的一个重要模块,直接影响作物模型的预测精度和有效性。目前,此类模型中遇到的一个共性问题是参数较多。如CERES-rice模型[31],该模型用累积生长度日(GDD)来描述水稻发育进程,将发育期分为9个阶段,共引入4个遗传参数——基本营养生长期GDD、籽粒灌浆期GDD、光敏感期日长效应系数和最适日长。再如ORYZA水稻系列模型[32],将发育期分为4阶段,共引入6个遗传参数——基本营养生长期发育速率、光敏感期发育速率、日长敏感性效应系数、最适日长、穗期发育速率和灌浆期发育速率。Gao等[33]开发的水稻栽培计算机模拟优化决策系统(RCSODS),将发育期分为3个阶段,各阶段分别引入3个遗传参数——基本生长期系数、增温促进系数、高温抑制系数,在光敏感期还要考虑临界日长和感光系数。孟亚利等[34]研制的水稻生长模拟模型(RiceGrow),将发育期分为4个阶段,共引入5个遗传参数——温度敏感性、光周期敏感性、最适温度、基本早熟性和基本灌浆期因子。这些模型中的部分参数理论基础要求高,获取难度大,在业务应用和农技推广中受到很大限制[35]。

表3 经过参数优化的T-RH模型在测试集上的评价结果

BP神经网络的核心是信号正向传播、误差反向传播,并通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。因此,BP神经网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。在引入非线性函数作为激励函数后,深层神经网络的表达能力就能更加强大地解决线性不可分问题。本研究在已知农业作物生长发育进程与气象条件存在非线性关系的基础上,使用测试效果较好的Sigmoid激励函数。它的本质是逻辑斯谛(logistic)回归,或S型生长曲线。得益于现代计算机技术的不断进步,通过设置最大迭代次数,即可计算训练集在BP网络上的预测准确率,直到达到要求为止。

现代农业的发展过程是先进科学技术在农业领域广泛应用的过程。本研究利用1952—2016年长江中下游一季稻主要种植地区的气象观测数据,以及对应台站的一季稻物候发育期数据,基于BP神经网络开展作物发育期模拟研究。考虑到模型在实际应用中使用操作的便捷性,本研究仅在有效积温模拟基础上增加一个气象要素,构建起温度(T)模型、温度-降水(T-P)模型、温度-相对湿度(T-RH)模型和温度-日照时数(T-S)模型,并利用多种模拟评价指标筛选出最优模型(T-RH模型),所模拟的各发育阶段天数平均绝对误差不超过1 d。国内学者应用CERES模型开展发育期预测,误差在5 d左右甚至更高[36-37],即使应用基于机器学习的支持向量机方法[16],预报精度也未得到明显改善。这说明,基于BP神经网络构建的以有效积温为基础的模拟模型,能够很好地描述气象因子与一季稻发育进程的非线性关系,可以简便且准确地预报作物发育期,为作物发育期预报和机理研究提供了新方法,为未来气候变化背景下开展精细农业气象服务、促进农业可持续发展提供了技术支撑。本研究克服了传统模型参数多不便于应用或者参数少但精度不高的缺陷,具有一定的理论意义和较高的实用推广价值。

相较仅利用积温的BP神经网络模型,分别加入降水、相对湿度、日照时数要素后,模型的预测精度得到改善,其中,引入相对湿度的T-RH模型精度最高。这可能与研究区雨热同季的季风气候特点显著,且拥有水系发达的地理区位优势有关。研究区的水稻生长过程中并不缺水,在加入降水这样的离散型气象要素后,模型的模拟效果并没有明显提升。相对湿度作为连续的气象要素变量,可以直观地反映出环境水分条件对一季稻生长发育速度的影响,而且相对湿度是同温下实际水汽压和饱和水汽压的比值,水汽压与温度呈指数律变化。也许正是得益于温度与相对湿度之间的这种协同作用,引入相对湿度的T-RH模型精度提高。这一研究结果为进一步揭示气象条件与一季稻发育期的非线性关系提供了新思路。另外,水稻的光周期敏感阶段较短,而其余发育阶段对光照时间的敏感性均不够高,日照时数变化对水稻生长发育的影响远小于温度和水分,故加入日照时数后,一季稻发育期模型的模拟精度提升较少。

利用BP神经网络构建一季稻发育期预报模型时,输入神经网络的因子会影响模型的模拟精度。本研究只考虑了气象因子。实际上,一季稻的阶段发育与水稻的品种、土壤养分含量、田间管理方式等都有密切关系。但从本研究结果看,无论是对于业务应用还是科学研究来说,所建模型的模拟精度已足够高。

不同的机器学习或深度学习模型各有其优势和缺点。例如,支持向量机模型的结果可以由少数的“支持向量”来决定,而不是所有的输入数据,这样可以抓住关键的样本数据,减少过拟合现象的发生,但支持向量机模型计算较慢。本研究针对研究区多站点多年数据特征,综合考虑模型结果精度、计算速度,选择了BP神经网络模型。结果表明,BP神经网络具有可输入的数据量大、学习能力强、模型结果准确、计算相对较快等优点,但其参数调整过程复杂,如果参数调整不当,模型容易欠拟合或者过拟合,影响模拟效果。本研究利用最优模型进行参数调试,得到的参数化结果可供相关研究参考。

猜你喜欢有效积温发育期中间层有效积温与不同供氮水平夏玉米干物质和氮素积累定量化研究中国农业科学(2022年15期)2022-08-09收敛式有效积温与马铃薯植株性状变化的相关性中国马铃薯(2022年2期)2022-07-05不同发育期云南‘三台’核桃营养品质研究中国油脂(2020年8期)2020-08-12一种十七股子午胎钢丝帘线轮胎工业(2020年4期)2020-03-01设施葡萄果实发育期管理技术要点河北果树(2020年4期)2020-01-09贵州省中东部水稻有效积温对气候变化的响应四川农业科技(2019年10期)2020-01-06贵州省中东部水稻有效积温对气候变化的响应黑龙江粮食(2019年10期)2019-11-23镍基高温合金TLP扩散焊中间层材料研究进展焊接(2016年8期)2016-02-27B含量对IC10合金TLP焊接用中间层材料及接头组织的影响焊接(2016年6期)2016-02-27基于累积热量单位的甜瓜幼苗发育期模拟上海农业学报(2016年5期)2016-02-10

推荐访问:发育期 神经网络 模型

版权所有:天海范文网 2010-2024 未经授权禁止复制或建立镜像[天海范文网]所有资源完全免费共享

Powered by 天海范文网 © All Rights Reserved.。鲁ICP备10209932号