土壤湿度是陆-气相互作用中的一个关键要素,在受到天气和气候影响的同时还会进一步反馈大气。因此,连续且准确的土壤湿度数据对陆-气相互作用研究和气候预测至关重要。然而,无论站点观测还是卫星遥感的土壤湿度均存在时-空不连续问题,特别是在逐日尺度。为解决这一问题,近日南京信息工程大学“陆-气相互作用团队”联合国家卫星气象中心、江苏省气象局、江西省气象局和浙江省气象局等多家单位开展合作,基于深度机器学习和卫星遥感技术创建了一套生成中国东部逐日时空连续土壤湿度的方法。该成果以南京信息工程大学副教授周洋为第一/通讯作者发表在国际水文学的重要期刊Journal of Hydrology(IF 6.708)上,合作者有张艳研究员、汪如良、陈海山教授、赵起帆、刘滨硕、邵清、曹璐、孙善磊教授。该成果为国家自然科学基金面上项目“中国东部土壤湿度对盛夏西太副高次季节进程的影响机理”提供了数据支撑,也为土壤湿度数据处理方法提供了一定的参考。
论文指出利用多层感知器神经网络(multi-perceptron, MLP)和卷积神经网络可以有效地对极轨卫星遥感的土壤湿度数据进行插补和订正,包括我国的风云3C、欧洲的SMOS和美国的SMAP卫星。首先,利用陆面和大气再分析资料作为MLP的输入,让MLP学习再分析资料与卫星产品之间的联系,再利用这一联系对卫星产品中的缺测值进行插补。经验证发现MLP能够利用再分析资料较好地估计出遥感的土壤湿度。其次,利用插补后的时-空连续的卫星资料作为卷积神经网络的输入,让卷积网络学习卫星数据和站点观测数据之间的联系(图1),最后完成对卫星数据的订正。订正后的土壤湿度数据在无偏差相关系数和均方根误差上具有较大的提升,说明该订正数据较卫星数据精度更高(图2),同时该数据更好地展现出与降水空间型之间的联系,而卫星数据在这方面表现较差。然而,由于使用的观测站点有限,订正后的数据在整个中国东部的平均空间分布上还存在缺陷,但是随着观测站点的增加该技术有能力生成平均空间分布合理的数据。
文章在最后对深度学习模型输入变量的敏感性进行了讨论,并且讨论了机器学习与动力和线性回归模型的差异。当输入变量改变时,动力模型中的物理定律不会改变,线性回归模型中最小二乘法则不会改变;但是,在机器学习中模型为了得到“最好”的关系,会改变输入量与目标值之间的“法则”。因此,在动力模型和线性回归中,可以“较易”地对各变量的相对重要性进行探讨。而在机器学习中,类似研究是困难且复杂的,同时随着机器学习技术的更新换代,机器学习中的“法则”也会随之改变。由于机器难以预测没有“学习”过的联系,较少的站点观测难以生成合理的平均空间分布。
论文引用:Zhou, Y.*, Y. Zhang, R. Wang, H. Chen, Q. Zhao, B. Liu, Q. Shao, L. Cao, and S. Sun, 2023: Deep Learning for Daily Spatiotemporally Continuity of Satellite Surface Soil Moisture over Eastern China in Summer. Journal of Hydrology, 619, 129308. doi: https://doi.org/10.1016/j.jhydrol.2023.129308
支撑项目:国家自然科学基金面上项目“中国东部土壤湿度对盛夏西太副高次季节进程的影响机理(42175030)”
通讯作者信息:http://faculty.nuist.edu.cn/zhouyang/zh_CN/index.htm
图1 卷积神经网络结构(详见原文)
图2 卷积网络模型验证(详见原文)