气温是描述地表环境条件的重要变量,但是在偏远山区常规气温观测站点稀少。青藏高原由于气候条件恶劣、地形复杂观测稀疏问题尤为突出:站点分布严重不均且多集中分布在高原东部的低海拔山谷地带(< 4800m),在高海拔(> 5000m)和广大的高原西部地区几乎没有站点。近年来的研究表明遥感观测的地表温度在弥补气温观测数据缺失方面具有较大应用潜力。MODIS地表温度产品由于具有较高的时空分辨率,在相关的遥感产品中是应用最为广泛的。
目前已有相当多的利用MODIS地表温度、使用统计方法开展气温估算的研究,但是仍然有三个重要问题有待解决:(1)MODIS地温产品的云污染问题;(2)模型选择的问题(使用复杂模型,还是简单模型?);(3)在当前的基于统计方法来估算气温的研究中,有关数据质量的考虑并不充分。
基于对以上问题的考虑,中国科学院青藏高原地球科学卓越创新中心、青藏高原研究所张凡研究员课题组张宏波博士及其合作者提出了一种动态整合MODIS地温数据、自动选择最优统计模型的气温估算方法。与传统的单一模型方法相比,新方法对所有15种可能的地温组合依次建立统计模型,实现了气温估算产品的云量最小化;选取包括多元线性回归(MLR)、偏最小二乘(PLR)、反向传输神经网络(BPNN)、支持向量回归(SVR)、随机森林(RF)和Cubis回归(CR)等在内的6种统计模型为待选模型,在每种地温组合条件下进行比较,通过交叉验证选出最优模型;并考虑了两种地温数据质量条件,从而生成了2*15=30个估算模型。在实际估算气温时,使用新方法根据实际数据条件逐日、逐网格地选用最优模型进行气温估算,生成了2003至2010年青藏高原1公里空间分辨率的日平均气温产品,将云遮挡造成的数据缺失率从单一地温产品的35-54%降低到目前气温产品的14%。
本研究得到中国科学院战略科技先导专项B类(XDB03010401)以及国家然科学基金(41422101、41371087)项目资助。成果已发表于国际著名地学刊物Journal of Geophysical Research: Atmospheres。
链接:http://onlinelibrary.wiley.com/doi/10.1002/2016JD025154/full
图1. 六种统计模型在不同地温组合和数据质量条件下的估算性能比较:高质量(a)和高低质量混合(b)
图2. 模型排行表
图3. 使用新方法生成的气温产品的云覆盖率与单一地温或地温组合的效果对比