导读:根据我(毛克彪)多年的研究经验,我认为所有的方法都可以看做是不同层次上的统计方法。无论是早期的原始统计经验方法、还是现在大家公认的物理经典模型/方法/算法。如果从不同层次上去看,都可以归结为不同层次上的统计方法。只不过所谓的物理模型/方法/算法是在广大科研人员的努力下发现一些现象或规律取决于某些主要变量,赋予了相关变量的物理含义,具有更广的适用范围,但大部分模型/方法/算法适应范围也不是“包打天下”,很多物理方法适用范围也是相对的,其本质还是统计方法,我把这种方法称之为物理统计方法。这个方法的优点是比前者适用于更大的范围和更具普适性而已;机器学习算法本质上也是统计方法,特别是目前用得比较多的深度学习神经网络算法本质上是一种更高级的统计优化计算方法,这种方法的精度和普适范围取决于样本库(训练和测试数据的代表性和精度)。我最早在2008年提出将深度学习应用于近地表空气温度反演,并且将地表温度和发射率作为先验知识使得算法具备移植性,从理论和技术上进行了突破(①Kebiao Mao, Huajun Tang, Xiufeng Wang, Qingbo Zhou, Daolong Wang, Near-Surface Air Temperature Estimation from ASTER Data Using Neural Network, International Journal of Remote Sensing, 2008, 29(20), 6021-6028;②毛克彪,马莹,夏浪,沈心一,用MODIS数据反演近地表空气温度的RM-NN算法,高技术通讯,2013, 23(5), 462-466;③毛克彪,王道龙,张立新等,从MODIS数据估算近地表空气温度方法,专利号:ZL2009100910294, 2013;④Kebiao Mao, Chunyu Gao, Guicai Li, et al., A Method for Estimating Near-surface Air Temperature From Remote Sensing Data Based on Machine Learning, Patent number: Patent number: 2021105183, 2021. ⑤Kebiao Mao, Huaizhi Zhang, Shu Fang, et al., A High Spatial-Temporal Resolution Method for Near-Surface Air Temperature Reconstruction, Patent number:2021105536, 2021.)。
早年由于计算机内存不够,当时一般隐含层只设置了3层,推广应用存在一定的难度。近年来计算机技术硬件的进步,使得内存等翻了几倍甚至几十倍上百倍。我们这里进一步完善了先前提出的近地表空气温度反演理论和技术,明确提出将深度学习耦合物理方法和统计方法,并且将地表温度和发射率作为先验知识,形成近地表空气温度遥感反演范式。这是我积累和思考了近15年的心血,我把我的想法一把手一把手地教给学生,在我早年的工作基础上进一步深化和应用,论文发表在国际遥感刊物《Remote Sensing》上。其实到论文发表后,学生也没有完全理解这种方法的精髓,文字表达上还是出现了很多理解上的偏差,我反复修改还是存在一些问题,请读者见谅。这里简单阐述一下我提出的基于人工智能和先验知识反演近地表空气温度的思想。我个人认为这个方法和模式将成为人工智能在地球物理参数中反演应用的典范,在近地表空气温度遥感反演历史上具有里程碑意义。这是我们利用人工智能技术继解决地表温度和发射率反演难题的第二个代表性工作。
虽然我们从人工智能技术的角度解决了遥感反演近地表空气温度的理论(物理解释)和技术问题(利用地表温度和发射率作为先验知识去噪声),但从理论到工程应用还有很长的路要走,工程需要针对具体的不同情况进行细化和处理,这一点往往被很多人所忽略。很多人简单地把别人的论文算法实现和生产产品,以为论文发表就解决了问题,结果往往发现事与愿违,甚至质疑理论的正确性,其实是没有真正理解精髓,浮在面上。大多数理论算法工程业务化还需要努力,需要针对不同的情况细化,而且要让广大用户应用,并且反馈,然后进一步修正,反复持续多年才能形成稳定的产品。后者往往被大家忽略,我们期望得到国家科技部和国家基金委等相关科研部门的支持,继续完善我们的理论,并且推动工程业务化应用。
作为地球科学领域的关键参数之一,利用遥感技术在大尺度范围内快速获取高精度和高空间分辨率的近地表空气温度(NSAT)具有重要的理论与现实意义。直接获取NSAT数据主要有两种方法:基于气象站点观测数据的传统方法和基于遥感的反演方法。
传统方法主要可分为基于能量平衡的物理方法和基于相关变量关系的经验方法。物理方法需要许多参数(例如,空气动力学阻力、粗糙度和土壤物理性质)来表征土壤和植被的状态,这些参数通常很难获得。相反,在经验方法中,NSAT通过地理信息系统(GIS)内插获得的。该方法简单有效,但其精度取决于气象站的数量和分布特征。如果气象站点数量不足或气象站点分布不均(尤其是在山区),则难以准确估计NSAT。
遥感方法可分为统计方法、能量平衡方法和机器学习方法。统计方法包括直接和间接方法。直接统计方法包括构建NSAT和地表温度(LST)之间线性关系的单变量回归模型,以及考虑其他因素(如太阳天顶角、纬度和经度)的多变量回归模型。间接统计方法将NSAT与植被指数联系起来,此类方法可能主要适用于植被覆盖率高的林地或农田区域。该方法的可移植性不高,必须通过不同地区气象站的NSAT观测数据进行校准来提高其准确性。能量平衡方法通过建立物理模型将NSAT和其他地表环境参数联系起来。尽管该方法有明确的物理意义,并具有很强的通用性,但它们需要许多遥感技术难以获得的参数。机器学习方法,特别是神经网络(NN)方法,也被用于反演NSAT。传统神经网络算法主要是通过获取卫星的同步地面观测数据作为训练和测试数据,往往没有考虑地表温度和地表类型的影响。因此虽然这种方法的精度在局部和短时间范围内的精度很高,但它在很大程度上依赖于训练数据,在一个区域中训练的NN通常不能直接应用于另一个区域。由于缺乏物理过程推导,大家通常把这种模式叫“黑箱”,这种反演模式不具有物理意义和可解释性。
创新点
利用热红外遥感反演NSAT的困难在于,晴空条件下卫星的亮度温度(BT)信息主要来自地表的LST,NSAT的信号相对较少(换句话说,直接通过星上反演NSAT的噪声很多,这样从而会导致精度不高)。近地表空气温度不仅受到LST变化的影响,还受到其他因素的影响,如地表发射率(LSE,表面类型)。现有的大多数遥感反演方法没有考虑这些影响因素。为了克服上述方法的缺点,我们将LST和LSE作为先验知识,并且利用人工智能方法耦合物理和统计方法(PS-DL),提出了一种针对近地表空气温度反演的范式(通用框架模式)。这种耦合方法充分利用了DL的优化计算能力,同时确保方法具有广泛的适用性(可移植性)。具体说是三个创新点:一是深度学习通过利用物理方法和统计方法的解耦合了物理和统计方法;二是利用地表温度(LST)作为先验知识解决卫星数据包含近地表空气温度信息量不足的问题;三是利用地表发射率(LSE)作为先验知识提高了算法的移植性。从理论和技术上解决了近地表空气温度反演的难题,这个想法最早发表在2008年的国际遥感上(Kebiao Mao, Huajun Tang, Xiufeng Wang, Qingbo Zhou, Daolong Wang, Near-Surface Air Temperature Estimation from ASTER Data Using Neural Network, International Journal of Remote Sensing, 2008, 29(20), 6021-6028.)。研究结果表明PS-DL方法有效地突破了传统方法的局限性,该框架可以成为地球物理参数反演的通用反演范式,并且使得深度学习有了物理意义和可解释性,这种反演模式从而在地球物理参数特别是近地表空气温度反演史上具有里程碑式的意义。
研究内容
PS-DL方法的框架如图1所示。步骤1(红色虚线矩形)构建基于辐射能量平衡方程的物理方法。建立一个物理正向模型系统,并利用经典的MODTRAN模型模拟辐射传输过程,得到物理方程组的解;第2步(黄色虚线矩形)基于物理方法构建统计方法,使用相关卫星产品数据、同化模型的高精度数据、地面气象观测数据和卫星BT数据生成高精度统计数据库;步骤3中,将物理方法的解与高精度统计方法的解相结合,以构建DL的训练和测试数据库。为了提高近地表气温的反演精度,我们首先反演LST和LSE(①Kebiao Mao, Jiancheng Shi, Zhaoliang Li, Huajun Tang, An RM-NN algorithm for retrieving land surface temperature and emissivity from EOS/MODIS data, Journal of Geophysical Research-atmosphere, 2007, 112, D21102, 1-17;②Wang Han, Mao Kebiao*#, Yuan Zijin., Shi Jiancheng, Cao Mengmeng, Qin Zhihao, Duan Sibo, Tang Bohui, A method for land surface temperature retrieval based on model-data-knowledge-driven and deep learning, Remote Sensing of Environment, 2021, 265, 1-19.),然后利用LST和LSE作为先验知识,从而减少噪声和提升NSAT信号的信息,提高NSAT反演精度;步骤4中,DL用于优化求解物理和统计方法,通过迭代训练和测试实现所需的精度;最后步骤5是进行验证和应用。
图1 用于反演近地表气温的PS-DL方法框架
物理方法
图2 与LST、LSE和NSAT相关的热辐射传输模型简化图
统计方法
反演和重要结论
(一)基于模拟数据验证(图3)
图3 基于模拟数据的模型1(a)、2(b)和3(c)验证
(二) 地面验证(图4)
图4 不同条件下模型1–3反演结果与地面观测数据验证
结语
为了吸收传统方法的优点和克服传统方法的缺点,我们提出了一种基于人工智能(深度学习)耦合物理方法和统计方法反演NSAT。所提出的PS-DL框架继承了物理、统计和DL方法的优点。通过物理和统计方法的迭代优化,DL有效地解决了NSAT反演的病态问题,提高了NSAT的反演精度。在此框架中,首先反演LST和LSE,然后使用LST和LSE作为先验知识进一步反演NSAT。该方法可以成为从人工智能语传统方法耦合从热红外遥感反演近地表空气温度的范式,DL不仅具有物理意义,而且具有可解释性,这是近地表气温反演历史上的一个里程碑。由于该框架实现了不同方法的协调发展、相互促进和集成,因此该框架也可以作为其它地球物理参数反演的参考模式。
荐读
《慧天地》敬告
《慧天地》公众号聚焦国内外时空信息科技前沿、行业发展动态、跨界融合趋势,发现企业核心竞争力,传播测绘地理信息文化,为时空信息类相关专业学子提供日常学习、考研就业一站式服务,打造政产学研金服用精准对接的平台。
《慧天地》借鉴《读者》办刊理念,把时空信息领域的精华内容汇聚到平台上。我们高度重视版权,对于精选的每一篇推文,都会在文章开头显著注明出处,以表达对作者和推文引用平台版权的充分尊重和感谢;对于来源于网络作者不明的优质作品,转载时如出现侵权,请后台留言,我们会及时删除。感谢大家一直以来对《慧天地》的关注和支持!
——《慧天地》运营团队
投稿、转载、商务等合作请联系
微信号:huitiandi321
邮箱:geomaticshtd@163.com