題目
基于多人工神經網絡自適應選擇和城市河流高光譜圖像的水質參數制圖
應用關鍵詞
自適應、深度學習、多神經網絡、高光譜圖像、水質監測
背景
水質參數主要包括磷、氮、生化需氧量(Biochemical oxygen demand, BOD)、化學需氧量(Chemical oxygen demand, COD)、葉綠素a。水質參數的異常會影響水生生物生存以及產生水污染,因此需要一種快速、高效的計算方法對水體污染物進行定量預測。
隨著計算機科學和遙感技術的迅速發展,高光譜遙感圖像分析已被廣泛應用于大氣、土壤和水的參數預測。目前,利用高光譜進行水質估測的研究中,大多將其看成分類問題而不是回歸問題,并且研究中構建的模型較難適應水質的突然變化。同時,傳統的特征選擇過程是低效的,并且只能預測一個水質參數。
為解決上述問題,本研究提出了多神經網絡自適應選擇方法(Self-adapting selection of multiple neural networks, SSNN),它是一種集相關和逐步回溯為一體的端到端方法,可以在不同設置下選擇最佳模型,并能定量預測6個水質參數。在本研究中,使用數學和統計檢驗標準支持所提出模型的可靠性。本研究利用地面分析光譜儀(ASD)采集的水體的修正光譜反射率,建立了基于遙感數據的自適應人工神經網絡(ANN),對水體氮、磷、BOD、COD、濁度和Chla進行預測。
試驗設計
試驗地點位于廣東省中山市的石岐河。北京大學劉瑜教授團隊利用ASD(325 nm ~ 1075 nm)采集地下水地表光譜反射率,共獲得79個點的地面測量數據。每個采樣點獲取其水體氮、磷、BOD、COD、濁度和Chla數據。本研究使用的無人機為大疆M600,高光譜成像儀為Gaiasky-mini2-VN(江蘇雙利合譜),其波長范圍為401.81 nm ~ 999.28 nm,在120米高的天空中飛行,空間分辨率為40 cm。
ASD和高光譜成像儀的波段值不同,前者的波段范圍覆蓋后者的波段范圍。根據測量輻射度的協議和輻射度-反射率傳遞法獲得ASD反射率后,我們將ASD的波長投影到高光譜成像儀上,使其具有相同的中心和波段數。然后,通過特征工程,在404.0 nm ~ 894.3 nm范圍內選取145個特征波段。UAV高光譜圖像數據中每個像元點包含的270個波段的反射率數據可以轉移成145個特征波段。由于未對圖像進行大氣校正,我們選擇地面點來消除ASD與高光譜成像儀反射率的差異。
圖1顯示了用于估計水質參數的方法。首先,地面樣本包含ASD反射率數據和水質參數兩部分,用于建立SSNN模型。其次,利用非線性反射率傳遞模型中的UAV高光譜圖像數據作為輸入,通過將UAV的反射率傳遞到ASD來細化數據。第三,傳遞的UAV反射率數據被用于SSNN模型,從而對水質參數進行定量估計,并利用ArcGIS軟件包生成專題圖。
本文提出的SSNN模型主要由神經網絡、線性回歸和反饋機三部分組成(圖2)。ANN是傳統的數值預測ANN,包括特征選擇、逐步回溯和權重相關性。線性回歸被設計用于調整最終結果。反饋機用于SSNN模型的自適應,更新神經網絡結構的設置,如隱藏層數、激活函數和每個隱藏層的神經元數。
SSNN的訓練數據包括每個點的水面反射率和所有污染物的含量水平。該方法通過對所有ANN - BP進行比較,篩選出最you的反演模型。在SSNN模型中進行反向傳播、逐步回溯、Pearson相關和余弦相關。根據均方根誤差(RMSE)、F統計量、t統計量和R平方值,使用具有不同隱層數、隱層節點數、優化器和激活函數的各種神經網絡來選擇其中的最佳神經網絡。
圖1 用于水質參數的多神經網絡自適應選擇法(SSNN)的工作流程
圖2 SSNN模型結構
結論
表1展示了不同路線的水質參數。D1的渾濁度、Chla、BOD、COD和氮在各樣地中最高,因為水樣采集于養魚池。有機物導致高濃度的BOD、COD和氮。由于缺乏良好的出水口和進水口,水池濁度高度集中,造成水池濁度迅速增加。其他路線的水質參數濃度較低,這是因為存在水交換,生活廢物較少。
表1 研究區79個訓練數據組成的不同路線水質參數的范圍和平均值
圖3展示了迭代次數從100到1000次過程中,每100次迭代的精度變化,以及所選ANN-BP模型精度優于其他4個模型。所選模型在隱層數、隱層節點數、優化器的選擇、激活函數的選擇等方面與其他四個模型不同。從圖3a-c可以看出,在100 ~ 400次迭代下,所選ANN-BP模型的性能并沒有優于其他4個ANN-BP模型,但逐漸優于其余模型。經過600次迭代,圖3a-c獲得相對穩定的精度,模型達到平衡。
圖3 不同水質參數和訓練迭代的精度圖
表2給出了所選ANN-BP模型的評價標準以及t統計量對應的p值。濁度和Chla有最大的RMSE,因為濁度和Chla在單位的量級和范圍上都大于其他值。F檢驗零假設表明,模型2并不比模型1更能顯著擬合數據。一個好的ANN-BP模型通常會給出一個較大的F統計量,并且所有模型之間只對一種水質參數進行比較。表2中的P值都大于0.05,表明在95%的置信水平下,接受無效假設,對于其中一個水質參數而言,模型產生的平均值等于真實模型的分布。R2值均大于0.5,表明超過50%的方差可以被自變量解釋。
表2 SSNN方法中有關水質的參數
表3列出了不同方法在整個區域測試集上的性能,包括SSNN、傳統單層神經網絡和Liew等人的經驗方法。本研究所提出方法在RMSE和MPAE方面優于其他方法。SSNN對氮的估算效果最jia(MPAE最di)。MPAE比RMSE更有說服力,因為它有效地證明了所提出方法的數值預測的準確性。后期需要在整個區域內收集更多的數據,以確保對各項水質參數進行準確的數值預測。氮的R2值比其他的R2值大,而一些R2值高的水質參數由于隨機樣本量小,其MPAE可能并不低。本研究所提出的方法對大多數水質參數的預測是正確的,盡管樣本沒有覆蓋整個區域上所有間隔40厘米的像素點。
表3 不同模式的統計參數比較
如前所述,將地面ASD反射率和水質參數作為SSNN模型的輸入,建立訓練模型,然后將UAV高光譜反射率圖像作為SSNN模型的輸入,預測水質參數。圖4顯示了在480、550和670 nm三個波長下估計水質參數的結果圖像。各個水質參數的分布可以很容易地觀察到,當地環保部門可以追蹤各個水質參數含量水平隨時間的分布和變化情況,以確定污染源。雖然圖4只顯示了整個研究區域的一部分,但其結果具有代表性。結果表明,人們居住的地方或生產皮革和塑料的工廠大多被高濁度、COD、BOD和磷污染。特征波長可以定量和定性地解釋水質參數的變化。
圖4 SSNN在水質參數反演中的應用
作者信息
劉瑜,博士,北京大學地球與空間科學學院教授,博士生導師。
主要研究方向:基于時空大數據的人文社會科學研究。
參考文獻:
Zhang, Y., Wu, L., Ren, H., Liu, Y., Zheng, Y., Liu, Y., & Dong, J. (2020). Mapping Water Quality Parameters in Urban Rivers from Hyperspectral Images Using a New Self-Adapting Selection of Multiple Artificial Neural Networks. Remote Sensing, 12(2).
立即詢價
您提交后,專屬客服將第一時間為您服務