題目
基于高光譜圖像的密度峰值k-均值算法估算小麥植被覆蓋度
應用關鍵詞
植被覆蓋度;k-means算法;NDVI;植被指數(shù);小麥
背景
植被覆蓋度(Fractional vegetation cover, FVC)是測量地球表面植被分布的重要參數(shù)。在評價小麥生長狀況時,準確測定小麥各生育期的FVC具有指導意義。此外,在監(jiān)測小麥生物量時,需要快速提取FVC、植物含水量、葉綠素、葉黃素含量和氮含量數(shù)據(jù)。然而,本研究發(fā)現(xiàn),現(xiàn)有的針對小麥生長不同時期和土壤條件的FVC提取方法效果各異,無法滿足小麥多時相生長監(jiān)測的精度要求。因此,開發(fā)一種操作簡單、提取精度高、受環(huán)境、時間、空間等外界條件影響較小的FVC提取新方法具有重要意義。
目前,大多數(shù)研究采用像素二分法或監(jiān)督分類法分離植被與非植被,提取FVC。但是,不同時間、不同條件下采集的植被和非植被的光譜反射率的變化,會使像素二分法的閾值發(fā)生很大變化,從而使得提取效果產(chǎn)生較大波動。監(jiān)督分類受人為因素和樣本影響較大。當測試樣本和訓練樣本之間沒有差異時,提取效果會很好。然而,當樣本之間存在時空差異時,提取的精度將顯著降低。
考慮到無監(jiān)督學習算法無需人為干預,通過確定的分類標準對植被和非植被進行分類,受人為和環(huán)境因素影響較小。因此,假設無監(jiān)督學習算法可以準確地提取FVC,將其應用于各種條件下收集的數(shù)據(jù),理論上應該可以達到相同的效果。k-means算法通過像素點到聚類中心的距離來劃分像素點的類型。該算法能有效減小時間和空間對提取精度的影響。然而,k-means算法對初始選擇的質心點比較敏感,不同初始質心點的聚類結果可能有很大差異。為了減小初始質心點對k-means算法結果的影響,根據(jù)植被像素與非植被像素的不同特點,增加了密度峰值計算算法。將植被像素和非植被像素的密度峰值作為k-means算法的初始質心,以減少異常結果帶來的提取誤差,提高FVC的提取精度。
基于上述問題,本研究利用高光譜相機獲取小麥的高光譜圖像數(shù)據(jù),計算NDVI(Normalized difference vegetation index),并基于NDVI圖像采用DPK-means(Density peak k-means)聚類算法和像素二分法提取FVC。本研究比較了像素二分法與DPK-means算法的精度和穩(wěn)定性,并分析了基于植被指數(shù)圖像的DPK-means算法的優(yōu)勢。
試驗設計
試驗地點位于江蘇揚州大學,包括小麥盆栽試驗和大田試驗。中國農業(yè)科學院劉升平研究員團隊利用GaiaSky-mini2-VN高光譜相機(江蘇雙利合譜)于近地面采集了干性土壤和濕性土壤的高光譜圖像,同時將其搭載在DJI M600無人機上,獲取了大范圍小麥冠層高光譜圖像。采集設備如圖1所示。
圖1 采集設備。GaiaSky-mini2-VN相機(A)、地面數(shù)據(jù)采集設備(B)、無人機數(shù)據(jù)采集設備(C)。
如圖2所示,小麥在綠光550 nm處有一個反射峰,在紅光680 nm處有一個吸收谷,在近紅外光780 ~ 900 nm處有一個連續(xù)反射峰。小麥紅光波段與近紅外波段反射率有明顯差異。土壤的光譜反射率在整個波段范圍內呈緩慢上升趨勢,沒有明顯的反射峰和吸收谷。紅光波段和近紅外波段可以很好地指示植被與土壤的差異,結合它們構建的植被指數(shù)可以有效地用于植被與土壤的區(qū)分。因此,本研究選取近紅外波段800 nm和紅光波段680 nm構建NDVI。
圖2 小麥和土壤的典型反射率曲線
為了檢驗基于NDVI提取的小麥植被灰度圖像上植被和非植被像素的分布,本研究制作了NDVI灰度圖像的像素頻率分布圖(圖3)。從圖中可以看出,小麥植被、土壤和盆像素都近似于高斯分布,小麥植被與土壤和盆的高斯分布距離較遠。結果表明,在NDVI灰度圖像中,植被像素與非植被像素可以很好地分離。
圖3 植被指數(shù)灰度圖像的像素分布。NDVI灰度圖(A)、NDVI灰度圖像像素分布的高斯擬合(B)。
為了解決k-means算法的局部優(yōu)化問題,本研究以密度峰值作為初始聚類中心點對算法進行改進。DPK-means算法流程如下所示:
(1) 對灰度圖像進行多模態(tài)高斯擬合,計算k個擬合密度峰值作為初始聚類中心進行搜索和計算。
(2) 計算數(shù)據(jù)集中每個樣本點與k個聚類中心之間的距離,并將其劃分為距離最小的聚類中心對應的類。
(3) 計算每個類別的平均值作為新的聚類中心。
(4) 重復步驟2和步驟3,直到聚類中心的位置沒有改變,然后停止迭代。
然后,本研究基于SVM監(jiān)督分類結果,比較分析了兩種方法的提取效果。具體提取過程如圖4所示。本研究采取的評價指標為EF = (FSVM – FVI) / FSVM,式中EF為FVC提取誤差,FSVM和FVI分別為基于SVM的FVC以及實測FVC。
圖4 小麥FVC的提取過程
結論
采用像素二分法和DPK-means提取FVC。兩種土壤條件下閾值的平均值,如表1所示。將像素二分的固定閾值設置為T0、T1和T2,DPK-means算法采用高斯核函數(shù)。兩種土壤條件下像元二分法的閾值差異較大。干土的光譜反射率明顯高于濕土。濕土的NDVI值高于干土,更接近植被的NDVI值。這可能導致在潮濕土壤條件下像素二分法的固定閾值更高。兩種土壤條件下不同方法對小麥FVC的提取效果如圖5所示。
基于DPK-means算法的EF絕對值和RMSE的均值最di(表2),這表明DPK-means算法具有良好穩(wěn)定的提取精度。在濕潤土壤條件下,T1閾值像素二分法效果最hao,EF絕對值僅為0.034,但其RMSE值為0.061,EF分布較為分散,集中使用大樣本數(shù)據(jù)難以獲得較好的提取效果。DPK-means算法EF的均值絕對值為0.051,僅高于T1閾值,但其RMSE值為0.032,EF分布相對集中,在大樣本數(shù)據(jù)集中使用時效果較好。在不考慮土壤條件的情況下,DPK-means算法的EF主要分布在-0.05 ~ 0.05之間,EF相對集中。T0、T1、T2閾值下的EF分布分散,EF范圍較大。對四種方法的FVC提取結果進行線性擬合,DPK-means算法的擬合精度最高,R2達到0.87(圖6)。
DPK-means算法在無人機高光譜影像中提取FVC的效果如圖7所示。平均誤差絕對值為0.044,RMSE為0.030,誤差相對集中,與地面高光譜圖像的提取誤差相似。SVM與DPK-means擬合的FVC的R2達到0.93。綜上所述,DPK-means算法可以有效地從無人機高光譜圖像中提取小麥的FVC,且該算法受圖像采集日期的影響較小。
綜合地面和無人機高光譜影像的FVC提取結果,與其他算法相比,DPK-means算法受土壤條件和采集日期的影響較小,誤差分布更集中,提取精度更高。相對于像素二分法,DPK-means算法具有更高的準確性和魯棒性,在不同條件下都能取得更好的結果。
表1 兩種土壤條件的平均閾值
圖5 兩種土壤條件下小麥FVC提取效果。土壤干燥狀況(1)和濕潤狀況(2)。A1和2為RGB圖像;B1和2為NDVI灰度圖像;C1和2為干土閾值提取的灰度圖像;D1和2為DPK-means提取的灰度圖像;E1和2為濕土閾值提取的灰度圖像;F1和2為整體閾值提取的灰度圖像;G1和2為SVM提取的灰度圖像。
表2 兩種土壤條件和不同提取方法下小麥FVC提取誤差絕對值
圖6 采用多種方法擬合小麥FVC的結果。DPK-means(A)、T0(B)、T1(C)、T2(D)。
圖7 不同日期的無人機高光譜圖像提取結果。RGB圖像(A)、NDVI灰度圖像(B)、DPK-means提取的灰度圖像(C)、SVM提取的灰度圖像(D)。
作者信息
劉升平,博士,中國農業(yè)科學院農業(yè)信息研究所研究員,碩士生導師。
主要研究方向:農業(yè)智能管控技術、智慧蜂業(yè)、農產(chǎn)品質量安全控制。
參考文獻:
Liu, D.Z., Yang, F.F., & Liu, S.P. (2021). Estimating wheat fractional vegetation cover using a density peak k-means algorithm based on hyperspectral image data. Journal of Integrative Agriculture, 20, 2880-2891.
立即詢價
您提交后,專屬客服將第一時間為您服務