基于深度卷積神經(jīng)網(wǎng)絡的遙感影像分類研究
隨著過去十年遙感影像技術的快速增長,現(xiàn)在已經(jīng)可以獲得大量的高分辨率遙感影像,從而使我們能夠對地表進行更為詳盡的研究。遙感影像分類,作為一項基礎性的工作,其目的在于將提取出的覆蓋多種地物類型或地物的遙感圖像分區(qū)為不同的語義類別,對于許多實際遙感應用,如土地資源管理,城市刨削和電腦制圖等等均有重要意義。通常,一些相同的土地覆蓋類型或對象類別經(jīng)常在不同的場景類別之間同時存在。例如,兩個典型場景類別的商業(yè)區(qū)和住宅區(qū)可同時包含道路,樹木和建筑物,但這三個主題類別的密度和空間分布不同。因此,遙感場景中空間和結構的復雜性使得場景分類問題變得十分復雜[1]。
盡管在遙感圖像分類領域,科研工作者做了大量的工作,但相關方法在場景分類中的表現(xiàn)并不盡如人意,于是尋求更好的解決方法稱為當前遙感影像分類的研究趨勢之一。最近,深度學習方法不僅在語音識別、目標識別和檢測、自然語言處理等方面取得了巨大的成就,而且在其他領域的應用上也有較大的發(fā)展,引起了學術界和工業(yè)界的青睞。深度學習算法可以應用于不同抽象級別的分層特征,而深度神經(jīng)網(wǎng)絡作為最成功和廣泛使用的深度學習方法,已經(jīng)在大多數(shù)識別和檢測系統(tǒng)中得到了應用。而遙感圖像的分類是一個復雜的過程,采用淺層結構模型對其進行分類很難達成預期目標,故本文將CNN模型應用于遙感影像進行分類研究。
1 深度學習
深度學習作為機器學習的一個重要分支,由Hinton等人2006年提出了,它基于對數(shù)據(jù)進行表征學習,以建立可以對人腦進行模擬分析學習和數(shù)據(jù)解釋的神經(jīng)網(wǎng)絡為目的[2]。隨著科技的發(fā)展,深度學習已經(jīng)成為互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能的一個必然趨勢,主流高科技公司均投入了大量的資源進行深度學習技術的研究與開發(fā),從而也極大的促進了深度學習技術的發(fā)展。
深度學習構建的具備大量單一元素(神經(jīng)元)的深度網(wǎng)絡結構,各個神經(jīng)元具備相互連接的關系,且可以通過不斷學習來改變其連接的強度,即改變權重,從而決定網(wǎng)絡的功能。工作與科研中常用到的稀疏編碼、深度置信網(wǎng)絡等模型均屬于深度神經(jīng)網(wǎng)絡模型。
2 卷積神經(jīng)網(wǎng)絡算法原理
卷積神經(jīng)網(wǎng)絡是一種典型的前饋神經(jīng)網(wǎng)絡,它的典型架構是由兩層組成,其中包括特征提取層和特征映射層。其中,特征提取層的每個神經(jīng)元的輸入連接著上一層的局部接受域,負責局部特征的提取,且該層與其他特征間的位置關系在該局部特征提取后將被確定;而特征映射層,由多個特征映射組成,每個特征映射構成一個平面,其上的所有神經(jīng)元有相等的權值。卷積神經(jīng)網(wǎng)絡的激活函數(shù)采用影響函數(shù)核小的sigmod函數(shù),使得特征映射可以保位移不變性[3]。
卷積神經(jīng)網(wǎng)絡與普通神經(jīng)網(wǎng)絡有著較大的區(qū)別,主要表現(xiàn)在:卷積神經(jīng)網(wǎng)絡包含一個卷積層和子采樣層構成的特征提取器,在卷積層中,一個神經(jīng)元只跟相鄰層里的部分神經(jīng)元連接,且卷積層通常包含一系列由矩形排列的神經(jīng)元構成的特征平面(featureMap),同一特征平面的神經(jīng)元共享權值,該權值即卷積核。卷積核的存在可以有效降低網(wǎng)絡各層之間的連接數(shù)量,節(jié)約大量計算成本,同時使得過擬合的問題得到有效改善。子采樣又叫池化(pooling),常用形式有均值子采樣和最大值子采樣。通過卷積和子采樣,網(wǎng)絡模型的復雜度得到了極大的簡化,參數(shù)數(shù)量也大為減少。目前,對于CNN的研究較為活躍,基本上集中于以下三點[4]:
(1)網(wǎng)絡結構方面。卷積神經(jīng)網(wǎng)絡模型具備非常復雜的結構,因此需要花費較長的時間進行訓練。對于一種固定的數(shù)據(jù)集應用,尋找最合適的網(wǎng)絡結構以提升模型精度和泛化能力是當前研究的一個熱點。
(2)系統(tǒng)硬件方面。卷積神經(jīng)網(wǎng)絡的并行處理能力非常強大,使其在硬件實現(xiàn)上具備非常大的優(yōu)勢,國際許多主流芯片制造商已經(jīng)在研或者發(fā)售了多款用于CNN的大規(guī)模集成電路,以提升并行計算能力和訓練 速度等。
(3)網(wǎng)絡應用研究。在物體識別與檢測等模式識別領域的應用較為廣泛和深入,尤其在圖像識別方面,CNN已經(jīng)表現(xiàn)出了非常大的優(yōu)勢。
3基于卷積神經(jīng)網(wǎng)絡的遙感圖像分類研究
遙感圖像在進行分類處理前需要先進行一系列的處理,具體包括以下幾個方面:
3.1 預處理
預處理包括降噪處理、薄云處理和陰影處理。由于在獲取遙感圖像時,傳感器自身質量參差不齊,導致圖像中含有一定的噪聲,因此需要進行降噪處理,以減小噪聲影響;薄云處理主要針對遙感影像中天氣原因導致的影像被遮蓋;陰影處理主要針對太陽照射情況不理想而對地物造成的遮擋影像。
3.2 幾何校正
遙感影像需要具備一定的幾何精度,故在進行其他操作前,對遙感圖像進行一系列的幾何校正,具體包括:圖像配準、幾何粗校正、幾何精校正、正射校正等。
3.3 圖像增強
為了更加突出遙感圖像中的興趣目標,使得地物信息具有更強的可讀性,需要進行圖像增強處理,包括彩色合成、密度分割、灰度顛倒、圖像間運算等。
3.4 圖像鑲嵌和勻色
在不同攝影條件下獲得的兩幅或者多幅圖像需要進行圖像鑲嵌成一幅整體圖像進行處理,同時由于拼接得到的遙感數(shù)據(jù)圖像,因其來源不同,圖像質量和色調有差別,故需要進行勻色處理。
3.5 遙感圖像特征選擇
在對圖像進行預處理后,需要對遙感圖像進行分析,進而從圖像中選取具有明顯特征的數(shù)據(jù)作為訓練的樣本數(shù)據(jù)。樣本的選取非常重要,直接影響了分類的效果。
3.6 遙感特征提取
卷積神經(jīng)網(wǎng)絡通過共享權值和網(wǎng)絡結構重組對遙感影像的特征進行不斷學習,并通過反向傳播算法完成訓練最終實現(xiàn)遙感影像的分類。在其前向傳播過程中,卷積核覆蓋在輸入的遙感影像上,對應的位置求積再求和后將所得值賦給輸出圖的對應位置,以此方法按次序移動卷積核,最終得到輸出結果。而在反向傳播過程中,需要先根據(jù)神經(jīng)網(wǎng)絡的誤差信號反傳方式得到末端分類器中所有神經(jīng)元的誤差信號,然后經(jīng)由分類器傳播到前面的特征提取器。誤差信號從子采樣層的特征圖傳播到前面卷積層的特征圖需要進行一次全卷積過程來完成[5]。卷積層的計算形式如下式所示。
式中:l為卷積層所在層數(shù);b是偏置;k是卷積核;f是激活函數(shù);Mj是上一層的一個輸入特征圖。
3.7 分類結果評價
對于分類處理后的遙感影像數(shù)據(jù),需要判斷分類的效果是否滿足預期要求,故進行合理而精確的評價是十分必要的,目前主要的精度評價因子有總體分類精度、Kappa系數(shù)、混淆矩陣、錯分誤差及用戶精度等。
4 結語
本文通過對遙感圖像的分類方法進行分析,探討了卷積神經(jīng)網(wǎng)絡的工作原理并針對傳統(tǒng)分類方法的不足,提出了基于卷積神經(jīng)網(wǎng)絡的遙感圖像分類方法并給出了具體的分類流程,并對實驗流程內(nèi)各個步驟原理和依據(jù)進行了充分的論述和說明,對遙感圖像處理領域的相關工作提供較大的參考價值。
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了