• <input id="hc5d1"></input>

    基于深度學習的風機葉片狀態異常檢測

    2021年7月28日 16:26
    瀏覽量:0
    收藏

    張云峰1,李民1,黃久平1,王德玉1,步兵1,王秋強1,劉釗辰1,武珈銳1,于潔1,付小林2,劉進2
    (1.國電和風風電開發有限公司,沈陽 110000;2.成都阜特科技股份有限公司,成都 610000)

     

    摘要:葉片作為風力發電機組的關鍵核心構件之一,由于其自身構造特點、運行環境等不利因素影響,難以避免會出現裂縫、磨損、覆冰、不平衡等問題,如無有效手段對葉片異常狀態進行及時檢測和維護檢修會導致葉片各種傷害,甚至嚴重威脅著整個風電機組的安全運行,因此對風力發電機組葉片實施狀態檢測與故障診斷研究具有極其重大意義,本文首先回顧了針對葉片狀態檢測技術國內外的研究現狀,隨后提出了基于深度學習模型的葉片狀態檢測具體實現方案并初步驗證探討了方案的可行性及有效性。


    關鍵詞:風力發電機組;葉片檢測;深度學習;變分自編碼器;聚類


     

    0引言
           項目背景

           葉片作為整個風力發電機組中的關鍵核心部件之一,由于其性質所以在工作過程中容易受到各種天氣或人為等各種不利因素的影響,無法避免裂縫、磨損、覆冰、不平衡等問題,如無有效手段及時檢測出異常狀態,且不及時進行處理會導致葉片的各種傷害,嚴重威脅著整個風電機組的完全運行,因此對風力發電機組葉片實施狀態檢測與故障診斷研究具有重要意義。葉片檢測可避免葉片在運行過程中可能出現故障,降低由于突發事故產生的不必要損失及停機維護檢修帶來的發電量損失,減少葉片維修維護成本,這些都直接影響著機組的整體的可靠穩定與綜合效益。


           葉片狀態檢測技術國內外的研究現狀
           葉片是風力發電機組中的關鍵部件,一旦發生損傷,由于其所受荷載的復雜性,損傷將會以很快的速度擴展,而如果沒有及時發現就可能導致整個結構的毀壞,后果不堪設想。對于葉片狀態檢測國內外學者做了大量的研究,國外學者J. B. Ruan等學者進行了基于聲發射技術的葉片結構健康檢測研究,通過傳感器系統監測葉片狀態,通過采集的信號觀測出葉片剛度退化和非線性應變響應,實現了損傷識別。G.Dutton等為獲得葉片表面的應力分布,在對葉片進行無損檢測研究時運用了熱成像法,取得了不錯的效果。國內學者趙光新等對葉片的破損問題進行檢測,辨識和診斷葉片故障時利用小波分析處理葉片聲發射信號,通過去噪和重構等手段區分了不同類型損傷的聲發射信號特征。李錄平等運用振動監測技術和BP神經網絡,得到了葉片損傷與其振動特性變化的定量關系。
     

           當前人工智能技術在風力發電機組葉片狀態檢測領域運用情況
           對風電葉片運行狀態的在線檢測和故障診斷,能夠有效的預防突發性和重大隨機事件的產生,為風電葉片停機檢修提供了理論支撐。近些年隨著人工智能技術的成熟和廣泛的應用,將人工智能用于風力發電機葉片故障檢測和診斷是當前結構故障檢測和診斷的熱點。目前,人工智能技術結構損傷模式識別包括:深度學習、機器學習、小波分析以及專家系統等這些成熟的技術被廣泛應用到對結構損傷狀況的診斷中。在實際生活中深度學習將正常運行的風電運行狀態檢測,將若干種技術綜合起來進行風電葉片故障的檢測和診斷,深度學習的應用同時也使風電葉片損傷識別逐步向著簡便化、智能化的目標過渡。

     

    1 深度學習模型
    1.1 AutoEncoder(VE)

           AutoEncoder,中文稱作自編碼器,是一種無監督式學習模型。自動編碼器之所以受到越來越多的關注,最主要的一點就是其在深度學習中的特征提取能力,本質上它使用了一個神經網絡來產生一個高維輸入的低維表示。AutoEncoder與主成分分析PCA類似,但是AutoEncoder在使用非線性激活函數時克服了PCA線性的限制。AutoEncoder原理圖如下圖1所示。

     
    圖1AutoEncoder原理圖

           AutoEncoder包含兩個主要的部分,Encoder(編碼器)對輸入的數據進行編碼,從而給出一種編碼表示(即編碼階段)作用是用來發現給定數據的壓縮表示;然后根據這些編碼來重構輸入,即Decoder(解碼器)用來重建原始輸入,在訓練時,Decoder 強迫AutoEncoder選擇最有信息量的特征。所以AutoEncoder可以看做是一個特殊的三層神經網絡模型:輸入層、隱藏層和重構層,它的目標是使重構層的輸出盡可能的接近或等于輸入。
           假設輸入的數據為經過編碼器進行編碼得到H,然后在通過解碼器將解碼重構成R,則編碼過程和解碼過程可以表示為:
    H=()=Sf (WX+B)
    R=()=Sg (WH+B)
           其中,SfS分別表示為編碼器和解碼器的激活函數,激活函數種類很多,但本文對編碼器和解碼器都采用ReLU激活函數:f(x)=max ?(0,),值域為 [0,+∞)。WW分別表示為編碼器和解碼器的權值,BB分別表示層和重構層的偏置。ReLU激活函數如下圖2所示

     
    圖2ReLU激活函數

           AutoEncoder訓練的優化目標是使得重構層的輸出盡可能的接近或等于輸入X,所以這兩者之間的差異就形成了重構誤差,并用來描述兩者之間的接近程度。常用的重構誤差函數有很多,本文使用平方誤差函數:(X ,)=‖-2

     

     
    圖3 AE重構誤差原理


    1.2 VariationalAutoEncoder(VAE)
           VariationalAutoEncoder(VAE)即變分自編碼器。是一類重要的生成模型。它于2013年由DiederikP.Kingma和Max Welling提出[1]。2016年Carl Doersch寫了一篇VAEs的tutorial[2]。其結構跟自動編碼器是類似的,也由編碼器和解碼器構成。不同之處在于在編碼過程給它增加一些限制迫使其生成的隱含向量能夠粗略的遵循一個標準正態分布,這也是與AutoEncoder的最大不同之處。在生成新的數據時,只需要簡單地給它一個隨機的服從標準正態分布的隱含向量,使用解碼器通過解碼就能生成任意數據,而且是不需要給它原始的輸入數據先進行編碼的。

     
    圖4 VAE原理


           圖4所示為VAE的圖模型。我們能觀測到的數據是`,而`由隱變量Z產生,由Z→`是生成模型pθ (|z ),從AutoEncoder的角度來看,就是解碼器;而由X→是識別模型q? (z |x ),類似于自編碼器的編碼器。VAE需要計算兩種隱含變量分布的相似度,即用KL散度來計算兩種分布的相似度。
           下面是VAE的具體計算步驟:
           對生成模型(Decoder)pθ (x |z )做參數估計,利用對數最大似然法,就是要最大化下面的對數似然函數:

           VAE用識別模式(Encoder)q? (z |(i ))去逼近真實的后驗概率pθ (z |x (i ))衡量兩個分布的相似程度,我們一般采用KL散度,即:

           于是:
           其中:
           由于KL散度非負,當兩個分布一致時,KL散度為0,于是logpθ (x (i ) )≥(θ,;x (i ) ),其中(θ,;x (i ) )被稱為對數似然函數的變分下界。
           直接優化logpθ (x (i ) )是不可行的,因此一般轉而優化它的下界(θ,? ;x (i ) )。對應的,優化對數似然函數轉化為優化

           利用蒙特卡羅方法估計(θ,? ;x (i ) )期望,則:

           其中,為了計算假定識別模型q? ()可以寫成可微函數g? (?,),(i,) )=g? ((i,) ),(i )),為噪聲,(i,l )()。
           根據上面整個的算法推導流程,只有給定了?pθ (|),q? (|),pθ ()的分布以及可微函數g? (?,),VAE算法才能啟動,但是在實際應用中這些都是通過數據可以知道的,所以這里有如下假設:

    ()=(;0,)
    q? (z(i ) )=(;μ (i ),σ 2(i ) I)
    pθ ()=(;0,)
    (i,) )=g? ((i,) ,(i ) )=μ (i ),σ (i )?(l )
    pθ ((i ))=((i ) ;μ`(i ),σ`2() I)
           所以根據以上的假設分布,可以推算出:

     

    2 聚類
           聚類,是將一些物理的或抽象的對象,根據這些對象之間的相似程度,分為若干個簇類,并使得同一簇類內的數據對象具有較高的相似度,而不同簇類中的數據對象具有較大的相異度。聚類分析是一種無監督學習方法,在沒有任何先驗信息條件下,將現有無標記數據進行歸類,所以對于沒有標簽的數據能起到非常好的分類效果。
           目前,聚類分析算法有非常多的種類,比如基于劃分的算法(K-Mean等)、基于層次的算法(BIRCH等)、基于密度的算法(DBSCAN等)等。由于本文的數據特性和分布狀態,這里采用適合本文數據的K-Means算法。


    2.1 K-MEANS
           K-Means算法是無監督的聚類算法其基本思想為:已知一個包含N個樣本數據的數據集,以及給定聚類數目K,首先隨機選取K個樣本分別作為初始劃分的簇類中心,然后根據相似性度量函數采用迭代的方法,彭凱,汪偉等[3]提出了一種余弦距離度量學習算法,稱之為并結合一種偽近鄰分類算法實現對文本的分類。實驗結果表明,該算法可以有效地提高分類的精度。本文利用采用余弦相似度方法計算未劃分的樣本數據到每個聚類中心點的距離,并將該樣本數據劃分到與之最近的那個聚類中心所在的簇類中,對分配完的每一個簇類,通過計算該簇類內所有數據平均值不斷移動聚類中心,重新劃分聚類,直到類內誤差平方和最小且沒有變化時為止。假設簇劃分為(C1C2C3,?,C),則我們的目標函數是最小化平方誤差E:

           其中,μ是簇C的均值向量(質心),其表達式為:。K-Means算法流程如下圖5所示。

     

     
    圖5 K-Means流程圖

     

     

    3 實驗驗證
    3.1 實驗流程

     

    3.2 實驗數據
           本次實驗采用了仿真數據集,數據集大小為30萬個樣本,包含了10個特征,分別為:B1Mx、B2Mx、B3Mx、B1My、B2My、B3My、TowAccFA、TowAccSS、NacAccNod和NacAccRol。基本信息如下表1所示。

    表1數據描述信息表


    3.3 數據處理
           由于原始數據集中各個維度的數據其度量標準并不統一,分布形態各異,所以在數據建模之前必須適當的做一些數據預處理的工作,即數據歸一化。數據標準化是對原始數據的變換,使結果處理的數據符合標準正態分布,即均值為0,標準差為1,其轉化函數為:

           其中μ 為所有樣本數據的均值,σ 為所有樣本數據的標準差。經過數據標準化處理過后的數據使得各個數據處于同一量綱。處理后的數據分布如下圖6所示。

     


    圖6數據處理后的數據分布


    3.4 實驗結果
           訓練結果
           AE的實驗結果和VAE的實驗結果如下圖所示,當中分別比較了AE和VAE在Loss損失函數的變化、擬合優度(2)的大小、均方誤差(MSE)的大小,以及兩種網絡結構預測值和真實值之間的情況。
           首先,對于兩種網絡結構的Loss損失曲線來看,VAE網絡要比AE網絡的損失更小且更快收斂;其次,通過比較AE網絡和VAE網絡的擬合優度(2)方面的大小,發現VAE網絡要比AE網絡平均擬合優度要更高,AE擬合優度在95%左右,VAE的擬合優度在98%左右;最后,通過比較兩者對原始數據的均方誤差(MSE),VAE網絡MSE要比AE網絡的MSE方差較小、相對穩定。

     

      
    圖7 AE和AE的Loss曲線、R-Square曲線
     


    圖8 AE和AE的MS曲線


           如圖9和圖10所示是兩種網絡的預測值與真實值之間的關系,通過觀察兩者的數據曲線可以直觀地觀察到兩者對原始數據的擬合效果都很好,但VAE的效果優于AE的效果,且能全面的擬合。

     圖9 AE擬合值與真實值


     圖10 VAE擬合值與真實值


           測試結果
           在數據訓練完成后為了進一步的查看模型的實際效果,于是采用測試數據集來檢驗模型的效果。
           測試數據集大小一共25000個數據樣本,根據異常數據具有時頻性的特點,將前10000個樣本標記為正常數據,后15000個樣本標記為異常數據(含兩種異常)。將數據分別用AE和VAE兩種網絡進行計算,得出各自的誤差值變化曲線用來判斷正常數據和異常數據。通過比較AE和VAE兩種網絡對測試數據的得分可以看出AE網絡和VAE網絡都能區分正常異常數據,但相比之下VAE網絡的正異常值誤差得分區別更為明顯,判斷更為直觀,通過可視化能有效判斷出異常。

     

      

    圖11異常數據分布


           測試時通過人為標記的正異常標簽,利用混淆矩陣對測試結果進行評價。評價結果顯示AE準類率為83%,VAE的準確率為94%,如表2所示。


    表2 AE、VAE的混淆舉證

      AE混淆舉證 VAE混淆舉證
      0 1 0 1
    0 83% 17% 94%  6%
    1 17% 83% 6% 94%


       
    圖12 AE、VAE的混淆舉證


           綜上,分別利用AE和VAE兩種網絡對風力發電機組數據異常數據進行檢測,結果表明兩種網絡結構均可用來檢測異常數據,但相比之下VAE對擬合數據原始分布更有效,檢測異常值效果更好,整體準確率為94%。

    3.5 Mini Batch K-Means聚類
           由于AE和VAE兩種網絡進行的是無監督學習所以僅能檢測出異常值,而對于異常值屬于那種類型并不能完全得知,但是僅檢測出異常數據是不夠的,無法準確確定異常數據屬于那種類型所以并不能夠及時準確的拿出相應的解決辦法。由于數據不存在真實的標簽,所以利用聚類的算法來對未知的數據“分類”。
           在傳統的K-Means算法中,要計算所有的樣本點到所有的質心的距離,由于本文的樣本量很大,此時用傳統的K-Means算法非常的耗時這里遂采用Mini Batch K-Means也就是用樣本集中的一部分的樣本來做傳統的K-Means,這樣可以避免樣本量太大時的計算難題,算法收斂速度大大加快。當然此時的代價就是我們的聚類的精確度也會有一些降低。一般來說這個降低的幅度在可以接受的范圍之內。為了增加算法的準確性,在10次Mini Batch K-Means算法下,用得到不同的隨機采樣集來得到聚類簇,選擇其中最優的聚類簇。部分分類效果如下圖所示。 


    圖13Mini Batch K-Means分類效果


           從實驗結果可以看出Mini Batch K-Means能非常好的區分出經過VAE網絡篩選出的異常數據,最優結果并將其分為兩類。

     

    4 結論
           基于深度學習的葉片狀態異常檢測能夠判斷葉片異常狀態,其首先通過變分自編碼判斷葉片狀態是否異常,再通過K-Means聚類算法對葉片異常數據進行分類,進而識別具體葉片故障,該方法可對風力發電機組葉片實施狀態檢測與故障診斷,可以檢測葉片在運行過程中出現的故障,從而降低由于突發事故產生的不必要損失及停機維護檢修帶來的發電量損失,減少葉片維修維護成本。

     


    參考文獻
    [1]. Wainwright, M. J. and Jordan, M. I. (2008). Graphical models, exponential families, and variational inference. Foundations and Trends in Machine Learning, 1(1-2):1–305.
    [2]. DOERSCH C. Tutorial on Variational Autoencoders[J]. stat, 2016, 1050: 13.
    [3]. 彭凱,汪偉等基于余弦距離度量學習的偽近鄰文本分類算法計算機工程與設計,2013,34(6):2200-2211.
     

    首頁    新聞中心    公司新聞    基于深度學習的風機葉片狀態異常檢測
    尿眼bdsm奇特虐