12.22 智能製造|傳感器數據的重建

如果事情有變壞的可能,不管這種可能性有多小,它總會發生。

—— 墨菲定律


我們在前面的文章中,給出了一個開發預測性維護系統的總體流程。今天,我們從數據的源頭開始,討論一下工程實現可能碰到的第一個問題:傳感器數據的重建


在預測性維護場景下,我們的處理對象都是來自於傳感器或者其他手段獲取的時間序列,在信號處理領域叫做信號。而傳統機器學習或者分析方法都是基於點(沒有時間軸)的方法,與之大相徑庭。這是由預測性維護的數據特點決定的:數據來源於連續的傳感器採樣或者人工連續記錄。我們一般習慣上稱這一類的數據叫做工程數據,對應的分析方法叫工程數據分析


為了複用現有的基於點的處理方法,比如機器學習算法,我們需要把連續採樣的數據按照某種方法,比如滑窗法,轉化為適合於點的數據。比如圖. 1所示的信號中,我們幾乎無法直接觀察出足夠的信息。我們需要採用信號分析的方法和手段來提取信息,常見的包括時頻信號分析和小波分析。比如,我們可以從振動傳感器中提取出機械的轉動週期的隨時間的變化信息,以跟蹤機械設備的運轉狀態。

智能製造|傳感器數據的重建

Figure 1: 一對傳感器信號,幾乎不太可能從時域信號中直接得到有用的信息


本文中,我們將分析非均勻採樣帶來的影響,並討論如何非均勻採樣和樣點缺失進行信號重建,如下圖的綠色方框所示。

智能製造|傳感器數據的重建


一個預測性維護系統的預處理流程


非均勻採樣及其影響

現代的信號分析經過長時間的發展,幾乎所有現有能用的信號分析方法都基於均勻連續採樣。現實工程數據中,可能出現既非均勻,又非連續的數據。比如,一些歷史數據是通過人工採樣蒐集的,採樣時刻偏差幾乎一定會存在。即使我們採用傳感器蒐集數據,也可能因為干擾導致採樣點缺失,甚至出現大片數據丟失。而對於精度要求較高的場合,溫度等外界條件的變化也會導致晶振出現頻率漂移導致採樣偏差。


智能製造|傳感器數據的重建

Figure 2: 非理想採樣導致的數據丟失


非理想採樣數據不可避免,我們需要有相應的手段把非均勻採樣或者數據丟失引起的誤差控制在最小的範圍內。我們從一段理想信號的採樣分析開始,來看一看非均勻採樣對後續預處理潛在的干擾。


視頻中,我們在 40kHz 的採樣速率下,對兩個理想的正弦信號,頻率分別為 5kHz 和 15kHz 進行採樣,視頻是對在不同的採樣時間偏差(正態分佈)下的頻域的觀測結果。理想採樣情況下,應該是在 5kHz 和 15kHz 下的兩個尖脈衝。


左邊的尖峰和右邊的尖峰分別是沒有采樣干擾下的理想信號,非常尖銳,對其他的頻率干擾幾乎都抑制在 100dB 以下。而藍色功率和綠色功率譜分別是在相同的採樣偏差下的採樣信號。我們從這段視頻可以觀察到: 1. 隨著信號頻率的增加,相同採樣偏差帶來的信號功率損失增大。 2. 隨著信號頻率的增加,相同採樣偏差帶來的噪聲功率越大。3. 隨著採樣偏差的增加,相同的信號的功率損失增大,帶外噪聲隨之增加。

在預測性維護場景下,我們經常需要從一些緩變的信號裡尋求突變,比如機械故障可能給震動傳感器裡可以觀測到高頻的突發頻譜,採樣的噪聲和特徵混合在一起,無法通過傳統的濾波的方法濾除

非均勻採樣可能會導致一下問題:

1. 採樣噪聲增加,干擾特徵提取;

2. 增加數據的存儲量,我們需要同時存儲時間軸和幅度軸;

信號重採樣

從上面的簡單討論可知,非均勻採樣可能會在特徵處帶來額外的噪聲,導致我們提取的特徵失效。除非從源頭上保證均勻採樣,我們無法根除非均勻採樣帶來的噪聲,只能對齊均勻化最大限度保留有用信息。我們用 MATLAB 信號處理工具箱自帶的 resample 函數就可以實現信號的均勻化。


[y, ty] = resample(x, tx, 100, 'spline');


代碼裡的變量 x 和 tx 是非均勻採樣的信號的時間和幅度矢量,輸出 y 和 ty 是經過均勻化採樣以後的信號。我們需要針對不同的場景選擇合適的差值方法,這裡我們採用樣條插值來恢復信號。具體工程中,根據需求,我們也可以用其他方法實現重採樣。比如對於邊緣設備這些計算能力很差的嵌入式設備,我們可能會用更加簡單的線性差值方法重採樣。


智能製造|傳感器數據的重建

Figure 3: 不同頻率信號重採樣結果

這個圖展示的是對 10Hz 和 40Hz 的正弦信號的重採樣的功率譜。頻域中,較高頻率的正弦波(40 Hz)具有比較低頻率正弦波(10 Hz)更大的缺陷。在頻域顯示中,重採樣的 40Hz 正弦波具有大約-30dB 的基底噪聲,而重採樣的 10Hz 正弦波具有大約 -80dB 的基底噪聲。避免輸入信號中的高頻內容的一種方法是在執行隨機採樣時增加平均採樣率。請注意,如果只是增加重採樣輸出信號的採樣率,則無助於降低本底噪聲。

重採樣有助於儘可能保留信息,減少採樣噪聲帶來的干擾,減少信號的傳輸。而最後一點對於基於無線傳輸的設備意義重大。

丟失樣點的填充

在多個傳感器收集數據的情況下,通常會發現這種少量樣點丟失的信號。這種丟失的數據會零零散散分佈到信號的各個時間點,如果你把這類問題看成非均勻採樣的情況,採用簡單的重採樣操作就可以恢復信號,藍色的 x 點都是補齊的樣點:


智能製造|傳感器數據的重建

Figure 4: 少量樣點丟失的恢復


在某些特殊的條件下,我們會碰到信號較長寬度的缺損的問題。比如,傳感器停機幾秒後再次恢復,就會導致有一段連續的信號丟失的情況。技術上,我們可以採用跟蹤原始信號走勢,根據信號的歷史數據,構建出一些迴歸模型來填充大數據段。這類問題的處理方法多種多樣,其中 fillgaps 函數經常用於這個目的。


智能製造|傳感器數據的重建

Figure 5: 左側是重建前的數據,右側是重建之後的數據。這是一種基於統計學的重建方法,可以看到,二者的時域是有一定的差異的;如果從頻域來觀察,二者將十分相似。


結論

在預測性維護的第一步,信號採集中,我們可能碰到非均勻採樣和樣點丟失的問題。這類問題可能帶來對特徵提取的干擾,影響我們後續處理的精度,甚至於無法採用某些算法。本文中給出了一些簡單的解決方法。在真實的工程現場,我們可能碰到更加複雜的情況,需要綜合運用領域知識重建信號。重建出連續均勻信號有利於複用常用分析例程和壓縮數據,這一點對於 IoT 和邊緣設備尤其重要。


下一次,我們來探討一下如何通過時頻分析和可視化手段來探索傳感器數據特徵。


分享到:


相關文章: