基於關聯規則挖掘的多步長頻譜佔用預測方法

認知無線電技術提高了系統的頻譜利用率,然而在傳統頻譜感知中,認知用戶對所有頻帶進行感知會造成大量的能量損耗和處理時延,因此如何準確預測空間頻譜佔用情況,即頻譜預測技術,受到研究人員的廣泛研究。頻譜預測技術能夠為認知用戶提供更好的頻譜接入條件,減少認知用戶和主用戶之間產生的數據傳輸衝突,避免對主用戶通信造成干擾,降低響應時延,增加網絡的吞吐量

[1]。頻譜預測過程一般包含3個步驟:(1)數據採集,實際頻譜採集或建立仿真頻譜模型生成;(2)數據預處理,有效數據選取、信號與噪聲的分離;(3)頻譜預測,設計頻譜預測方法進行預測。

設計有效的頻譜預測方法需考慮預測機制與預測方法兩方面:預測機制大多是採用時隙通信模式,將每個時隙的頻譜佔用或空閒情況定義為一個二元時間序列,通過分析歷史數據獲取頻譜使用規律,進而預測未來頻譜佔用狀態[2];頻譜預測方法主要有基於隱馬爾可夫(Hidden Markov Model,HMM)的方法[3]、基於自迴歸移動平均模型(Autoregressive Integrated Moving Average,ARIMA)的方法[4]、基於神經網絡的方法[5]、基於的方法等[6]。基於關聯規則挖掘的方法在頻譜預測中性能表現較好,這類方法又包括基於部分週期模式挖掘的方法[6]、基於貝葉斯的方法[7]、應用統計學習的方法[8]以及最大子模式命中

[9]等。

在實際頻譜預測應用中,往往不僅需要預測下一個時隙的頻譜佔用情況,而且需要預測多個時隙一分鐘甚至一小時的頻譜佔用情況,進而統計分析信道的可用性,避免頻繁切換信道。現有方法只能保證下一個時隙的一步預測效果較為理想,而多時隙多步預測存在效果下降較快的問題。針對這一問題,本文借鑑Apriori算法中查找頻繁項集的思想,提出基於關聯規則挖掘的多步長頻譜佔用預測方法,通過採集真實數據對所提出方法進行實驗驗證。

1 頻譜佔用度

1.1 頻譜佔用度預測用數據選取

信道頻譜佔用度可以體現頻譜的活躍程度,信道頻譜活躍程度對驗證方法的可行性十分關鍵。若信道頻譜佔用度極低(0%~5%),數據處理後生成的信道狀態信息(Channel State Information,CSI)序列將近似為全0序列;若信道頻譜佔用度極高(95%~100%),生成的CSI序列將近似為全1序列,對這些信道進行CSI序列預測得到的結果極為可觀,正確率可達到90%以上,丟失率接近0。但這兩種極端情況都將使得CSI信道活躍度降低,即0/1狀態的轉換頻率變低,此時頻譜佔用預測也將失去意義。故本文選取頻譜佔用度35%~94%的信道進行預測分析。信道佔用度計算方法如式(1)所示:

其中,Fco表示信道佔用度,Tf表示信道佔用時間,T表示信道測量時間。

1.2 頻譜佔用度閾值選取

頻譜佔用狀態只有兩種:佔用和空閒。通常,信道頻譜強度高於某門限,則認為信道處於被佔用狀態,用“1”表示;相反,認為信道處於空閒狀態,用“0”表示,轉換原理如式(2)所示:

其中,cs表示信道狀態,PC表示信道電平值,PO表示預設門限值。該過程中如果預設門限值設置較小,則某些噪聲信號將被誤認為是有用信號;若門限設置較高,則會遺漏有用信號,因此頻譜佔用度閾值的選取是數據預處理過程較為關鍵的步驟。

本文采用動態門限分割[10]的方法確定頻譜佔用度門限,方法流程如圖1所示。

動態門限分割方法涉及兩個參數,一個是用於信噪分離的判別值,另一個是噪聲曲線平滑處理的次數。在《超短波頻段佔用度測試技術規範》中,建議門限電平設置為各頻段內當地接收機平均功率電平或電壓指示以上5 dB。在無線電監測工作中,一般把超過噪聲電平3 dB~5 dB的頻點視為信號。基於以上兩點,本文采用5 dB作為信噪分離的判別值,平滑處理次數取60,動態門限如圖2所示。

基于关联规则挖掘的多步长频谱占用预测方法

圖2(a)信道編號為3,統計電平值較低,多數集中在-76.45 dBm左右,且處於動態判決門限以下,被認定為噪聲信道;圖2(b)信道編號為61,統計電平值較高,多數集中在-67.45 dBm左右,且處於動態判決門限以上,被認定為信號信道。

各個信道的幅度-頻率信號被動態門限分割之後就形成了CSI矩陣,如圖3所示(圖中黑色實心方塊表示當前CSI=1,空白處則表示CSI=0)。

基于关联规则挖掘的多步长频谱占用预测方法

2 算法原理

2.1 時間序列關聯規則挖掘算法

Apriori算法[6]是關聯規則挖掘算法中經典的算法,多用於非時序項集。算法一般分為兩部,一是生成頻繁模式,二是根據頻繁模式生成關聯規則。而使用該算法處理時間序列數據時,必須對序列進行模式劃分。對序列進行模式劃分時,每次取一部分數據進行時間序列關聯規則計算,然後向後滑動一個窗口,產生一個新的事務,再次計算時間序列關聯規則。保持每個事務窗口一致,這樣可以使當前事務區別於上一個事務,同時又不會漏掉可能產生的時間序列特徵組合,如圖4所示。

時間序列關聯規則挖掘過程中有兩個重要判決條件:(1)當模式出現次數N大於最小支持度時,生成頻繁模式;(2)頻繁模式轉移率P大於最小置信度時,生成關聯規則,如圖5所示。

基于关联规则挖掘的多步长频谱占用预测方法

2.2 基於關聯規則挖掘的多步長頻譜佔用預測算法

本節將使用上文方法生成的關聯規則進行多步長頻譜佔用預測。

本文算法涉及概念和符號見表1。

基于关联规则挖掘的多步长频谱占用预测方法

輸入:原始幅度頻率數據(File_level)。

輸出:預測的準確率以及丟失率。

(1)將原始幅度頻率數據通過動態門限分割、信道分割,生成由0和1組成的CSI序列。

(2)當生成的CSI序列長度大於跨度L時,檢測序列中異常值的情況,進行基於關聯規則挖掘的多步長頻譜佔用預測。

(3)對預測結果與實際監測結果進行對比,統計預測準確率和丟失率。

算法中輸入的原始數據為401×n的矩陣(File_level),n為採集數據的時隙數(本文時隙間隔為1 s),通過動態門限分割以及信道編號(1~401)的選擇,形成單一信道的CSI序列。頻繁項跨度(FrQ_length)限定了頻繁子序列長度的最大值,取值範圍可設為1~n之中的任意整數值,當其設為1時,算法可近似於兩狀態馬爾可夫過程;當其設置為接近n時,頻繁項數量太少,算法失效,故本文取10%n。最小支持度(Min_sup)與最小置信度(Min_conf)體現了頻繁項的頻繁程度以及規則的可靠性。最小預測長度(Min_span)的設定可以減少頻繁子序列生成規則的數量,提升算法效率和精度。

關聯規則是頻譜佔用預測的主要依據。項集統計數大於Min_sup即為頻繁項,若頻繁項A統計數為a、頻繁項B統計數為b,則轉移率Pab=a/b,當Pab大於Min_conf時產生強關聯規則,即當前序列為A時,預測結果為B的概率為Pab

圖6為多步長頻譜佔用預測算法流程。

基于关联规则挖掘的多步长频谱占用预测方法

在多步長預測過程中,算法沒有在規則中找到適合的規則,則記為一次丟失,輸出“-1”,即異常值,異常值的出現會影響下一次的預測,所以要進行異常值替換,每個異常值“-1”都會分兩次替換成“0”或“1”,例如序列[1 0 -1 0]會替換成[1 0 0 0]和[1 0 1 0],由這兩個序列查找關聯規則中置信度最高的規則進行預測或者繼續丟失,即如果有m個異常值,則要進行2m次替換,最終由替換後的序列置信度最高值進行預測或者繼續丟失。若Pred_length>1,即多步長,步長遞增過程如圖7所示,圖中標註下劃線並加粗的字符為預測序列值,算法使用預測結果更新CSI序列,直至完成多步長預測算法。

若當前序列滿足預測條件,記預測次數(Predict)加1;若預測結果與下一時隙狀態序列相同,記預測正確次數(Correct)加1;若最終沒有找到滿足預測條件的關聯規則,記丟失次數(Loss)加1,丟失率記為Loss_Rate,公式如下:

基于关联规则挖掘的多步长频谱占用预测方法

3 實驗及分析

3.1 數據採集與預處理

本文中的頻譜監測數據來自北京航空航天大學學院路校區連續約48 h(2018年12月22日16時22分~2018年12月24日16時25分)頻段為88 MHz~108 MHz,即調頻FM廣播業務頻段進行監測,監測設備包括是德公司E4407b頻譜分析儀、PC以及SAS-521F-2接收天線,表2列出了監測參數。

基于关联规则挖掘的多步长频谱占用预测方法

頻譜儀每次掃描空間頻譜獲得400個頻譜採樣點,在監測時間內每一秒形成一個“場強-頻率”對應關係的文本數據文件,因此每小時產生3 600個數據集。

數據的選取對預測模型的學習效果有著極為重要的影響,合適的數據能夠為提高預測模型的正確率提供良好的支持。正常情況下,頻譜的短期變化趨勢是連續的,而長期變化具有明顯的週期性,週期性具體體現在日、星期、年週期性以及節假日特性。為了提高信道頻譜佔用預測精度,在數據選擇時應考慮這一週期性特點。故本文采用第一天100時隙作為訓練集,第二天相同時間的100時隙作為測試集。

圖8為對所採集到的頻譜數據進行“場強-頻率-時間”三維可視化處理結果。

基于关联规则挖掘的多步长频谱占用预测方法

3.2 主要參數分析

3.2.1 多步長對預測結果的影響

圖9和圖10分別展示了13號和86號信道中預測步長對預測結果的影響。

基于关联规则挖掘的多步长频谱占用预测方法
基于关联规则挖掘的多步长频谱占用预测方法

通過信道13和信道86的10步預測結果可見,隨著預測步長的增加,預測丟失率逐漸減少,雖然預測正確率也隨步長增加呈下降趨勢,但下降趨勢較緩,總預測正確率由於丟失率的逐漸減少,隨預測步長的增加呈略微上升的趨勢。可見該算法在多步長預測中有效減少丟失率的同時,保持了較高的預測正確率。

3.2.2 信道佔用度對預測結果的影響

本實驗中選取了佔用度由35%到94%依次升高的6個信道。圖11展示了預測步長為1和10的結果。

基于关联规则挖掘的多步长频谱占用预测方法

從圖11中可以看出,總體上信道佔用預測正確率保持較高的水準,其丟失率沒有隨著佔用度的變化有正相關或者負相關的規律。由此可見總體上算法體現出了良好的性能,信道佔用度的變化對預測結果的影響不大。

3.2.3 規則置信度對預測結果的影響

圖12(a)和圖12(b)分別展示了3個信道在最小置信度為0.7、0.8和0.9時的正確率和丟失率。

基于关联规则挖掘的多步长频谱占用预测方法

從圖12中可以看出,隨著最小置信度由0.7升高至0.9,丟失率由15%左右升高至40%左右。可見,最小置信度的設置對丟失率影響很大,這是由於隨著最小置信度的升高,可用的關聯規則逐漸減少,即信道信息的可預測性降低。預測正確率隨最小置信度的提高緩慢升高,而預測丟失率則隨最小置信度的提高急劇升高,因此,設置適合的最小置信度對CSI序列的可預測性至關重要。

4 結論

本文提出類Apriori算法的頻繁模式關聯規則挖掘算法,實現對信道佔用狀態的多步長預測。實驗表明,該算法在實際頻譜預測中相比隱馬爾科夫模型和神經網絡模型等預測方法,不需要任何先驗知識,可根據歷史數據進行快速預測,達到了較好的預測效果。

參考文獻

[1] 劉鎮鳴,龔曉峰.認知無線電中頻譜預測方法[J].兵工自動化,2017,36(9):86-89.

[2] 尹斯星.認知無線電中基於海量頻譜監測數據挖掘的動態頻譜接入策略研究[D].北京:北京郵電大學,2010.

[3] 張凱,齊麗娜.一種基於隱馬爾可夫模型的自適應聯合頻譜預測方法[J].南京郵電大學學報(自然科學版),2015,35(1):79-83.

[4] 段洪濤,曾繁聲,李景春.一種預測頻段佔用度的時間序列分析方法[J].無線電工程,2011,41(7):17-20,64.

[5] 楊健,趙杭生,陳曦.遺傳算法優化的神經網絡頻譜預測模型訓練[J].解放軍理工大學學報(自然科學版),2016,17(6):505-511.

[6] 滿方微,石榮,何彬彬.基於關聯規則挖掘的無線電頻譜佔用預測[J].電訊技術,2016,56(11):1183-1188.

[7] HUANG P,LIU C,YANG X,et al.Wireless spectrum occupancy prediction based on partial periodic pattern mining[J].IEEE Transactions on Parallel and Distributed Systems,2014,25(7):1925-1934.

[8] JACOB J,JOSE B R,MATHEW J.Spectrum prediction in cognitive radio networks: a bayesian approach[C].2014 Eighth International Conference on Next Generation Mobile Apps,Services and Technologies,Oxford,2014:203-208.

[9] MAN F,SHI R,HE B.The data mining in wireless spectrum monitoring application[C].2017 IEEE 2nd International Conference on Big Data Analysis(ICBDA),Beijing,2017:223-227.

[10] 丁浩,沈文靜.基於動態門限電平的短波段頻譜佔用度測量[C].2011全國無線及移動通信學術大會論文集,2011:408-411.

作者信息:

荊 通1,丁文銳1,2,劉春輝2

(1.北京航空航天大學 電子信息工程學院,北京100191;2.北京航空航天大學 無人系統研究院,北京100191)


分享到:


相關文章: