重磅!「阿甘金融-滬深300指數預測模型」今天公示!

重磅!“阿甘金融-滬深300指數預測模型”今天公示!

阿甘金融通過人工智能方法,對滬深300指數進行遠期預測的宏觀模型正式上線!

這個模型經訓練後,在對2017年5月至2018年6月的滬深300指數(測試集)進行三個月的方向性預測時,準確率為84%。

今天,我們把未來三個月的”滬深300指數預測”,做第一次發佈。

我們為什麼要做這麼一個模型出來呢?

因為,預測是人類探索未知的本能。

相當多人,知道老拙在嘗試這樣一個模型,都微笑地頗有深意。

是啊,多少人都嘗試做出一個預知未來的水晶球,最終卻吃了滿地的碎玻璃。

K線預測是入門者常用的方法,通過市場過去的走勢來預測市場未來的走勢。

K線預測的一個潛在假設就是:外部因素保持不變,影響市場走勢的主要是成交量和價格。

但當外部因素髮生改變時,K線預測就變得不太靠譜,或相當不靠譜。

相當多更有經驗的投資者,往往因此成為市場的不可知論者。他們認為既然市場難以預測,還不如把所有的精力都放在公司分析上,這樣的勝率似乎更大。

換句話說,他們放棄了對系統性風險,即“貝塔”的預測,轉而把精力放在對個體風險,即“阿爾法”的預測上。

但好奇是人類的本能。只要事物的發展存在規律,那麼就一定會有人,嘗試對這些規律進行總結與延伸。

既然資本市場受宏觀,政策、市場和情緒的影響,我們也同樣可以嘗試。

新技術給了我們更多預測的可能

2016年,困擾老拙的一個最大問題,就是如何在新三板一萬多家公司中,找到合適的對標企業。

最終,我們採取了機器學習的方法,通過文本分析,不斷對三板公司公開轉讓說明書和年報中的文本數據進行訓練,並最終形成了自己的聚類標準。

這就是我們“阿甘金融網”上的“同類推薦”功能:搜索任何一家三板公司,我們都能準確地向您推薦出與其業務最相近的其它三板公司。

用比較時尚的說法,這就是“人工智能”。

人工智能天然適合於金融,因為金融領域的數據量大,適合機器的深度學習。

正是在第一次成功的激勵下,我們開始向宏觀預測延伸。

我們的預測模型是如何建立的?

我們這個模型設計團隊,只兩個人。一個是老拙,另一個是人工智能工程師重重。

在設計模型時,我們就定下這麼一個原則:只預測市場的方向,不預測市場的漲跌幅。也就是說,我們把自己的預測,嚴格侷限在有限的數據和能力範圍之內。

我們耗費了整整四個月的時間來篩選數據,構建模型。

在我們的模型中,共計有93個自變量。其中既包括外部宏觀數據,如shibor利率,匯率,國債收益率,票據貼現率等;也包括市場本身的數據,如各板塊指數,成交量,指數市盈率等等。

由於這93個變量本身無法滿足PSI(群體穩定性指標)閾值篩選,因此重重又對其做了特徵工程,從中再分別提取兩個變量之間的變動關係,得到新變量,再進行某些變化處理。

處理後,這93個特徵變量衍生出接近6萬個變量。先經PSI篩選後剩餘5000個,再經KS(正負樣本的區分程度)篩選,餘下800個。

我們以2013年1月至2017年5月的數據為訓練集,2017年5月至2018年6月的數據為測試集,進行模型篩選。在不同時間窗口,篩出了不同的變量。其預測結果如下:

重磅!“阿甘金融-滬深300指數預測模型”今天公示!

總體而言,預測的時間窗口越長,對指數漲跌預測的準確率就越高。

而且,預測的時間窗口越長,所需的變量個數也在不規則的減少。

如果只預測第二天的滬深300走勢,測試集準確率只有63.4%,比隨機數50%要高一些。但如果預測未來一個月的指數漲跌,準確率就提高到了66.6%。到了未來三個月,準確率更提高至80%左右。

在短期預測模型中,銀行間市場的數據貢獻較大;但在長期預測模型中,匯率、國債收益率,甚至於美國的某些數據,也會產生較大影響。

這個模型是如何一步步發展起來的?

最初,老拙把自己在實踐中經常使用的,與市場的漲跌存在因果關係的中國宏觀變量:如貨幣,社融,利率,GDP,投資額,發電量,運輸量等,設為自變量。把滬深300指數的變動,設為因變量,進行嚴格回溯。訓練出的模型,預測準確率徘徊在55%-57%之間,只比隨機拋硬幣高一些而已;

隨後,我們進行了變量之間複雜的特徵處理,耗費了接近兩個月的時間,把準確率提高到接近60%;

再後,我們把市場內的因子,如成交量,成交額,市盈率,其它板塊指數等等,也加入到自變量當中,進行回溯。模型預測的準確率,提高到60%以上;

接著,出於開放宏觀的考慮,我們把一些重要的國外指標,如美國國債收益率,原油和黃金的價格等,引入到變量當中,模型預測準確率提高至65%;

最後,我們把預測週期從之前的一個月延長到兩個月更至三個月,突然發現準確率有了大幅提升。

不否認,我們沒有把更多的手段都公開出來,但總體思路大致如此。

既然,已經有了這個宏觀預測模型,今後三個月,市場將走向哪裡?

如果我們以8月3日滬深300指數的收盤價為3315點為基準日,那麼:

重磅!“阿甘金融-滬深300指數預測模型”今天公示!

即接下來的三個月,市場大幅上揚的概率較低。

因為是第一次預測,我們並沒有把極端情況公示出來,而是做了平滑處理。

請不要苛責它的準確率

這是我們阿甘金融的一小步,把它公開,就是為了做一個公開驗證。

請記住,這裡有兩個影響市場的關鍵因素沒被放進去:一個是宏觀政策,另一個是市場情緒。

因此,我們需要每個月,都對預測值進行調整。但為了保持第一次預測記錄不被人為篡改,我們會以“第一次預測”,“第二次預測”來做區分。

如果我們的預測不準確,也沒什麼好難為情的,人類對未知的探索,基本都是以失敗告終。

如果有幸某些時候比較準確,也沒什麼好高興的。懂金融的聰明人常在,略加思考就能搞出一個新的模型。我們這個模型所帶來的信息優勢,會在不遠的將來消失。

最後,用這個模型是否能賺錢?

當然有可能。

不否認,我們未來可能會設立一個股指實證賬戶,對我們模型的有效性進行公開驗證。

但凡想孤注一擲,靠水晶球謀生的人,最終註定會吃下掉在地上的碎玻璃。

這個模型的更大意義,是在大家主觀判斷的同時,再給一個新的角度。

而且,如果您過去只是根據宏觀經濟指標來預測市場的話,我們相信,模型一定會比您更準確。

換句話說,您完全可以把宏觀經濟的影響判斷交給模型,而把宏觀政策和市場情緒的影響判斷交給自己。

這樣,就完美了。

原文鏈接:

https://www.aganjinrong.com/post/940

---End---

作者:老拙,白俄羅斯大學法學碩士、北大國際工商管理碩士、北大在讀金融學博士,擁有多重專業背景和超過20年從業經驗的資本市場老炮兒。原文發佈於阿甘社區。


分享到:


相關文章: