從圍棋到量化投資,不懂金融的DeltaGrad跑贏95%基金經理人

从围棋到量化投资,不懂金融的DeltaGrad跑赢95%基金经理人

“我們發明了能跑贏95%股票型基金的AI經理人”,4月18日人工智能公司DeltaGrad首次向外界展示其研究實踐成果:

數據顯示,DeltaGrad自2017年11月以來,以自有資金進行A股的量化投資,截至2018年12月,錄得交易累計業績為:收益率6.19%;同期上證指數下跌30.10%,深證指數下跌41.18%,創業板指數下跌38.58%——DeltaGrad全面跑贏大盤。此外,結合私募排排網、東方財富Choice等公開數據比對,DeltaGrad投資收益率超越了同期市場上95%的股票型基金。

DeltaGrad創始人龐然在接受億歐金融採訪時透露,DeltaGrad將於2019年正式開始對外商業化運作,專注人工智能應用於股票及期貨市場的投資策略輸出。

從計算機圍棋到量化投資

“DeltaGrad是目前國內較早的把AlphaGo技術應用在金融投資領域的人工智能公司。”

在這句開場白後,“AlphaGo”幾乎成為整個採訪過程中被提及頻率最高的一個詞。

2016年3月15日,李世石以1:4的比分慘敗人工智能AlphaGo,這次事件可以理解為人工智能領域的里程碑,人們終於找到了賦予機器直覺能力的關鍵。龐然解釋,傳統想用“窮盡”的方法,將人類下圍棋的邏輯梳理成策略算法是不可能的,因為圍棋中的可能性堪比宇宙中所有的原子總和。而AlphaGo的成功則說明,用深度學習網絡的算法,機器已經一定程度上擁有了“直覺”。

此後,只用到了一臺機器和4個TPU,經過幾天的訓練,AlphaGo Zero以100:0擊敗了AlphaGo。這是神經網絡算法的又一次提升,甚至不需要人類提供棋譜數據,AlphaGo Zero從單一神經網絡開始,通過神經網絡強大的搜索算法,在自我對弈中實現了迭代學習。

受AlphaGo的啟發,龐然帶領從未涉足過二級市場的團隊開啟了神經網絡技術賦能金融投資的探索。也許DeltaGrad團隊並不懂量化投資,但他們所訓練出來的股票機器人卻懂,神經網絡就像一個黑盒,人們也許並不理解“機器人是怎麼思考”的,只能等待時間來證明它們“思考”結果的對錯。

什麼是神經網絡

龐然表示:“我們不止在訓練機器的理性思考能力,通過數據的不斷升級與神經網絡的優化,我們也在逐步訓練讓機器擁有自主的直覺思考能力。”

通俗來講,神經網絡就是一個可升級的簡易人腦。第一次給神經網絡輸入一個信息時,神經網絡裡只有部分的神經元被激活或者被激勵,被激活的神經元傳遞下去的信息是計算機最為重視或被認為最有價值的信息,如果輸出結果是錯誤的,經過誤差反向傳遞對所有神經元參數進行調整,使得所有神經元的參數變得對真正重要的信息特徵更加敏感,經過大量的信息訓練,被改動的參數就能漸漸預測出正確的答案。每一次錯誤預測的反向回饋,都會使這個神經網絡進化得更加聰明一點,信息的維度越豐富,訓練的數據量越大,輸出的結果就越精確。

目前,DeltaGrad已經研發出10個神經網絡結構模型。每一個模型機器人,對應著一種神經網絡結構和數據的組合,DeltaGrad通過各種股票數據去刺激這些機器大腦,以激發它們股票投資領域天賦。因此,每個機器人會從不同視角,同時審視相同的股票、板塊和指數,得出更加多維的預測。一個DeltaGrad的股票機器人,足以完成多個基金經理的業務角色,可以對股票市場的數據分析並生成策略。

領先1年等於領先120萬年

在採訪中,DeltaGrad透露,目前正在籌備搭建世界第一個供機器人自主進化的虛擬交易市場,以龐大“數據”為核心。不依託人類現有市場交易數據,通過機器人交易自博弈來推演出更多交易數據。從而產生海量交易的數據,幫助機器實現更快的自主進化。每個DeltaGrad股票機器人能產生70萬-120萬的策略數,每個策略表示一種使用機器人預測能力的操盤方法,每一個策略對應一個回測過的風險收益數值。當前已經完成的10個機器人共能產生1000萬+的策略數,每天機器組合的調倉、增加備選股票,都依據這些策略數值進行。平均一年時間就可以推演出上海證券交易120萬年交易數據。

未來DeltaGrad也會向市場開放同樣的策略開發平臺,不僅能夠用歷史30年的數據供策略設計者進行回測,還能用DeltaGrad私有的虛擬市場交易數據進行回測。

“黑天鵝”事件又該如何抵禦?

對此,龐然為億歐金融表示:AI經理人和人類基金經理人最大的一個區別就在於,人類基金經理人精力有限,只能關注幾隻、幾十只股票,而AI經理人所關注的股票可以達到上千只,當風險足夠分散的時候,單隻股票的波動影響已經可以控制在可接受的範圍內,不會影響總體的收益率。

此外,儘管AI自我博弈能夠產生龐大的數據量,但這些數據是否能夠覆蓋足夠的維度?人們又如何能夠被說服,去信任自己所無法理解的機器做出來的決策呢?

這兩個問題,也許只有時間能給出答案。


分享到:


相關文章: