如何利用雪球、微博等平臺的炒股大V,打造賺錢機器

由於之前處理過用戶評論的情感分析,又研究過一點點量化投資,所以,最近突發奇想了一個投資策略。雖然還沒有進行實踐,但從邏輯推導上來看,還是非常自恰的。

我想通過本文和大家分享一下這個投資策略,提供給大家一個炒股的新視角。同時,也希望得到大家的意見和反饋,來彌補盲區。

中國股市是一個散戶居多的市場,很容易受到消息和情緒的影響,會直接反映在股價的漲跌上,一個利好的消息,很可能快速拉昇一隻股票,而一個利空的消息,就很可能導致快速下跌,即追漲殺跌

如何利用雪球、微博等平臺的炒股大V,打造賺錢機器

割韭菜

而這類利好消息的源頭是如何傳播出去的呢?

  • 首先,上市公司披露的公告和財務報表是最真實、最穩定的信息源。
  • 其次,各個投資機構的分析報告,雖然非常有效,但散戶極難獲取。
  • 最後,眾多的投資領域的意見領袖(大V),所發表的文章、短訊等。

散戶想要讀懂上市公司的公告和財報,是非常困難的,需要很強的財務專業知識,而且還需要花費大量的時間和精力。所以,只有極少數的散戶會自己閱讀公司的財報,來進行投資決策。

對於普通的散戶來講,投資機構的分析報告,既不容易獲得,又晦澀難懂。因此,這條信息通路也被阻斷了。

綜上所述,散戶獲取消息的最常見方式,就是通過關注大V,閱讀TA們的文章和短訊,來對股票進行判斷和投資。同時,大V之所以被稱之為大V,必定有其專業性,或熟悉行業,或瞭解財報等。

那麼,可想而知,大V們的投資建議,一定會影響到廣大散戶的投資決策,也就會有一箇中短期的、較確定的收益預期。

如何利用雪球、微博等平臺的炒股大V,打造賺錢機器

雪球截圖

然而,這樣的收益預期對於普通的散戶來說,存在兩個問題:

  1. 信息的延遲,信息在社交網絡中傳播,是有延遲的。同一個消息,並不是所有散戶都能在同一時間內閱讀,一定存在時差。
  2. 信息的衝突,同樣的一個消息,不同的大V可能會有完全不同的解讀,這就會導致衝突,讓散戶做出不同的抉擇。

這兩個問題會產生一定程度的信息差,也就孕育出了投機的機會。如果我們能夠開發一個系統,領先絕大多數散戶,優先分析好大V們的數據,並提前進場,那麼就可以享受到信息差帶來的紅利。

關於這個量化策略的具體步驟,我大體整理了一下:

1. 通過雪球、微博、微信、知乎等平臺,收集投資領域的大V

在綜合類的社區裡,一定會有許多聊股票的大V存在,我們可以通過微博、微信公眾號、知乎等平臺找到TA們,並記錄下TA們的用戶信息(用戶名、用戶ID)。

而雪球作為一個關於股票投資領域的垂直社區,更是值得我們重點關注。

我們可以制定一個標準,為不同的平臺、不同的大V分配不同的權重,以便更準確地衡量其影響力,比如:粉絲數、互動數、發文頻率等。

這樣,我們就有了一個帶權重的大V列表,作為我們爬取的目標。

2. 定時爬取大V的文章、短訊等信息

如果對應的平臺提供了相關的API接口,哪怕是付費的,最好也是使用API接口,主要是因為其穩定性有保障,避免爬蟲被屏蔽或失效,畢竟這是涉及到量化投資的,對及時性、穩定性要求極高。

這樣,我們就可以完成大規模、高效率的數據採集,在第一時間獲得各個大V的第一手信息,要遠遠領先於絕大多數的散戶。

3. 分析文本里的股票漲跌

雖然這裡分析的是股票漲跌,但原理與文本的情感分析是相同的。我之前寫過一篇介紹情感分析的文章, ,裡面講解了做情感分析的方法,大家可以看一看。

我們需要兩份詞典數據,分別是:

  • 股票名稱及代碼詞典
  • 看漲看跌的相關詞彙

股票名稱及代碼

通過股票名稱或股票代碼,來幫助我們篩選出討論股票的文本片段出來,屏蔽掉一些無關的信息,比如:大V的日常、生活感悟等。

而且,還可以讓量化交易系統聚焦到具體的某隻股票,並自動化完成後續的交易操作。

需要特別注意的是:需要對股票名稱進行統一化,因為很多股票都有多個不同的叫法,比如:茅臺、貴州茅臺等。這樣可以最大限度匹配上正確的股票,避免遺漏。

看漲看跌詞彙

這與情感分析的情感詞很類似,都是用來表達對於某件事物態度的詞彙。而股票的看漲看跌會有一些自己特有的詞彙,需要我們人工進行整理,這裡舉一些簡單的例子:

看漲的詞彙:

  • 利好
  • 紅利
  • 價值窪地

看跌的詞彙:

  • 利空
  • 空頭
  • 高估

我們還可以為這些詞彙分配一個權重,以衡量其折射出的“情感”程度,能更準確地對漲跌進行預測。

有了這兩份詞典之後,就涉及到了文本的分詞,並且分詞的好壞直接影響著最後的分析效果,是非常重要的一環。之前我寫過一本掘金小冊《深入理解NLP的中文分詞:從原理到實踐》(點擊瞭解更多,訪問詳情),裡面詳細講解了NLP的中文分詞技術,可以看一看。

此時,我們就可以提取出文本中所涉及的股票,並綜合各個大V的看法,生成一份後市看漲的股票名單。同時,還可以設置一個閾值,只保留那些把握更大的、更多大V看好的股票。

4. 回測、模擬盤測試

雖然我們已經有了後市看漲的股票名單,但也不要急於投資,畢竟是涉及到真金白銀,還是要非常謹慎的。

現在,有很多量化交易的平臺提供了回測的功能。所以,我們可以使用大V的歷史數據,並結合歷史交易數據進行回測,來看看我們的策略是否有效,並且可以有效發現分析中存在的問題。

回測的時候,我們還需要一些其它的投資策略,要做好資金管理,也要設置好止損點和止盈點,因為不可能保證每一次都一定漲,只是看漲的概率要遠大於看跌的概率而已,所以,需要承受一定的回撤風險。

如果一切順利的話,那麼就可以在模擬盤進行測試了,也就是同步的實時交易,以保證策略的時效性。

回測就好比互聯網公司的仿真環境,由內部測試人員進行測試,而模擬盤測試就是小流量測試。

5. 上線量化交易策略

由於人會受到心理作用的影響,比如:恐懼、貪婪、損失厭惡、僥倖心理等等。所以,一旦證明了策略的有效性之後,就需要大膽地將交易操作交給機器去完成。

而我們最主要的是做好資金管理,並在策略超過有效期之後,再對策略進行評估、優化。

這一點十分重要,很多人投資股票失敗,都是因為受情緒的影響太大,而我們的這個策略,恰恰是利用了這一點。

總結

通過這個量化策略的腦洞,會發現NLP的情感分析,去可以做很多事情,比如:追求女神或男神時,可以分析TA的微博、微信,及時分析出TA什麼時候,容易情緒低落,需要人安慰。

很多時候,技術賦能就會形成降維打擊,對於普通人來講,幾乎沒有任何反抗的機會。所以,我們要想成為遊戲規則的制定者,就需要不斷提升自己,完成蛻變。

最後,安利大家一本掘金小冊《深入理解NLP的中文分詞:從原理到實踐》(點擊瞭解更多,訪問詳情),讓你從零掌握中文分詞技術,踏入NLP的大門。

如果因為以上內容對你所幫助,請幫忙點個贊、評個論、轉個發,多謝多謝!


分享到:


相關文章: