40億押注AI,浙報集團大手筆轉型有勝算嗎?

40億押注AI,浙報集團大手筆轉型有勝算嗎?

氫媒Leo劉尊

同是作為一家媒體,浙報集團的打法似乎跟其他人都有點“格格不入”,先是靠手遊實現盈利,並對紙媒進行反哺,接著通過VC、PE等非媒體的資本方式狂攬收入,成為了國內最富有的報業集團之一。而如今,浙報又瞄準了下一個領域:AI。

先來看AI行業一個大新聞:創新工場聯合創始人、管理合夥人汪華表示,創新工場將與浙報數字文化集團股份有限公司(A股上市公司,簡稱“浙數文化”)共同成立40億元人民幣的人工智能產業投資基金,這個基金將落戶杭州。

此外,汪華還在接受氫媒工場採訪時候透露,創新工場此後將重點佈局AI,而在國內的主要AI投資,都將集中在與浙報數字文化集團合作的AI基金上。

這裡需要強調的是,浙數文化有多年全國範圍孵化投資經驗,和旗下大數據交易中心、互聯網數據中心、大數據產業園的整合資源。這一點下文會再提到,這對本次思想實驗相當重要。

這個思想實驗源於原中共浙江省委常委、杭州市委書記王國平在本次GMIC會上的一句話:“今天我們所面臨的人工智能的時代,和17年以前我們第一次到阿里巴巴去,杭州中國面臨著互聯網經濟的時代,電子商務的時代是完全一樣的。”

換而言之,在王國平看來,17年前的互聯網經濟造就了阿里巴巴。我們順著這個思路開始思想實驗:17年後的人工智能經濟,造就將的下一個阿里巴巴在哪?如今40億基金、大數據中心等資源已備齊,下一個“馬雲”會出現在哪個AI領域?

1、入口級技術即將井噴

根據《IT桔子人工智能報告》對中國 467 家AI企業,及 636 起投資事件的統計數據,計算機視覺(VC)與自然語音處理(NPL)是創業者最集中的兩大賽道,分別佔比19%和18%;與這組數據相對應的是,計算機視覺與自然語音處理同時也是獲投企業最多的兩個AI領域,分別佔20%與18%。

40億押注AI,浙報集團大手筆轉型有勝算嗎?

40億押注AI,浙報集團大手筆轉型有勝算嗎?

具體到投資機構,據氫媒工場觀察,近年來投資AI企業最多的真格基金先後投資了計算機視覺領域的格靈深瞳和依圖科技,在自然語音處理領域也投了出門問問,這三者目前已成各自領域的明星企業;以AI為未來主要投資方向的創新工場,也對計算機視覺、自然語言處理領域情有獨鍾,曠視科技與追一科技都是其高管常提起的典型案例。(數據顯示,真格基金、創新工場是目前國內對AI企業投資最多的兩大投資機構。)

計算機視覺與自然語音處理,為什麼備受青睞呢?

最直接的原因,當然是深度學習算法在這兩個領域內的突破,讓這兩個領域直接受益;再加上AI開源成為主流,二者的准入門檻進一步降低。

更深層的原因在於,計算機視覺與自然語音處理是AI時代入口級產品最重要的前端技術,是“入口級技術”。

想象一下,你到任何地方去,必須要從第一個入口進去,進了門以後,樓裡面有各個房間,每個進入房間的只有幾個人,但是所有人都要從大樓的門口進入。

可想而知,這個樓裡每個房間的重要性,都不及第一個入口。

我們知道,互聯網的三大主要入口搜索、電商、社交造就了BAT,三大次級入口內容、用餐、出行形成TMD。就目前來看,手機、智能家居、汽車甚至是機器人都將是AI時代的入口,而作為人機器交互最重要的前端技術,正是這兩項技術。

而艾媒諮詢最新發布的《2017年中國人工智能行業白皮書》更是

將這兩項技術與機器學習並稱為“AI核心技術”。

40億押注AI,浙報集團大手筆轉型有勝算嗎?

可以預見的是,AI入口的爭奪會比以前市場大很多,也激烈很多——上述白皮書顯示,到2020年,AI核心產業規模將超過1500億。正因如此,AI時代的入口將形成至少是超級獨角獸級別的企業,甚至會誕生下一個馬雲、馬化騰。

目前為止,這個思想實驗已有初步的答案:入口級技術。我們將思想實驗深入一層:計算機視覺與自然語音處理領域,做產品還是做服務更有優勢呢?2C還是2B更易崛起超級獨角獸呢?

2、2B比2C更具優勢

在氫媒工場看來,互聯網時代產生的BAT和TMD,都是以“需求驅動為主,以技術驅動為輔”對商業進行改造而成功的。如阿里巴巴最初,是大量中小企業對高效交易的需求激發了電子商務;百度則最初是因門戶內容極速膨脹,所帶來了用戶對於高效獲取精準信息的需求。

換而言之,BAT的出現,本質是“提升效率的需求倒逼技術進步”,是從“不能忍”到“高效率”的過程,是0到1。

而AI時代若能崛起一批巨型企業,邏輯則完全相反,應該是“以技術驅動為主,以需求驅動為輔”的。它應該是從“高效率”到“更高效率”的過程,(短期看來)是1到2的進程,(長期看來)是1到N的進程。

舉個例子,想象一下這個情景:你想用手機搜索“氫媒工場”四個字,用了一下Siri後發現搜索結果總是“青梅工場”,於是你會乾脆放棄語音搜索,改用更精準高效的手機打字。

發現了嗎?AI的技術是從“高效率”到“更高效率”,因此並非剛需,你可以選擇不用;但若把整個搜索引擎給你取消了,你肯定受不了,它可是剛需,沒了它你肯定“不能忍”。

所以說,AI時代的崛起的超級獨角獸,是“以技術驅動為主,以需求驅動為輔”的,是與BAT崛起的邏輯剛好相反的。

明白了這一層邏輯後,我們把這個思想實驗再深入一層:哪些企業將會在AI時代崛起?沒錯,技術驅動型企業。哪些技術驅動型企業呢?應該是那些暫時不做產品,專注優化技術的企業。簡單來說,就是2B型技術企業。

原因:一方面,在於剛剛所說的,AI時代崛起的新巨頭必然以技術驅動為主的底層邏輯;另一方面,2C企業離用戶更近以獲取數據的優勢,目前在BAT面前幾乎微不足道。根據2016年“互聯網女皇”瑪麗·米克爾發佈的《2016年的互聯網趨勢報告》顯示,BAT佔據了中國用戶71%的移動消費時長。

40億押注AI,浙報集團大手筆轉型有勝算嗎?

我們知道,深度學習技術建立在大量實例基礎上,就像小孩收集現實世界的信息一樣。而且,“喂”的數據越多,它就越聰明,並且不會“消化不良”。因為大數據的不可或缺,所以目前深度學習做得最好的基本是擁有大量數據的IT巨頭,如谷歌、微軟、BAT等。可以說,深度學習得到大數據的助力,就像火箭有了燃料。

當然也有例外,如前文提到的創新工場與浙數文化曾在今年6月達成戰略合作,雙方合作的內容就包括人工智能和大數據。

而數據來源問題則大可交給浙數文化集團旗下的浙江大數據交易中心——這是浙江省內唯一獲得批覆的大數據交易平臺,通過交易中心可以鏈接到國內大部分數據資源,並以合規方式通過數據應用與產品提供整體服務。同時數據的存儲與計算則可以通過浙數文化集團旗下的、華東地區單體規模最大的第三方數據中心——富春雲互聯網數據中心來提供基礎支撐。

再如真格基金和IDG之類密切關注AI的投資機構,也一直以來對大數據應用平臺做了投資佈局。但這都是避免與BAT直接正面進行數據競爭的方式。

除了上述兩點原因外,產業鏈不成熟,花費較高也都是2C企業的難題。

所以,從宏觀而言,大數據仍在BAT手中,2C企業優勢較小。

相反,和2C相比,2B業務更值得深入挖掘。金融服務、生命科學、醫療保健、能源、交通、重工業、農業和材料等領域,有清晰的產業邊界,也有專有數據,這些創業公司可以利用專有數據和機器學習模型解決高層次的專業問題。

前述《IT桔子人工智能報告》的統計也顯示,目前AI創業公司主要以2B的企業服務類業務為主,汽車、交通、安防、醫療等行業應用相對較為廣泛。

到此為止,我們得出的結論是:未來5到10年,在計算機視覺或自然語音處理領域裡的、技術驅動型的、2B業務的企業,在大概率上將迅速崛起超級獨角獸。

我們把這個思想實驗繼續深入:還能不能將下一個BAT出現的範圍,再進一步縮小呢?

能。

3、VC+NPL融合技術或造就AI時代的BAT

氫媒工場觀察到了一個趨勢:計算機視覺與自然語言處理的融合。

我們此前介紹這兩個領域似乎都是將其獨立的,而事實卻是,近年來不少科學研究已經將二者融合。

首先,計算機視覺與自然語言處理的技術基礎都是深度學習,這是二者融合的基礎。MIT在讀博士、深度學習和機器學習專家周博磊告訴氫媒工場,計算機視覺和自然語言處理並不是隔閡的兩個研究方向。兩者的未來發展會藉助各自的優勢齊頭並進,融合到General AI的框架之下。

其次,這種融合目前已經有了理論基礎且得以應用。在2014年斯坦福大學人工智能實驗室主任李飛飛教授與其得意門生Andrej Karpathy曾發表論文探討了這種“跨界”。傳統CNN(卷積神經網絡)訓練數據中每幅圖像都有單一的一個標記,這篇論文描述的模型則是每幅圖像都帶有一圖注。

40億押注AI,浙報集團大手筆轉型有勝算嗎?

周博磊認為,對圖片數據的語義化和結構化,可以說是自然語言處理在計算機視覺裡的一個首要應用。他告訴氫媒工場,自然語言中一個“詞”代表某個概念或者類,比如說“貓”和“動物”。通過語義關係,利用這些詞可以很容易建立一個語義結構關係網。

為了防止燒腦,你可以簡單將這個技術理解成讓AI學會“看圖說話”(我們以下簡稱“看圖說話技術”)。這項技術簡單解釋起來是這樣的:

我們以前訓練深度學習都是一個網絡只有一個功能,並且需要大量樣本數據作為訓練支撐。但是我們人類的學習是可以遷移的,比如你可能沒見過馬,但是假如有人告訴你馬的特徵,比如平直的長臉、堅硬的蹄、棕色的毛等等,你就可以遇到馬的時候推斷它是馬。

“看圖說話技術”就讓能AI“看大量馬的照片,形成自己對於馬的語言定義形成特徵,然後將這個定義和特徵進行遷移,比如把“馬有棕色的毛”這一點遷移成“斑馬有黑白相間的毛”。那麼AI就能在沒看過斑馬照片的情況下,認出斑馬來。

可以說它本質是“對圖片的語義標定”,它最大的優勢在於:用小樣本來學習,並進行遷移。即讓AI“舉一反三”。

所以,這裡要強調的最後一點,也是最最最重要的一點是:“看圖說話技術”對於數據量並不十分依賴。這就意味著,企業可以通過這項技術,避開與BAT的數據之爭!這對於中小AI企業可謂天大的優勢。要知道,過分依賴海量標註數據,是目前主流深度學習方法所面臨的最大困境。

因此,這類技術的進一步發展,很有可能造就AI時代的BAT(當然,前提是中途沒被收割)。

4、總結

在氫媒工場看來,未來5到10年,AI仍存在入口之爭,且將會出現超級獨角獸企業甚至AI時代的BAT。這個機會,大概率上,將出現在計算機視覺或自然語音處理領域裡的、技術驅動型的、2B業務的企業。

同時,計算機視覺與自然語言處理的技術的融合,擺脫了過分依賴海量數據的困境,或許能為未來超級獨角獸的繞開BAT,迅速崛起,提供強有力的技術支持。


分享到:


相關文章: