曠視Brain++的深度學習框架3月25日開源,中國AI變革新機遇

曠視Brain++的深度學習框架3月25日開源,中國AI變革新機遇

2017年,當谷歌AlphaGo在圍棋比賽中打敗等級分排名世界第一的選手柯潔時,柯潔用了兩個字來形容自己的感受:震撼!

而支撐AlphaGo運轉的底層技術框架就是大名鼎鼎的TensorFlow。

TensorFlow是谷歌開發的一個深度學習平臺,2015年11月,谷歌宣佈將TensorFlow開源。迄今為止,從搜索、營銷、城市安全、醫療、農業到石油化工領域,很多公司都在利用TensorFlow搭建自己的人工智能產品。例如,利用TensorFlow訓練的各類智能語音助手,谷歌搜索引擎和Airbnb上的智能圖片分類,Amazon上的商品推薦等等。

打個簡單的比方,TensorFlow相當於AI時代的手機系統,各大智能手機廠商都可以在後者的基礎上搭建出適合自身的APP。

應當指出的是,雖然TensorFlow是全球最知名的開源深度學習框架,但並不是唯一的一家。

目前,全世界主流深度學習框架包括蒙特利爾理工學院2008年推出的Theano、加州大學伯克利2013年推出的Caffe,曠視2014年內部開始研發的MegEngine,Amazon 2015年底開源的MXNet,Facebook 2017年開源的PyTorch,還有百度2016年開源的PaddlePaddle等。

曠視Brain++的深度學習框架3月25日開源,中國AI變革新機遇

值得一提的是,中國人工智能獨角獸曠視早在2014年就開始研發其深度學習框架MegEngine。過去5年裡,這套深度學習框架被曠視全員使用,支撐著整個曠視的科研及產品化。同時在框架的基礎之上,曠視研究院還提出了“三位一體”概念,將數據和算力平臺融合,構建了集“算法、數據和算力”於一體的 AI 生產力套件 Brain++。

截至目前,曠視已奪得27 項全球 AI 競賽冠軍,其中包括國際頂級計算機視覺大賽的MS COCO 三連冠,在今年的新冠疫情期間,曠視用不到10天的時間即研發上線了AI測溫產品,這些都歸功於其自主研發的AI生產力平臺Brain++。

互金行業評論獲悉,曠視將在3月25日開源Brain++最為核心的部分—能夠批量生產算法的深度學習框架MegEngine,開源的代碼主要面向高校師生、傳統產業和中小企業的AI開發者。曠視希望通過開源MegEngine,逐步將Brain++的生產力賦能給學術界和產業界。曠視的這一開源舉動,有望為中國AI開發生態注入新活力。

曠視Brain++有望不再讓開發者重複造輪子

曠視Brain++的深度學習框架3月25日開源,中國AI變革新機遇

據介紹,曠視的AI生產力平臺Brain++由三大支柱構成:深度學習框架MegEngine、深度學習雲計算平臺 MegCompute 和數據管理平臺MegData。2019年的世界互聯網大會上,曠視聯合創始人兼CTO唐文斌曾表示, Brain++是一套端到端的AI算法平臺,目標是讓研發人員獲得從數據到算法產業化的一攬子技術能力,不用重複造輪子也可以推進AI快速落地。

目前,曠視已經基於Brain++開發出了大量部署於雲端、移動端、邊緣端全計算平臺的先進深度神經網絡,並打造了以人工智能驅動的物聯網解決方案,實現在個人物聯網、城市物聯網、供應鏈物聯網三大垂直領域的廣泛落地。

綜合來看,Brain++具備以下幾點優勢:

首先,算法平臺涵蓋端到端的全流程,從數據準備、數據訓練、到算法模型的封裝,應用環節實現無縫對接

Brain++涵蓋了深度學習算法開發的所有環節。從數據的獲取、清洗、預處理、標註和存儲開始,到研究人員設計算法架構、設計實驗環節、搭建訓練環境、訓練、加速、調參、模型效果評估和產生模型,到最終的模型分發和部署應用,Brain++為研發人員提供了一站式全流程的AI工程解決方案

曠視Brain++的深度學習框架3月25日開源,中國AI變革新機遇

而MegEngine作為Brain++最核心的引擎部分,不僅能夠高效、批量生產算法,還具備獨特的訓練和推理一體化技術架構,同時集成了行業領先的自動機器學習(AutoML)技術,可以讓算法來訓練算法,讓AI來創造AI

此外,MegEngine框架具有良好的易用性。根據不用的行業特點和應用已經封裝成半成品,廣泛涵蓋能源電力、醫療、物流、汽車以及到智能智慧城市複雜整體應用的模塊,新用戶可以根據自己行業的應用選擇不同組合的封裝產品,減少開發和應用的難度。

在關鍵指標上,即使和主流的開源框架TensorFlow、PyTorch相比,MegEngine依然有很強的競爭力。這也是曠視有信心將MegEngine面向國內外開發者開源的原因。

中國亟需自主AI框架解決“卡脖子”難題

如今,從自動駕駛、購物、醫療到工業製造,人工智能的身影無處不在,正在深刻的改變人類生產和生活的方方面面。國務院2017年7月發佈的《新一代人工智能發展規劃的通知》指出,人工智能是引領未來的戰略性技術,是新一輪產業變革的核心驅動力,要把人工智能發展放在國家戰略層面系統佈局。

毫無疑問,人工智能將成為未來經濟發展的新引擎。埃森哲在一份報告中預測,AI(人工智能)可將勞動生產率提高40%;到2035年,人工智能能將年度經濟增長率提高一倍。

我國人工智能發展起步較晚,與發達國家相比有一定優勢也有一定劣勢。中國工程院院士高文曾在分享中指出,中國在基礎研究算法和核心器件方面相對落後,另一方面,有影響的開源開放平臺基本在國外,中國缺少有影響力的開源平臺且缺乏高端人才。也有很多專家認為,中國人工智能產業過度依賴國外開源代碼,在核心技術上容易被“卡脖子”。

而對於產業界來說,在人工智能技術和產業深度融合層面,深度學習底層框架已經成為一個主要瓶頸。華為海思計算芯片產品總監王曉雷曾表示,“我們在提供算力的時候發現主要瓶頸在於框架,我希望有更多的人投入研發,指導算法發展,從而推動芯片設計。”

眾多周知,人工智能分為三個層面:基礎層、技術層和應用層。其中,基礎層包括芯片、傳感器等硬件,也包括雲計算、大數據等;技術層包括三個部分:深度學習框架(TensorFlow、MegEngine)、算法模型(卷積神經網絡、決策樹等)、通用技術(語音識別、自然語言處理、計算機視覺等)。

最上層才是應用層,包括行業解決方案,例如金融、醫療、城市安全、教育、交通等;具體到產品層面,則包括自動駕駛汽車、機器人、智能客服等等。

可以毫不誇張的說,深度學習框架上承各種商業化應用、下接芯片等硬件,起到了承上啟下的作用,堪稱智能時代的操作系統。但是,在2015年以前,國內並沒有開源的深度學習框架,國內開發者只能利用TensorFlow和PyTorch等平臺進行人工智能算法和模型的開發、訓練和部署。即便是到了今天,國內也只有百度的PaddlePaddle一個開源深度學習平臺。

國產化的深度學習框架的缺乏,勢必制約中國人工智能產業的長期發展。在智能手機領域,美國掌握了IOS和安卓兩大操作系統,導致中國手機巨頭步步被動,谷歌禁止華為使用安卓套件就是最深刻的教訓。如今,如果中國在人工智能底層框架上再喪失自主權,那麼未來也將不具備硬科技的國家競爭力。此次,曠視Brain++的深度學習框架MegEngine加入開源陣營,必將成為國內人工智能產業里程碑的一個大事件,有望助力中國人工智能產業加速與傳統產業深度融合。

附:什麼是深度學習框架?

曠視Brain++的深度學習框架3月25日開源,中國AI變革新機遇

要理解MegEngine、TensorFlow、Pytorch為代表的深度學習框架,有必要簡單瞭解一下深度學習/機器學習/人工智能的歷史。

人工智能是一個範圍較廣的概念,它泛指一切能夠像人一樣“思考、行為”的電腦程序。機器學習則是人工智能的一個分支,或者說是實現人工智能的一個工具

。實際上,在2015年以前,在谷歌搜索熱詞裡,人工智能的出現頻率還要超過機器學習。

在人工智能發展早期,需要專家編寫專門的程序去解決相應的問題,例如,IBM“深藍“國際象棋電腦在設計時,不僅輸入了100年來所有國際特級大師開局和殘局的下法,而且還將眾多國際象棋大師對對比賽的理解編成程序用來指導“深藍”。但這種方法的弊端是,需要特定領域的頂尖專家支持,成本昂貴且耗時,不適合大規模的商業化推廣應用。

機器學習則前進了一大步。人們只需要將大量相關數據輸入到電腦,然後人工提取數據特徵,接著“喂”給計算機,計算機學習數據中的規律,形成一個算法。機器學習的典型應用包括垃圾郵件攔截、電商商品推薦等。

但機器學習並非用來處理簡單的任務比較有效,但如果涉及數據量龐大,則依靠人工提取特徵就難以勝任了。這時候就出現了深度學習

所謂深度學習,就是利用算法處理數據,並模擬人類大腦的思考過程來處理語言、識別圖像等。

例如,短短不到三個月,谷歌AlphaGo曾在短短3個月內就完成了從業餘六段到職業九段的跨越,這是很多頂尖棋手窮盡一生都無法完成的任務,由此可見深度學習的驚人能力。

在深度學習早期,每個深度學習研究者都需要寫大量的重複代碼。後來,為了提高工作效率,這些研究者就將這些代碼寫成了一個框架放到網上讓所有研究者一起使用,這就是開源深度學習框架的由來。我們做個簡單的比喻,開源框架對於開發者來說,就像樂高的說明書一樣,讓開發者們編寫神經網絡變得像搭積木一樣簡單。谷歌TensorFlow、PyTorch就是其中最具代表性的平臺。

但是在整個人工智能產業中,開源框架不僅僅是個工具,更是是連接算法和硬件,溝通研究和落地的關鍵節點。目前TensorFlow和PyTorch在市場中的佔有率極高,雖然這個兩個框架已經很大程度上為開發者的開發環境提供了改觀,但仍舊都有很多的問題,要麼是體驗糟糕,接口混亂,調試困難,要麼難以支持工業界產品研發,多機訓練和量化支持差強人意。

因此單就開源框架這個市場來看,開源框架產品還有很大的提升空間。本就起家於人工智能產業的曠視科技在深度學習框架方面有了一套自己的方法論,此次能夠將自用的開發工具開源,無論是在科研還是產業實踐過程中,對於開發者們來說多一個選擇總歸不是一個壞事,真正能做到高效易用,體驗友好才能被越來越多的用戶青睞。


分享到:


相關文章: