「天元」開源,曠視搶佔人工智能棋局中的天元位置

3月25日,曠視以線上發佈會的形式宣佈開源深度學習框架MegEngine,並正式將其中文名定為“天元”。曠視聯合創始人兼CTO唐文斌表示,此次開源的代碼約有35萬行,會在OpenI和GitHub中同步發佈。

“在算法優先、數據驅動的人工智能時代,人們期待著有一個可以為社會大眾、不同行業開發建立自己的人工智能系統的操作系統。也正是在這樣的一個時代,曠視向社會發布了天元深度學習框架的開源系統,我向你們表示祝賀。”發佈會上,中國科學技術學會黨組書記、中國科學院院士懷進鵬通過視頻表達了對曠視開源天元的關注和期待。不僅如此,姚期智、高文、沈向陽等人工智能領域的知名學者也紛紛通過視頻表達了自己的良好祝願。


天元究竟是什麼?為何會受到行業大咖的關注?天元的研發始於2014年,誕生以來為曠視的算法突破提供了強有力的支撐。“曠視目前所有的算法都是基於天元MegEngine這個框架來訓練和推理的”,唐文斌說道。曠視首席科學家、研究院院長孫劍更是將天元比作曠視的孩子,“它今年6歲了,我們非常喜歡它”。然而,對於這樣一個耗時6年、不斷打磨完善的核心技術產品,曠視為何會選擇開源?

眾所周知,人工智能已在諸多場景中實現了落地應用。曠視發現,不同場景對於算法有著不同的需求,而場景具有無限性,這就導致算法的需求量十分龐大,僅憑單一企業根本無法填補需求空缺,這時就需要藉助AI基礎設施創造出更多的算法。

「天元」開源,曠視搶佔人工智能棋局中的天元位置

什麼是AI基礎設施?唐文斌給出的答案是芯片平臺和AI生產力平臺。其中,芯片平臺能夠承載AI的計算,而AI生產力平臺可以釋放生產算法的效能。曠視將AI生產力平臺Brain++的核心——深度學習框架天元全面開源,可以讓Brain++的能力服務於更廣大的開發者,從而降低算法的創造門檻,產生更大社會價值。

四大特性解決實際痛點

「天元」開源,曠視搶佔人工智能棋局中的天元位置

曠視研究院高級技術總監田忠博介紹,天元的整體架構可分為五個層次,自上而下依次是計算接口、圖表示、優化與編譯、運行時管理、計算內核。結合這種架構設計,田忠博為天元總結了四大特性:訓練推理一體化、動靜合一、兼併包容、靈活高效。憑藉這些特性,天元可以在實際操作中幫助開發者解決痛點問題。

「天元」開源,曠視搶佔人工智能棋局中的天元位置

在傳統的深度學習研發流程中,訓練框架和推理框架往往分別設計、分別實現,其中涉及到模型轉換。在模型轉換過程中常常會遇到一些問題,需要人工進行優化,有時會引入大量冗餘算子,致使模型的性能和精度不盡如人意。天元訓練推理一體化的特性,可直接使用訓練得到的模型進行推理;能夠保障訓練實現的速度和精度在推理時保持一致;在模型跨設備部署時能夠保證精度對齊;內置的自動模型優化模塊可以簡化開發流程。

田忠博指出,深度學習框架可大致分為兩類,一類是靜態框架,另一類是動態框架。前者易部署,後者易調試,二者的優點能否合為一體?曠視在設計天元時一直在思考這個問題。藉助動靜合一的特性,天元可以幫助開發者實現動靜態切換,在動態的過程中開展原型的研發和調試,以靜態圖的形式完成生產和部署。

目前,深度學習框架數量較多,不同框架的接口有所差異,開發者在進行學術交流時需要了解不同的框架知識。如果要在不同框架中實現模型,更是需要投入較大的學習成本。為了簡化這一問題,曠視在設計天元時就致力於將其打造成為一個兼併包容的體系。天元採用Pythonic風格的API,可以讓Python的使用者自然地接受。在函數命名風格和參數設計細節方面,天元也會考慮開發者的使用感受,避免出現過多的新概念,尊重Python社區的原有傳統。曠視在計算機視覺領域擁有獨特的積累,因此天元還中融入了曠視為計算機視覺特別優化的算子,這可以為開發者進行計算機視覺相關研發提供更多便利。

對於人工智能公司而言,有些時候會面臨眾多設備和場景,如何才能在每臺設備上打造極致性能,從而輸出優質的產品和服務?曠視秉持靈活高效的原則,藉助高性能算子庫,充分釋放不同設備的算力。通過與參考框架展的訓練性能展開橫向對比,天元在主流模型上展示出了出色的速度表現。同時,在CPU的推理場景下,天元也表現出了良好的性能。曠視發現,如果要將算法更好地部署在各種設備中,或者利用現有設備訓練更大模型、支撐更多種類的算法,需要採取高效的內存優化策略,降低顯存佔用。因此,天元內置了高效的內存優化策略。此外,通過採用亞線性內存優化技術,天元還可以在保證計算速度幾乎不變的前提下大幅提升訓練能力。“我們在內部的一些評測中,可以實現某些大模型20倍以上的內存節省,速度幾乎不變。” 田忠博說道。

訓得好、訓得快、訓得動

「天元」開源,曠視搶佔人工智能棋局中的天元位置

天元可以實現框架與算法的協同,做到訓得好。孫劍表示,計算平臺之間存在很大的差異,基於這些差異,開發者難以設計一種網絡滿足全部需求。天元可以根據不同設備的計算特性,協同設計網絡結構和框架算子,ShuffleNet就是協同設計的結果。如今,ShuffleNet在智能手機人臉識別方面實現了出色的應用。

天元是一個高效的訓練系統。在計算機視覺領域的MS COCO挑戰賽中,曠視在2017年、2018年、2019年連續奪冠,其中非常關鍵的優勢在於其擁有天元這樣訓得快的系統。天元極大地減少了創新時間,可以在單位時間內完成更多測試,加快研發人員加快對困難問題的理解和認知。

天元具備大規模能力。曠視和北京智源人工智能研究院發聯合發佈了Objects365,目前已更新至Objects365 V2版本。該數據集中有365種常見物體、超過200萬張圖像、超過2800萬個人工標誌框。面對龐大的數據集,天元可以實現訓得動,能夠在短時間內完成訓練。

曠視此次發佈的是天元Alpha版本,預計6月會發布Beta版本,9月發佈正式的1.0版本。“希望更多人能夠對我們的產品提出批評建議,一起來貢獻Code”,唐文斌表示。

“如果把天元比作一個小孩的話,今天可能是他走出房間去迎接陽光,想為這個社會去做更多事情的時候。”在發佈會的最後,唐文斌說道,“同時,也希望社會各界的朋友對他有更多的呵護,對他有更多的幫助,我們一起來幫助他真正的成長。”

圍棋中,天元代表棋盤正中心的點位,而曠視能否在人工智能這盤棋局中佔據C位,我們拭目以待!


分享到:


相關文章: