巨頭扎堆前端、百度押注 AI,一文讀懂中國技術公司開源現狀

日前,一份來自技術社區 InfoQ 的中國科技公司開源情況的統計引發諸多關注。

據瞭解, InfoQ 選取了國內 7 家主要科技公司(百度、阿里、騰訊、華為、美團、360、小米)在開源社區 Github 上 50 多個賬號、2800 個開源項目。在統計方法上,infoQ 從開源項目的關注度(包括 Star、貢獻者等)、各個公司的開源項目數量以及項目涉及的領域等幾個方面展開,以此展現中國主要科技公司的開源狀況。

巨頭扎堆前端、百度押注 AI,一文讀懂中國技術公司開源現狀

由於這份統計所涉及的排名、數字較多,自然有不同維度的解讀,不過如果從技術發展的角度去看,也需要撇開單純的項目數量對比,而要從開源項目的質量以及技術前瞻性的角度去觀察。

1. GitHub 開源項目的「數字遊戲」

InfoQ 統計的是來自開源社區 Github 的數據,在 Github 上,一個項目的數字指標主要包括 Star 數量,貢獻者數量,前者是類似於社交媒體的關注度,一個項目的 Star 越多,這個項目也更流行,而後者,主要是看項目的開放程度如何,換句話說,如果項目開放程度大,貢獻者也越多。

但正如 InfoQ 所注意到的,「部分大公司會 fork 一些知名的第三方項目並創建分支,但並未體現在 github 的 fork 關係裡」,這也導致部分公司刻意製造「開源」的假象,堆積了大量「開源」項目,比如統計裡提到,阿里體系裡開源項目數雖然多,但獲得 Star 的項目比例並不高,可以對比一下騰訊,雖然只有 130 個開源項目,但 Star 數 100 以上的項目有 97 個。

另一方面,僅以 Star、貢獻者的標準來展現開源項目的價值,多少也有失偏頗。不同領域的項目所涉及的開發難度、開發語言各有不同,其所面向的群體數量也有較大差異。

比如在此次統計裡,大量 Star 多、貢獻者多的項目集中在大前端領域,這既是因為前端社區活躍,也是因為其代碼不會涉及到公司核心產品,因此各大公司也熱衷於這樣的開源項目。這裡並非否定前端的價值,而是要澄清一點:開源項目上的數字,與開源項目的價值並沒有必然關係

基於上述兩個方面分析,我們也可以更好理解 GitHub 上開源項目的數字表述遊戲,開源項目的數量以及 Star 數量、貢獻者數量並不能真實體現一個公司開源能力或一個開源項目的價值,或者換句話說,「十隻螞蟻」或許難敵「一隻大象」。

2.中國AI開源的「領頭雁」

如果細心去看 infoQ 統計的這些開源項目領域,大前端(前端和移動開發)項目最多,幾乎每家公司都有相應的項目,其中,騰訊的 10 個受歡迎的項目里居然有 9 個涉及到前端。

而百度的開源項目則一如既往的聚焦AI。百度有 4 個是 AI 領域項目,在 Commits 數前十中,百度的深度學習框架 PaddlePaddle 和自動駕駛開源平臺 Apollo 位於前列。

巨頭扎堆前端、百度押注 AI,一文讀懂中國技術公司開源現狀

InforQ 指出,「commits 提交數越多,表明項目越複雜,開發週期較長,協作者數量更多」。這也意味著,從 Commits 提交次數的角度可以觀察出某個項目的開發難度,或者說技術含量。

深度學習和自動駕駛也是當下科技領域最具技術含量的兩個領域。

從 2013 年開始,以深度學習為代表的人工智能再次成為科技行業關注的焦點,而深度學習算法在圖像、語音方面的表現也讓整個行業為之興奮,各大科技巨頭們,如 Google、Facebook 相繼開源了自己的深度學習框架,比如 Google 的 Tensorflow 和 FB 的 Caffe。

百度的 PaddlePaddle 也位列其中,公開資料顯示,2016 年,百度正式開源 PaddlePaddle,這是一個面向全球的深度學習開源框架,而且是中國首個,也是唯一一個深度學習開源框架,考慮到百度內部複雜的業務需求,也充分佐證了 PadddlePaddle 架構的可用性。

與國外其他競爭對手相比,PaddlePaddle 有著非常完備和齊全的文檔支持。尤其是針對中國市場的需求,PaddlePaddle 能夠提供更適合中國市場的自然語言處理、人臉以及中文語音處理的技術支持

。同時,在面向開發者的運營服務上,也可以提供實時響應的中文服務。

巨頭扎堆前端、百度押注 AI,一文讀懂中國技術公司開源現狀

隨著 PaddlePaddle 3.0 在去年 7 月 AI 開發者大會的正式亮相, 提供了核心框架 PaddlePaddle Fluid、PaddlePaddle Serving、PaddlePaddle Mobile,以及零門檻的快速應用平臺EasyDL、AutoDL網絡平臺自動化設計以及AI Studio在線實訓平臺等。

這一系列產品的發佈,不僅豐富了 PaddlePaddle 的產品線,也讓百度實現了從芯片到文檔,從框架到應用工具的全面自主化

。這也意味著,PaddlePaddle 作為 AI 基礎設施,能夠滿足國家安全需要的、滿足產業大規模需要的、滿足中國 AI 開發者需要的知識產權自主化。

巨頭扎堆前端、百度押注 AI,一文讀懂中國技術公司開源現狀

另一方面,自動駕駛正在成為重塑未來交通的重要技術,Apollo 則是百度提供給全球自動駕駛領域的開源方案。

自 2017 年亮相以來,Apollo 已經更新有了三次大版本的更新,伴隨快速迭代的系統版本,Apollo 生態也從無到有、從一到多,快速成長為世界級的自動駕駛開放平臺,公開資料顯示,Apollo 平臺已經開放了 22W+ 行代碼,其託管在 GitHub 上的開放代碼數量在一年之內增長了 6 倍,而根據 InfoQ 的統計,Apollo 的代碼貢獻者數量也相當可觀。

巨頭扎堆前端、百度押注 AI,一文讀懂中國技術公司開源現狀

infoQ 這樣評價這兩個開源項目:「百度聲稱的在 AI 方面基於開源理念來打造項目和產品,兌現了它自己的承諾,值得尊重」。更重要的一點則是,無論是深度學習還是自動駕駛,都讓中國科技公司的開源項目更具有技術前瞻性和示範性,也從某種意義上驗證了「一隻大象」遠比「十隻螞蟻」更有價值。

3. 尾巴:開源之路還在繼續

過去 40 多年裡,計算機領域的開源推動了整個行業的技術創新,而隨著中國互聯網公司在全球技術領域的崛起,這些公司也理應肩負起新的責任,是否擁抱開源、參與開源以及開源程度如何,都將成為衡量一家技術公司的重要標準。

正如 InfoQ 在調查彙總的總結部分所言,這些最優秀的中國互聯網公司,「在底層關鍵項目上和國外還是存在較大差距」,即便是在扎堆的大前端領域,其開源產品所覆蓋的,也「只是 React、Vue 等前端框架的組件庫」,而非是具有生態核心的產品,這也極大限制了其開源產品的價值。

另一方面,刻意堆積開源項目數量、大量開源技術含量低的項目獲得高 Star 數量和貢獻者數量,也構成了不少公司的開源策略。

這也充分說明了中國公司的開源才剛剛開始,大公司們從開源項目數量到項目質量的工作已基本完成,而從質量到技術前瞻性尤其是可引領全球技術趨勢的開源項目還很少。這其中,百度的開源項目雖然數量不多,但是在質量、技術難度和前瞻性上已具有一定的引領意義,也為中國 AI 開源領域做出了表率,未來,我們也期待更多的公司推出更多這樣的開源項目,從而進一步擴大中國技術的全球影響力。(完)


分享到:


相關文章: