AI+開源,中國的黃金機遇?

由於可以大大節省軟件開發的時間、人力成本,並有利於技術的推廣和發展,開源早已成為全球IT行業公認的重要創新方式。

之前,中國在開源領域內的角色大多為索取者,但近年來,隨著雲計算、大數據、物聯網尤其是人工智能技術等新一代信息技術蓬勃發展,中國企業一直在不斷增加其在世界開源軟件界的貢獻度及話語權,許多中國企業已經完成了從參與者向貢獻者的升級,成為一些開源社區的重要成員、關鍵成員,發揮了骨幹作用。


AI+開源,中國的黃金機遇?

盤點:圖(國內企業在AI開源領域的貢獻)

那麼,問題來了,中國近年來,尤其是在人工智能興起之後,開源為何選擇在此時爆發?

開源以及AI開源的價值

開源的誕生,最初其實是對封閉源碼軟件公司所獲得的不公平利潤的革命。當時微軟、甲骨文、SAP 等公司為軟件收取壟斷式的“租金”。所以,一些富有“革命”理想的開發者遍開始用開源的方式進行反擊,他們多人協作,共同完成龐大的軟件。每個人不僅可以公開看到軟件源碼,還可以通過開放模型進行添加、修改和優化。

而這種軟件開發模式也取得了巨大的成功,比如開源的 Linux 目前已經成為服務器上第二大最受歡迎的操作系統,開源的MySQL 數據庫也成功削弱了甲骨文的統治地位。

“開源(open source)”這個詞,最初指的是源代碼開放,但到了今天,“開源”已經不在僅僅侷限於代碼,包括數據的公開也可以稱為開源。這其實也從側面說明了開源的巨大社會影響力。

目前,開源已經成了當今世界信息技術創新的主流方式,它之所以能夠引領世界技術創新的主導性力量,歸根結底還是在於它對行業具有極大的價值。具體而言,至少具有以下5項價值:

1)、加速技術的創新和發展。開源社區匯聚了全球技術與人才,依靠群體的力量能夠有效促進技術的迭代和創新。

2)、保障了信息安全。開源軟件開發過程和成果都是透明的,開發者可以更容易地發現並修補漏洞。

3)、企業在研發過程中,通過採用成熟開源技術,可以縮短產品開發週期,降低產品開發成本,快速提高產品性能。而且值得一提的是,在很多領域其實已經有了很好的開源技術,企業利用開源技術其實是站在了巨人的肩膀上,避免了重複造輪子的浪費。

4)、通過開源軟件的應用及讀大量的優秀的開源代碼可以迅速提升工程水平及工程師文化。開源軟件還可以提升開發者們對於編程的熱愛,對代碼質量的苛求,進而提升對於完美度的追求。

5)、最後,它還能幫助企業找到優秀的開發者。據稱,某些大企業在招聘的時候,很多都有有開源經驗者優先的不成文規定。


AI+開源,中國的黃金機遇?

在AI時代下,開源的意義其實更加重大

而且,值得一提的是,在AI時代下,開源的意義其實更加重大。

眾所周知,我們目前所能看見的諸如圖像識別、語音識別等技術都只是弱人工智能,雖然在某些細分領域,它們的能力超越了人類,比如阿法狗打敗了人類圍棋冠軍,但總體來說它們的智能水平依然很低下,比如就有人對Siri、Cortana、谷歌助手、騰訊叮噹等智能助手做了一個測試,對它們提一個看似簡單的需求:“推薦餐廳,不要日本菜”。然而,各家的AI助理都會給出一堆餐廳推薦,全是日本菜。為此,業內甚至有聲音將之稱為“人工智障”。


AI+開源,中國的黃金機遇?

注:上圖來自《人工智障 2 : 你看到的AI與智能無關》

總之,智能全面達到甚至超越人類的超人工智能離人類似乎還很遠。

近年來,人工智能技術之所以能夠取得如此突飛猛進的發展,主要原因其實就是算力、算法以及大數據方面的突破。其中的算法主要就是指深度學習算法。然而,深度學習僅僅只對現象進行統計和歸納,並不對本質原因進行推理,有可能導致根本性的錯誤。比如,一隻雞發現,不管颳風下雨,每天早上食槽裡都會出現糧食,對此,如果利用深度學習來分析,極有可能得出一個“食槽裡每天都會出現糧食”這一極其錯誤的結論甚至定理。因此,僅僅依靠深度學習,想要實現超人工智能或許並不現實。

因此,想要實現超人工智能,可能需要在算法上做更深程度的創新。而這其實非常難,因為我們到目前為止都還沒有徹底瞭解人腦的運作細節。

而另一方面,即使是目前比較成熟的深度學習,也面臨著數據不足這一瓶勁。

“開源的內涵主要是開放、共享、協同(也包含開放),實現開源的目的主要是動員全球開源社區的‘黑客’(AI志願開發者、維護者)協同攻克AI技術難關突破發展瓶頸,所以開源平臺將助力人工智能發展。”正如中國開源軟件推進聯盟名譽主席陸首群教授所說的這樣,上述兩大瓶頸意味著對於AI而言,開源可能是必不可少的。

對此,雨本智庫導師、香港科技大學教授楊強也表示,“在國內,我們有必要鼓勵開放數據、開源系統。”實際上,即使是如今的弱人工智能的爆發,其實也是深度學習算法以及谷歌TensorFlow機器學習平臺開源所促成的。

另外,AI開源還有一個好處,那就是可以加快技術落地的速度,並加快技術迭代的效率。“我們發現汽車產業、自動駕駛行業的門檻很高,憑著一己之力單打獨鬥,產業推進的速度會比較慢。所以,2017 年我們做了一個重要決定,把百度積累的技術向大家公開出來,能夠賦能開發者、降低門檻,更快的推動產業發展。”百度執行總監Apollo 平臺研發總經理王京傲如此回應Apollo 代碼開源的價值。

而目前已經離職的,推動百度開源的百度集團首席運營官陸奇曾經也在採訪中表示,開源可以降低車企開發自動駕駛的門檻,並避免重複造“輪子”。而且他還將百度Apollo的快速迭代歸功於開源。

“自私”的企業,開源的戰略價值

以上,都是從“活雷鋒”的角度說開源的好處,但如果從“自私”的本性角度來看,開源對企業而言又有什麼好處呢?

對於這一點,前華為LiteOS開源社區總監、現雨本智庫董事長杜玉傑曾發文《谷歌與開源那些事兒》詳細講解了谷歌開源安卓的戰略意義。他山之石可以攻玉,安卓開源的價值其實就是AI開源的意義。

杜玉傑在文中表示,對於谷歌而言,搜索是最核心的業務,谷歌希望人人都能夠來用它的搜素。因此,2005年在谷歌敏銳地發現移動互聯網時代來臨之後,它收購了Android系統,安卓團隊原本打算把系統閉源,但佩林覺得如果搜索引擎的使用量能夠因此而飛速上升,開放又如何?

於是,2007年11月5日,Android正式對外開源,谷歌該聯合全球幾十家移動運營商,手機制造商和芯片製造商成立了Android聯盟,Google和蘋果的手機世紀大戰正式拉開序幕,2010年8月市場Android佔有率正式超過iPhone,成為手機操作系統霸主。

另外,杜玉傑還強調,Android開源其實也加速了用戶從端到互聯網(雲)的遷移,而這也使谷歌得以成功挑戰了PC端霸主微軟的地位。

即,與閉源的行業老大競爭,最好的辦法其實就是將老大最重要的東西開源出去,糾集一群小夥伴,小魚吃大魚。(而這也會導致巨頭沒辦法再買閉源的東西了)

而且,據雨本智庫導師、臺灣安卓之父高煥堂介紹,開源對平臺提供者而言其實還有一個好處,即,他還有機會成為盟主。“平臺提供者如果想成為盟主,也有條件成為盟主,它就會開源,讓所有的加盟者可以用開源的東西。當大多數加盟者都因開源開放而獲利時,盟主獲利可能更大。”

而這裡我們還是可以以安卓為例加以說明。眾所周知,安卓一直強調免費開源,但到現在當廣大手機廠商離不開安卓的時候,安卓卻搞起了收費模式。據報道,從今年2月起,谷歌將對所有使用谷歌App服務的安卓手機廠商收取授權費(國內閹割版安卓系統應該不會受影響)。

不管那些受影響的手機廠商願不願意,這筆錢它們也不能不出,因為它們已經找不到其它好的安卓替代品了。而且值得一提的是,開源軟件收費的模式也已經越來越被人接受,不再像以前那樣令人反感了。


AI+開源,中國的黃金機遇?

中國企業AI開源的優勢?

首先,我們可能先要了解,中國自造AI開源的必要性。

據瞭解,在開源機器學習平臺裡,谷歌的TensorFlow絕對是目前市場的巨無霸,目前,它的下載量已經超過3000萬次,超過1700個貢獻者增加了4.5萬個提交。

然而,早在2016年,地平線機器人創始人餘凱便警告:

一直以來我非常欽佩谷歌的Jeff Dean在MapReduce和谷歌大腦(TensorFlow)等項目上的傑出成就。但是,我必須指出,放任TensorFlow成為世界上佔統治地位的人工智能開發平臺對世界是危險的。儘管這個平臺目前是開源的,但是隨著時間的推移,人工智能變得越來越強大,這個系統會變得極端複雜到失去透明性,而且會很可怕的變成全世界數據,計算,硬件,編譯器等的標準制定者。這樣會導致一個不健康的生態,阻礙年輕人掌握技術的自由,讓個人,公司甚至國家在人工智能領域的自主發展,最終被一家商業公司所控制。這不是危言聳聽。可惜現在絕大部分人都還意識不到這點。尤其是在中國。我呼籲大家都來使用Caffe,Mxnet等更加開放中興的開源系統,避免使用TensorFlow。

為此,新一代人工智能產業技術創新戰略聯盟理事長高文院士也在近期的採訪中表示,中國也非常有必要構建自己的開源平臺。

“其實開源平臺這都是人類的知識,開源平臺本身是免費的,大家都可以拿來用,如果是這樣的情況,是不需要一切都自己做的。但是目前的情況是每一個開源平臺的背後都有一個企業的或者一個營利組織,比如安卓之於谷歌,而亞馬遜、IBM等都有開放的AI平臺,這些平臺屬於某些企業,而企業運營是有一定風險的,風險在於或許有一天企業改變了免費策略,比如安卓在歐洲就已經收費。一旦這些平臺收費用戶就面臨兩個選擇,要麼繳費、要麼離開再找下一個平臺,這對人工智能是非常大的傷害。所以中國要有準備,要有自己的東西。”究其原因,高文教授如此表示。

“我們做自己的平臺,並不意味著我們就是拒絕各種平臺,而是所有的平臺我們都支持,下面的函數庫儘量自己有影射關係,再往下硬件都提供支持,這樣用戶就比較自由,當然到某一天要切換成完全不受別人限制的也是可以的。所以開源是一個大概念的開源,中國一定要有自己的東西。”高文教授補充道。

因此,開源可能並不僅僅是企業的是,更有可能關乎國家安全。那麼,接下來的問題就是中國開源是否具有優勢?

首先,中國有著集中力量幹大事的強有力的戰略引導和政策支持,據瞭解,國務院、工業和信息化部先後出臺《新一代人工智能發展規劃》《促進新一代人工智能產業發展3年行動計劃(2018-2020)》等重要文件,提出了建設人工智能開源開放平臺的要求,鼓勵產學研各方推進人工智能開源軟件發展。

其次,中國擁有者海量的人工智能應用場景和數據資源;然後,中國有著大量的人工智能企業,同時具有大量潛力的人工智能青年人才;

最後,隨著中國在技術方面的崛起,中國科技人才的也越來越自信,之前詬病較多的中國沒有開源文化這一現象其實也已經有所改觀,中國在各大開源社區裡的參入度已經越來越高。比如華為,在Linux Kernel社區,華為已經貢獻了超過1000個補丁,在400多家貢獻者中,華為排名前30位;而在雲計算開源項目OpenStack社區中,華為擁有16名核心貢獻者,貢獻度排在全球第六。根據OpenStack2017年報統計,OpenStack目前擁有8.4萬名社區成員,其中來自中國的成員數量排名第三,華為是其中貢獻度最高的。

AI+開源,中國的黃金機遇?

關於開源,一些你不得不知道的細節

開源為什麼不是給別人做嫁衣?

很多時候,人們常常會誤以為開放源代碼你就變成了一無所有為別人做嫁衣裳了,實際上這個誤區如今已經逐漸被消除了。開源其實也可以商業化,具體而言,開源主要有3種商業化方法:

1)、軟件免費,服務付費

開源項目誕生的起初並不是為了商業化,而是為了打破閉源軟件公司的壟斷。但開發者也得生活,所以,第一代的開源軟件創業公司,例如Redhat、MySQL,利用對開源軟件發行版提供“企業級” 支持來盈利。

2)、部分軟件免費,完整版付費

3)、賣雲服務:比如說Tensorflow就能夠在Google Cloud Platform上面,Docker也能在Docker自己的雲上跑。這個也是現在比較火的開源軟件盈利方向。


AI+開源,中國的黃金機遇?

開源會暴露軟件的缺陷,帶來安全隱患?

既然開源了,那麼誰都可以看到源代碼,這樣會不會讓黑客發現其中的漏洞,然後利用它,從而產生安全隱患呢?而且更嚴重的是,開源意味著你的代碼可能會被很多人使用,造成技術底層同質化的問題,如何有漏洞,其後果顯然是不可想象的。

但是,事實恰好相反,一個軟件,即使你不開發源代碼,也能找到其中的漏洞。工程師們知道了它的漏洞,因為手頭沒有源代碼,沒有辦法去改進它,而駭客知道了它的漏洞,卻可以利用它!

實際上,開源軟件因為集合了眾人的力量,不斷分析並檢查代碼,即使一個非常小的漏洞也可以被發現,並迅速改進代碼堵住漏洞。

但這也並不意味著開源軟件百分百安全,實際上,開源軟件新舊版本更替帶來的安全隱患值得注意。開發者可以對開源軟件進行二次開發,但他對軟件的修改需要跟隨版本的更新重複進行。同時,開發者也可以隨意使用老版本的軟件,而這也可能使他爆露在本可以避免的風險面前。


分享到:


相關文章: