06.12 在影像“吃掉”世界之前,阿里雲想讓開發者們配上這些武器

在影像“吃掉”世界之前,阿里雲想讓開發者們配上這些武器

2016 年的杭州雲棲大會上,當被問及最近一年對行業的最大感受時,阿里雲總裁胡曉明曾不假思索地回答:「人工智能」。彼時,集阿里雲人工智能大成的 ET 剛剛問世兩個月,卻已經成為杭州城市大腦項目中的「大腦」。

隨後的半年時間裡,阿里雲的人工智能隨著 ET 的快速發展而廣泛佈局,尤其是隨著阿里巴巴發佈「NASA 計劃」之後,阿里雲的人工智能步伐明顯加快在完成了城市大腦、工業大腦、醫療大腦、環境大腦等一系列落地項目之後,阿里雲在上海雲棲峰會上推出一款新產品:視覺智能服務。

嚴格意義上說,相比於之前任何一個領域的「大腦」產品,這款視覺智能產品看起來只不過是一種基礎能力,或者更準確地說,這只是 ET 的「視力」——它讓機器可以看清楚圖片、視頻,也能讀懂其中的含義。

但事實並非如此簡單,尤其是在 2017 年這個特殊的時間節點。十年前,喬布斯帶著 iPhone 重塑了智能手機行業,也拉開了移動互聯網的大幕。十年後,那個曾經被 iPhone 改變的世界又重新走到了另一個十字路口,這一次「拯救世界」的主角之一就是影像。

影像正在「吃掉」世界

影像曾是構成消費主義的核心要素。在過去,無論是時裝雜誌的封面人物還是電視屏幕上的明星紅人,這些或靜態或動態的圖像不斷向世界各地傳遞著買買買的「福音」。而現在,無處不在的攝像頭正在時刻記錄著人類的方方面面。

比如衛星和無人機,過去幾年,小衛星公司的出現大大降低了通過衛星進行拍攝的成本,Google 就收購了一家叫 Skybox Imaging 的小衛星公司,隨後將其改名為 Terra Bella,其商業模式就是向商業機構售賣衛星圖像;而民用無人機的出現和逐步普及,也開啟無人機的一系列企業級、消費級的應用浪潮。

在影像“吃掉”世界之前,阿里雲想讓開發者們配上這些武器

而監控攝像頭、攝像機的平民化則更近一步。過去動輒上千甚至幾萬塊的監控攝像頭越來越多地進入家庭,與價格下降成反比的則是家庭監控攝像頭的拍攝精度大幅提升,1080p 的視頻早已普及。

另一方面,Gopro 這樣的運動相機越來越流行,與之相對的一組數字:目前 Youtube 上每分鐘上傳的影片總長度為 400 小時。而不管是國內的直播還是國外的 Snapchat 、Facebook,都在鼓勵大家拍攝更多的影像。

但這並非故事的全部。

當攝像頭成為新的輸入工具......

如果你仔細去看今年以來包括 Facebook、Google、蘋果在內的開發者大會,你會發現一個共同點:手機攝像頭正在成為新的輸入工具。

支撐手機攝像頭成為新輸入工具的關鍵要素有兩個:其一,手機拍照攝像已成為一種生活方式;其二,機器具備了處理與輸出影像(圖片或視頻)的能力。

在機器學習尤其是深度學習的幫助下,計算機視覺在過去幾年已經有了天翻地覆的變化,下面這幅圖是英國知名投資人 David Kelnar 繪製的計算機視覺發展路徑,在圖像識別領域,機器已經超過人類:

在影像“吃掉”世界之前,阿里雲想讓開發者們配上這些武器

而就在上月,阿里巴巴 iDST 視覺計算研究員華先勝的團隊打破了機器視覺算法測評平臺 KITTI上車輛檢測的世界紀錄,將其準確率提升到 90.46%,這項算法被認為是實現無人駕駛的關鍵技術,重點解決多視角,多姿態以及車輛遮擋等等。

此前,ET 在該平臺的成績也十分突出,在通用圖片的識別方面,準確度達到 96% 以上,涵蓋從水果、蔬菜、交通工具、到植物、動物等上千種物品。

在影像“吃掉”世界之前,阿里雲想讓開發者們配上這些武器

上述的視覺智能領域的紅利正在被釋放。從 FB、Google、蘋果以及此次阿里雲的新產品,所有這些都是巨頭們引領行業發展潮流的關鍵佈局,也是賦能開發者、構建生態體系的重要一環。

以此次阿里雲的視覺智能的兩款產品為例,不管是圖像識別還是人臉識別,都是歷經阿里巴巴內部多個應用場景考驗後的技術輸出,這也意味著這些技術具備了應對絕大多數應用場景的能力。

比如,基於機器學習以及卷積神經網絡,ET 的人臉識別技術已經實現了人臉檢測、器官輪廓定位、1對1人臉認證和1對多人臉識別等多個功能,其在LFW上識別率超過99.5%。目前該人臉識別系統已經應用於機場通關等場所,可以極大提高安檢人員工作效率。

而在阿里巴巴 iDST 視覺計算研究員華先勝看來,來自城市裡的攝像頭所「輸入」的數據更具挑戰性。

這些數據大概有幾個特點:其一數據量巨大,城市裡數以萬計的攝像頭,每天產生海量的影像數據;其二,數據計算的實時性,與應用在手機攝像頭的 AR 計算或美顏計算不同,城市交通影像數據的計算時間是有要求的,任何的耽擱都會加劇城市擁堵,而哪怕是十幾秒的優化都會帶來整個城市交通運轉的效率。

據瞭解,未來阿里雲視覺識別服務還將陸續推出視頻分析、視覺設計、工業診斷、醫療診斷等。

這也意味著,在不遠的將來,不同領域的開發者可以在阿里雲平臺獲取屬於各自行業的影像解決方案,這也將更進一步釋放出機器視覺智能的威力。

從社會層面上看,以杭州城市大腦將近一年的成績為例,基於攝像頭影像數據的智能調控,讓局部區域交通的暢通度提高到了 11%;而站在商業層面,從交通進一步延伸,醫療、工業、服務業等等產業,都會在被基於攝像頭的影像數據或視覺智能所改變。

寫在最後

李開復曾在多個場合表示,中國海量的數據優勢或成為人工智能彎道超車的重要變量。這其中,海量的影像數據(圖像、視頻)無論是社會價值還是商業價值,對中國的創業者來說都是一筆寶貴的資源。

如今,「數據就是新一代石油」的論斷已成為行業共識,而在通往機器智能的路上,除了海量的(影像)數據,還需要更優的算法以及強大廉價的計算能力,站在 2017 年年中的起跑線上,中國創業者們幾乎和硅谷同時起跑,以一款款應用、一個個解決方案播撒人工智能的種子,為他們搖旗吶喊的,則是包括 Google 、阿里雲在內的雲服務巨頭們。


分享到:


相關文章: