04.24 Face++雲服務平臺產品負責人:AI如何助力行業智能化

算法,是否可行?行業,是否認可?決定了,是否可以做?用戶場景是什麼,決定了是否值得做?能否給現有行業的核心玩家帶來相應的價值,且價值可否去複用,這是判斷是否有價值並且可持續。

邊界、場景、價值,這是在AI落地行業實踐中需要不斷考量的三大核心要點。

Face++云服务平台产品负责人:AI如何助力行业智能化

本文是AI獨角獸公司Face++雲服務平臺產品負責人劉楊洋在起點學院的分享實錄,嘉賓分享視頻已經在起點社員頻道上架,限時免費觀看,詳情請戳:視頻鏈接

一、什麼是人工智能?

最近,特別是這兩年開始,AI和區塊鏈可以說是互聯網最大的風口,連詐騙集團都學會用這兩個詞忽悠了。如果你這個公司沒有左手“區塊鏈”,右手“AI”,你都不好意思說自己是高科技的公司。

那麼說到底,什麼是人工智能?

講這個概念之前,我們先說說什麼是智能。

Face++云服务平台产品负责人:AI如何助力行业智能化

其實,智能是個體的一個行為閉環——大家都是智能的生物,每天都會經歷無數次這樣的閉環。

比如:

今天出門,穿著睡衣頂著加了三天班的憔悴面貌去買菜,結果一出門就看到前任挽著他的現任光鮮亮麗地從遠處走過來了。這個時候我們首先感知到了這件事情,緊接著就會認知到這個非常尷尬的境地,那麼接下來我們就要做決策:究竟是趕快找個地縫躲起來,還是乾脆打暈前任,並且把這個決策付諸實踐(就是執行)?執行過後就會學到:你總是會在最不想見的時候見到你的前任——多麼痛的領悟!

這是一個最簡單的智能個體閉環。

當然,這只是個體;真正的智能生物還要涉及到和其他個體,或者說整個社會的博弈、合作,這種整體的閉環叫智能。所以,人工智能學科,據官方定義應該是:

創造可以自主地進行感知、認知、執行、決策、學習的閉環;並且可以和其他(符合社會的核心價值觀)的個體進行交互,這就是人工智能。

我們傳統的系統,主要的功效是在影響我們(這個智能體)的閉環。有的是希望影響感知,比如蛋糕都想做好看一點;有的是希望影響決策,比如降價等等;而人工智能系統,最終的目標就是自身可以實現這樣的閉環。

1. 舉兩個案例

(1)鸚鵡學舌

這應該是現在基本上在應用的所謂人工智能階段。

我教一隻鸚鵡說“你好!”,它會說“你好!”然後問“你吃了嗎?”它只會回“你吃了嗎?”,而不會回兩條蟲——這只是目前階段鸚鵡學舌。

當我問:你吃了嗎?鸚鵡會做一些語義分析(它內部的AI系統),再返回說我吃了兩條蟲——這才是相對智能。

(2)烏鴉吃果

這個視頻非常的出名。

Face++云服务平台产品负责人:AI如何助力行业智能化

烏鴉是一種很聰明的生物,一些烏鴉和海鷗在海邊吃貝殼吃不到怎麼辦?它會把貝殼叼到很高的地方,貝殼摔下來之後再吃。貝殼是很堅硬的東西,所以它觀察馬路上的汽車會把這些堅硬的東西壓下去去吃。這時候出現問題的是:馬路上太危險,萬一車過來出現車禍怎麼辦?它們觀察綠燈的時候車是川流不息,紅燈的時候車會停下來。所以它們後來學會叼堅硬的東西往路上放,等到紅燈的時候再去吃——所以它是形成了完整的閉環。

鳥類其實是非常聰明的。

最近看一個報道說,在澳大利亞有一種猛禽。它甚至會去偷人類的火種,偷完火種之後往荒野上一放;發生火災,那些小動物就會跑出來,它就會吃那些小動物——我覺得它應該也是有這樣的長期觀察,得到了一個方法。

所以,這樣兩個案例,我覺得烏鴉吃果或者是這樣的人工智能,最終是希望能夠做出這樣的機器或者說這樣的一個系統。

二、人工智能包含哪些東西?

包含這幾樣:

  1. 計算機視覺,現在非常火,包括我們公司主要是做這個。人臉識別、圖像識別和模式識別都包括在這裡邊。
  2. 自然語言理解與交流,就是科大訊飛一直專精的語義理解這個方面。
  3. 認知和推理,這是另外一個方向,比如知識圖譜、社會倫理學這樣的一些東西。
  4. 機器人學,怎麼去創建一些機器,包括任務的系統,路線的規劃,機器人的控制等這一系列的東西。
  5. 博弈與理論,個體之間是如何的競爭和合作?包括研究如何符合人類的核心價值觀,人工智能和人類如何一起和平的共存等等。

最後其實是研究上面的工具,比較火的深度學習、無監督學習都包含在這裡邊,統稱叫機器學習,它是研究數據的統計、建模的方法。

三、從產品角度看,哪些屬於人工智能?

Face++云服务平台产品负责人:AI如何助力行业智能化
  • 認知:是指收集信息和解析信息來感知世界,比如圖片識別、語音識別、自然語言處理等;
  • 預測:是指通過計算,來預測行為和結果。比如廣告推薦,歌曲推薦等;
  • 決策:
    是指確定實現的方式和路徑,比如移動路線規劃、自動買賣股票等;
  • 集成解決方案:是指人工智能和其他技術結合時,產生的多種集成解決方案,比如和汽車結合就是無人駕駛,和醫療器械結合就是手術機器人。

四、AI在手機行業的落地實踐

我們判斷一個技術能不能在行業落地,最重要的是能不能達到超越價值線的價值,並且可以有一定的門檻,可以持續地發展。

以手機行業為例,為什麼選擇手機?

首先,計算機視覺本質是賦能各種各樣的攝像頭,而在現在的社會里邊最重要的攝像頭就是手機,每個人的手機上至少有兩個,未來會有三個、四個,短暫地時間裡邊個數不會減少,只會增多,這是最重要的“戰場”。

其次,手機它是一個比較有價值,是高價值的行業。我們能夠在很多方面發力,比如安全領域,常見的刷臉解鎖/刷臉支付。

從手機誕生的那一天或者說電腦誕生那一天開始就會有數字密碼。上世紀開始基於生物特徵的安全越來越受到大家的喜歡,我們在做之前其實內部有個分析,為什麼刷臉現在可以做?我們的優勢在哪裡?

Face++云服务平台产品负责人:AI如何助力行业智能化

最主要的因素是工業設計和製造工藝的提升。今年的全面屏成為工業設計上的主流趨勢,大指紋設計挪到了手機背面,指紋的用戶體驗優勢降低了。人臉不僅彌補了體驗上的不足,更重要的是:人臉只需要攝像頭就可以完成,不需要像指紋一樣佔用更多屏幕面積,所以能夠大大提高屏佔比。

第二個是芯片處理能力的提升與人臉識別算法的成熟。一些硬件層的加速方案可以讓人臉識別的算法能在手機上跑得更快,新的活體技術可以讓刷臉變得更安全。

第三個原因是攝像頭模組製造工藝的突破。其實結構光在幾年前就有了,但是並沒有小型化到手機這麼小的體積內,iPhone 是第一家推出這樣設備的廠商。除了結構光之外,還包括普通的紅外IO攝像頭、TOF攝像頭、攝像頭模組的小型化。

除此之外就是成本和收益問題:如果廠商想要在手機那麼小的空間內裝一個指紋模組、虹膜模組,所要犧牲的手機內部空間佔用;換句話說:所需要的成本是巨大的,而人臉識別不會佔用除攝像頭模組外更多的內部空間。

Face++云服务平台产品负责人:AI如何助力行业智能化

用戶體驗更好,大家在刷臉解鎖的過程中不需要做任何的配合式操作,可以拿起手機直接解鎖。而刷臉還可以抵抗一些常見的干擾,例如暗光、側臉、小範圍遮擋等。這讓刷臉成為一種體驗更優的生物識別方案。

五、AI在教育/營銷/製造業等行業的落地實踐

說完手機,我們再講一講其他的行業。

1. 汽車

比如汽車。

汽車主要的切入點是讓汽車更瞭解它的用戶,包括駕駛員他是誰,根據他的情況去調整一些座椅、後視鏡,各種音樂這樣的設置。還有就是:你有沒有遺留一些物體,或者是遺留一些小孩或者是遺留一些寵物在車上?

主要的切入點是:讓汽車能夠更瞭解它的用戶。

2. 教育

教育,這方面是兩塊:

一塊是讓老師更瞭解學生,可以通過視覺的方式來了解學生學得到底認不認真,開不開心,課堂質量怎麼樣,反饋提升老師的教育質量;

第二塊是有一些手勢、貼紙、特效,更豐富教育的方法的嘗試;第三個其實就是校園安全監控,保護孩子在學校的安全等等。

3. 營銷

營銷,營銷這塊的主要切入點是幫助找到更精準的一些客戶,年齡、性別這些,然後找到客戶之後,可以分析看看營銷效果怎麼樣?

舉一個廣告牌,發現是女生,給他推化妝品——她看沒看?看了多久?有沒有拿出手機來掃?表情什麼樣?這些其實都可以做。

去年比較火的軍裝照、換臉這些東西,它也是營銷的一種新的方式;也許以後是換個身體,拍下照可能是施瓦辛格的身體,臉變成貝克漢姆,大概是這樣的營銷。

4. 製造業

製造業,主要是異常的檢測和報警。比如拉鍊到底是不是壞的,還有沒有起火、煙霧這樣的一些預警。

第二塊是正常的保證:該入庫的是不是入庫,該進行的程序有沒有做?

但是無論如何,在這幾個行業想要有長足的發展,還是需要深耕,需要對行業本來就很瞭解的人和我們一起發力;能夠在計算機視覺給這些行業賦予所謂的超越價值線,也就是高價值,看能不能有一些更深入的合作。

六、AI落地行業的核心思路:場景、邊界、價值

最後總結一下行業的落地思路,或者說怎麼確保AI這些東西能不能做。

Face++云服务平台产品负责人:AI如何助力行业智能化

1. 邊界

第一,人眼的邊界。這其實是一個技術問題,就是這個東西是否已經跨越了人眼的識別邊界,這是否是一個計算機視覺能夠解決的需求。

第二,算法可行性。舉一個很簡單的例子,比如把手張開,也許我的朋友跟我說是你好!也許我家的貓看見說我要打它。但是算法只是說你只是把手舉起來,到底是幹嘛算法是不知道的。所以算法到目前為止是沒有推理作用。

還有就是寬域到窄域的預設,這其實就是一個場景的預先規劃,以及對訓練數據的要求——因為我們現在所說的算法訓練,都指的是監督式學習。

什麼叫監督式學習呢?

比如說我看的都是中國人,你突然給我一個黑人,也許我就識別不出來了;以前有個人做了識別健身房啞鈴,做得非常好,每一個人拍一張照都能識別出啞鈴,後來有一天沒有人手出現拍了一張啞鈴,它就識別不出來。回去發現所有訓練的數據都是人舉著一個啞鈴,它把手和啞鈴識別到一起了——所以,要想達到必須沒有推理性的,有推理性的人來告訴它,它才能進行相應的訓練。

第二是數據要有一定的量,並且儘可能的覆蓋使用場景的數據。

第三是行業的邊界,這是到底決定價值線在哪兒。

俞軍老師的著名理論:

產品價值=(新體驗-舊體驗)+替換成本

這裡邊有一個可以分享案例:

AI做醫療現在都很火,比如說通過一張片認定你有沒有得肺結節、乳腺癌這種的。之前中國醫學界泰斗級別的一位老師,在他眼裡,中國可能有資格識別肺結節的只有不到四五百人,但是,這部分人的識別準確度也只是在85%左右——實際上,他們識別出來之後,還要去做病理切片,做各種病理測試,才能夠最終確定這個人到底有沒有這樣的病。

一開始,需求只要超過85%,是不是就可以了呢?反問過來想,這個東西到底誰可以買單?是用戶來買單還是醫院來買單?用戶為什麼去醫院看?我是不是能夠提升醫生的效率。

2. 場景

你要值得做就考慮場景。

用戶的場景是什麼?我們都說一個攝像頭,拍一張圖片去識別,或者是一個視頻去識別;那麼識別的角度、識別的距離,包括我要求識別的時間、底庫等等,這些就也關係到算法適用的範圍。對應我的產品形態是SDK還是API,用在什麼架構上,這是整個方案的設計。

算法的場景,算法在哪兒跑?它需要什麼樣的性能?它要達到多少的概率?它要覆蓋多少的範圍?這就是算法需要考慮的場景。

最後是涉及到行業的場景,到底能不能為這個行業賦能?

我說,我這個可以達到100%肯定是沒有問題的,但是醫院說也許就是不能用,我們這邊的醫生都是有什麼證之類的,你這個機器有證能證明自己嗎?錯了誰來買單?——其實會面臨很多這樣複雜的問題。

3. 價值

關於行業的賦能,我們要考慮的更多。

現在是否是進入這個行業的好時機,基礎是否已經具備了,能不能給現在行業的核心玩家帶來相應的價值,並且這個價值可否去複用,有沒有足夠的門檻。最後才來判斷到有沒有超出這樣的價值線,並且是否可持續。

嘉賓:劉楊洋,Face++雲服務平臺產品負責人,先後任職於滴滴、京東等互聯網公司,負責平臺增長與創新等工作。現負責Face++人工智能開放平臺產品能力建構,專注於AI能力面向各行業用戶的場景實踐。

題圖來自 Unsplash,基於 CC0 協議


分享到:


相關文章: