老公睡覺時手機能否被老婆解鎖?機器算法告訴你答案

在美國,很多人工智能項目都以大學為主導,用於科研,不需要考慮賺錢的問題。而中國的人工智能項目存在於各種產業公司內,壓力更大,他們做完算法後還要賺錢。在美國很少能看到擁有四五百人的中型人工智能企業,公司規模達到一百人左右的時候,要麼就維持一個小而美的研究,要麼就等待被併購,進入一個大體系裡。下面我結合中美之間的差異性講講視覺識別的商業化。

老公睡著了,老婆就能讓手機解鎖?

iPhone8的人臉解鎖功能引起了熱議,網上流傳著兩個段子,第一個是老公睡著之後,手機被老婆解鎖了;第二個是老婆卸妝後,發現手機打不開了。

這裡有一個測試,讓機器識別一些網紅臉,看看算法能夠給出什麼樣的結果。

老公睡覺時手機能否被老婆解鎖?機器算法告訴你答案

通過測試結果可以看出,即便是化了濃妝,機器也可以識別出來,甚至連男扮女裝都能識別出來。大家可以想一想,如果讓人類去做這種識別,成功率會是多少?人臉識別對於機器來說就是一道算術題,化妝是障眼法,沒有改變原有的面部結構,所以在1:1的場景裡,機器比人的判斷力高一些。人類做出的判斷由自己的數據庫決定,比如面對一個非常熟悉的人,他變換髮型之後仍能被我們認出。人類依靠的數據庫由我們的生活圈決定,生活圈越大,認識的人就越多,生活圈越小,認識的人就越少。

這裡還有另一個測試,找了一些電影中經過特效變化的面孔,機器同樣能夠判斷出這些面孔分別對應哪位演員。

老公睡覺時手機能否被老婆解鎖?機器算法告訴你答案

因此人臉識別程序已經能夠識別電影特效級別的面孔。什麼樣的面孔不能被識別呢?毀容之後的面孔不能被識別,面部關鍵部分或結構有變化,就可能識別不了。

所以剛剛說的老婆卸妝之後,手機打不開的問題,現在機器已經解決了。至於老公睡覺時手機被老婆解鎖這件事,也是無法實現的。

人臉解鎖體驗更好,安全問題仍然存在

大家都很關心人工智能的商業落地,目前人臉解鎖技術已經實現了真正的落地。判斷兩人是不是一個人很簡單,但是不同場景會有不同的命題,這些命題能不能解決,決定了這項技術能不能在相關行業裡應用,這是人臉識別商業化的關鍵。

人臉解鎖的體驗略勝於指紋、虹膜。這裡可以做一個對比:

1、首次註冊時,人臉和虹膜的速度快,拍一張照片即可,相比之下指紋比較慢,需要多次採集;

2、指紋解鎖需要手指配合,虹膜解鎖需要對淮眼部,這兩種解鎖方式都慢於人臉解鎖,而且人臉解鎖是非接觸式的。面對同一種手機解鎖方式,人們拿起手機1秒內成功了,這是正常速度,也是極限,如果需要2秒甚至更長時間,大家就可能放棄這種方式了,這就是商業化對技術的要求。

3、指紋解鎖和虹膜解鎖的抗干擾能力比較弱,比如手上沾上一些水或者油漬就不能被識別了,帶上隱形眼鏡虹膜解鎖就不好用了,而人臉解鎖的抗干擾能力更強一些。

人臉識別也需要與 「黑產」(黑色產業)作鬥爭。黑客們總會有新方法攻擊你的手機,之前就有某款手機的人臉識別功能會被照片破解的新聞。目前在黑產市場,破解手機人臉識別功能的價格大概是800元一次,批量破解50元一次。研究人臉識別的廠商需要了解黑客的攻擊方式,強化自身的技術,進行防衛。

現在破解人臉解鎖最常用的手法就是利用照片。這裡有三張圖,大家可以猜猜哪一張是從屏幕上翻拍的照片。

老公睡覺時手機能否被老婆解鎖?機器算法告訴你答案

其實這三張全是翻拍的。我們單憑肉眼無法分辨這是拍攝的真人還是從屏幕上翻拍的,但是機器都可以分辨出來。人類和機器分別擁有兩種不同的識別體系,機器在識別過程中可以調用很多不同的東西。

一臺門禁機反映出的問題

在人臉識別技術走向商業化的過程中,「技術-場景」雙輪驅動才是關鍵,技術單獨發展並不十分有效。現在為什麼強調算法?因為大家在找投資的時候,要向投資人解釋這項技術為什麼值錢。天使輪、A輪、B輪可能都要有這樣一個標淮。

曠視作為一家研究人臉識別的公司,曾給公司內部做了一款可以刷臉的門禁機,後來把這款機器被做成了商業產品。投放到市場之後發現,制約我們落地的並非是機器識別的淮確率與速度,而是不同小區的環境,小區大門朝東的,早晨人臉逆光面對機器,識別不了;小區門口路燈昏暗,到了夜晚機器就識別不了。於是需要我們改算調優,對逆光改算法,對亮度改算法,不斷解決這些問題。所以當人臉識別技術真正走向商業化落地的時候,要解決的問題遠比你向投資人介紹的算法複雜得多。

在一個真正的商業化場景裡,門禁機的機身可能是一個非常小的集成商做的,算法是科學家做的。集成商不懂算法,科學家不會去解決使用中遇到的零散問題。所以想要實現人臉識別商業化落地,公司必須有能夠與算法專家和集成商對接的人才,這類人才需要特彆強大,甚至需要專門培養。現在比拼算法專家數量不是一件難事,真正具有挑戰性的是面對商業化落地,產品如何實現集成。

人工智能走向商業化,不只是一個算法問題

警匪片裡通常只有一兩個壞人,而現實生活中警方要面對多少壞人?一個大型城市的固定人口加上流動人口,總數大概在一千萬到兩千萬之間,從中抓一個罪犯,需要多少數據?這就是商業化人工智能和算法級人工智能的具體差別。

曠視的人臉識別程序現在已經能夠幫助警方識別嫌疑人,這裡有兩個典型的例子:兩個嫌疑人,其中一個潛逃了五年,覺得沒人會認出他了,結果被機器識別出來了,另一個逃了七年了,以前很瘦,這七年間變胖了,還是被識別出來了。處理一個打架鬥毆事件,如果單純依靠警方排查尋找嫌疑人,需要多少人力和時間?但是通過人臉識別,三秒鐘就找到了嫌疑人,五分鐘後巡警就能完成抓捕。警察要抓嫌犯,不是說從幾萬人裡把這個人認出來就萬事大吉了,而是要明確在哪兒能抓住他,他會在什麼時候什麼地點出現,警方需要的是一份情報信息。一秒鐘識別,一秒鐘定位,告訴他們這個人在哪兒,這是算法的真正落地。

真正商業化的東西並不是解決一個算法問題,而是解決場景和需求問題,找最合適的發力點。

此外,人工智能走向商業化,除了把算法做好之外,還要解決如何跟硬件結合的問題,如何通過警用攝像頭實現算法的功能。現在國內的警用攝像頭有五千萬個左右,其中百分之八十的攝像頭只能看到人的身體,看不清人臉。因此,在像素級受限的情況下,能不能識別,也是人臉識別商業化過程中需要面對的問題。

技術和場景是人工智能的雙重驅動力

人工智能的核心驅動力到底是什麼?

目前大家關注的範圍主要包括產業環境、技術、數據、場景、人才、商業模式、行業這幾塊,看團隊裡有多少博士,商業模式有多完美,行業滲透能力強不強,大數據上有沒有優勢。

其實真正的驅動力就兩個,一個是技術,一個是場景。

老公睡覺時手機能否被老婆解鎖?機器算法告訴你答案

你的技術到底能不能適應這個行業,你對這個場景瞭解多深,這就涉及到人工智能真正商業化的一些問題。

技術、商業、數據的化反,可以將場景細分。為什麼現在人工智能領域出現很多細分公司?因為數據在每一個行業裡是一定量,不同的知識解決不同行業的問題,場景需要技術落地,而技術會細分場景,不會有某項技術可以適應全部場景,想把所有場景劃分出來,谷歌級別的公司也很難做到。

老公睡覺時手機能否被老婆解鎖?機器算法告訴你答案

而在中國的人工智能領域,投入多少成本能將技術做出來是一個未知數,技術研發成功之後能夠得到多少回報也是一個未知數,這就是一個尷尬場景。

人工智能公司在一級市場估值非常高,但是敢拿這份財報去二級市場上市嗎?我相信大部分都不敢,因為一定會倒掛的。所以場景細分之後我們發現可以做的東西很多,才能真正賺錢,如果只做一個SDK(Software Development Kit,軟件開發工具包)級別的生意,每一個行業裡的議價能力都非常弱。

曠視的小區門禁系統現在能解決在逆光下識別人臉的問題,原因在於我們已經在一百多個小區安裝了人臉識別門禁機,這麼多場景下的數據可以幫助我們優化算法。但如果沒有這些數據,我們怎麼解決這些問題?場景得到細分,技術也能得到相應的優化。所以場景一定要不斷擴大。這就是雙輪驅動具體的用意。

曠視最早選了一個非常小的技術點作為開始,最初做了一個用人臉控制東西的小遊戲,包裝了一個 「運動頸椎」的概念,後來做了一些娛樂級的刷臉實踐,網絡上比較好玩的測年齡、顏值、夫妻相的APP,包括女生用的美圖秀秀,底層座標技術都是我們的,其它廠商會用這些技術開發很多創意。

三年前,馬雲表示要跟我們合作,解決幾個金融上的問題:一是支付問題,二是遠程開戶。「刷臉」能夠解決這兩個商業場景中的剛需——遠程合規問題,互聯網金融公司沒有線下營業網點,需要通過一種技術解決合規性問題。

從驅動力的角度來看這件事,技術是人臉識別技術,場景則是要解決遠程開戶的合規性,與此同時還需要證明遠程開戶是符合客戶本人意願的操作,這就涉及到了活體驗證。場景對技術提出了要求:把人臉識別技術集中到櫃檯和手機APP裡,而且要保證識別速度快。所以必須不斷的找場景,通過滿足場景提出的要求,讓技術一直持續有效的領先下去。

我們經常會接到來自全國各地各行各業的電話,希望我們幫助他們設計具有代表性和針對性的算法程序。德青源曾找過我們,他們有一個國家級養殖中心,裡面有10萬個雞圈,他們想通過在雞圈放置攝像頭的方式來統計雞的數量。我們經過思考,認為這個場景對於我們的技術來說並不成熟,落地難度非常大,所以通過這件事我們也收穫了一次歷練,明確了基於金融級別的人臉識別到底該做什麼樣的事情。

我們做人臉識別要有針對性地解決不同場景中的問題,如果不明白這個場景對技術的要求,就無法實現技術的快速進步。而且人臉識別不能只識別中國人,還要能識別外國人。比如這個月vivo在印度發佈了一款帶有人臉識別功能的手機,大部分印度男性都會留很濃密的鬍子,而且他們的膚色偏棕黑,識別中國人和識別印度人對技術的要求肯定不一樣,曠視用了三個月時間解決了印度人臉識別的問題。

AI+醫療

人工智能在醫療領域的發展前景有待觀察。現在「AI+醫療」能解決什麼問題?機器可以根據一張掃描片判斷病人患了何種病,這種判斷基於醫生們積累的經驗,也就意味著機器要錄入很多標淮化的東西。病人拿一張片子去給十家醫院的大夫看,可能會得到五個以上的結果。以前我的膝蓋受傷了,到醫院拍了一個MRI(Magnetic Resonance Imaging,磁共振成像,簡稱「核磁共振」),去了三家醫院,得到了三個結果。把同樣一張片子給機器,機器會選擇哪個結果?醫學需要考慮很多綜合性因素,每個人的生理狀態都不一樣,同一種疾病的病因可能是不一樣的,所以有「會診」這種形式,請很多老專家推斷可能的病因。從這點來看,醫學本身不具備這種大規模的標淮化數據錄入的可能。

人臉識別技術的新發展

最近幾年人臉識別技術實現了哪些突破?首先,人臉檢測最初需要在一張臉上測5個點,那時同一張人臉一旦更換髮型或者配飾,機器就識別不了了。現在一張人臉要識別3萬多個點,優勢在於不管被識別人怎樣化妝,不管處於何種商業場景中,不管面對什麼樣的自然環境,機器都可以完成識別。

其次,很多人覺得人臉識別不太靠譜,這是因為人類本身非常擅長人臉識別,用自己的視覺系統去質疑這項技術,不相信機器能夠超越人類完成海量的人臉識別工作。為什麼大家很少質疑指紋?因為我們都不會識別指紋,所以會認為機器能做得更好。其實機器和人看到的世界是兩個世界,指紋識別的淮確率和人臉識別的淮確率幾乎一樣。

另外,現在的人工智能已經可以實現多角度識別,甚至包括陰陽臉(臉部光照不均)都可以識別。

在技術的發展過程中,一定要找到商業場景中可能會出現的一切場景。人臉識別技術並不是科學家坐在辦公室裡就可以想出來的,科學家如果想讓人工智能實現商業化,需要讓自己變得「糙」一點,要想到普通人經常遇到的場景。

謝憶楠 vs 健一會沙龍現場投資人

除了安防和金融領域,現在還有哪些領域應用人臉識別技術?

除了安防、金融領域之外,零售業和手機也在使用人臉識別。許多無人零售店都是用我們的方案解決一些很基礎的問題,在手機上的應用已經很普遍了,手機廠商需要通過算法強化相機、相冊和解鎖等功能。

現在是否實現了算法和算力之間平衡?

謝憶楠:算法是為了優化算力出現的,解決技術的商業化落地,就是用最小化的算力實現最大的效果。我們的算法已經向小型模塊化發展了,爭取用一個10兆以內的算法模型去解決一個近似於150層神經網絡的問題。算法和算力要根據人工智能落地的設備來制定標淮。如果落地的設備是手機,就要通過SDK功能或者GPU優化,不斷減小功耗,使其符合設備的功耗標淮。這是一個命題作文,追求商業化落地,就要開始往芯片化、小模型化發展,所以算法和算力平衡的工作,需要結合根據客戶的實際情況去做。

人臉識別在教育行業有什麼應用?

曠視正在測試一項技術,在一間很大的教室裡,老師可能看不見後排的同學舉手,機器識別後會提醒老師哪位同學舉手了,同時還可以識別學生的眼神和動作,進行注意力分析。

能否介紹一下中國人工智能各個賽道的情況?

自動駕駛領域,汽車廠商能夠掌握這項技術。但自動駕駛到底應該實現車輛自動駕駛還是智能識別道路,這個問題有待深入探討。

視覺領域有很多分賽道。我不看好醫療,因為不能完全解決問題,不能產生價值;AI在教育領域是一個工具,本質上解決生產力的問題;安防領域發展空間很大,一臺服務器可以解放很多警力。金融領域同樣有很大發展空間。

還有零售業,人工智能可以解決很多問題,首先從最前端用人臉識別技術做選址,找出人流量最大的地方。然後是統計購買率,像7-11這種連鎖店,通過大數據能夠知道每一個區域的購買偏好,從而調整各類商品的供貨多少。其次是提高毛利率,降低店面損耗,比如在無人超市裡可以控制貨品丟失率。最後能夠提高復購率,幾秒鐘就能完成支付,沒有掏錢包的過程,顧客的購物體驗很好。所以人臉識別或者機器識別在零售業是有價值並且真實可行的。


分享到:


相關文章: