穿越時空 AI代我告訴你:“愛你何止三千遍”

穿越時空 AI代我告訴你:“愛你何止三千遍”

鉛筆道專欄作者丨頂商投資

“ I love you three thousand.” 《復仇者聯盟》4的末尾播放了一段鋼鐵俠犧牲前的錄像帶,立體投影下的託尼·史塔克深情款款地說。影片工作室中,酷炫的全息投影顯示不僅可以多樣化地展示圖像,三維空間浮空操作的方式也有很好的操作體驗。

立體投影、全息投影,AI交互,影片中的黑科技在現實中得以不斷實現,貼近現實生活。

時間追溯,自從Alpha Go擊敗韓國棋手李世石之後,人工智能將成為未來科技發展的趨勢這一點已經被世人所承認。在人工智能的熱潮真正到來的今天,人工智能究竟怎樣改變人們的生活成為了全世界需要思考的新問題。

目前的人工智能主要在語音、自然語言和視覺方向發展比較迅速,其中最成熟的就是視覺技術,國內外的市場佔比都超過了40%。

穿越時空 AI代我告訴你:“愛你何止三千遍”

那麼,視覺技術為什麼會發展的比較快呢?這主要有兩方面的原因:一方面是視覺技術本身針對的圖像識別相對比較直觀,圖像的色彩、灰度、空間等都是可以量化的特徵,對於人工智能的訓練和推理所需要的mapping比較契合;另一方面是視覺技術屬於感知和認知信息的首要方式。根據人類獲取信息的途徑來看,視覺佔據了人類信息獲取的80%。而計算機視覺技術不僅可以替代人眼,還能夠做到很多人眼所不能做到的高速、高精度和高適應性的視覺識別。

那計算機視覺到底怎麼改變了我們的生活呢?也許是支付寶的刷臉支付,也許是手機的臉部識別,也許是各種各樣App裡的美顏功能……

但是,事實上,在這些消費級的計算機視覺不斷出現在我們身邊時,工業領域早就已經大規模應用計算機視覺技術,並且幫助企業提高生產效率,較低人力成本,減少了生產過程中的錯誤,為企業創造了巨大的價值。

當計算機視覺被應用到工業領域時,最具優勢的應用形式就是工業機器的3D視覺檢測。在工業發展迅速的今天,依靠人工進行產品的缺陷檢測,不僅人力成本巨大,而且對檢測人員的重複勞動所帶來的視覺疲勞問題也得不到解決,尤其是在汽車和消費類電子行業,出貨量巨大,對產品精度的要求又很高。單純依靠人工,效率和準確率都得不到保障。而3D計算機視覺的出現,很好地解決了這一痛點。

3D計算機視覺技術路徑

那麼計算機視覺究竟是怎麼做到比人眼更快更準確的呢?首先需要了解現有的3D計算機視覺技術。

穿越時空 AI代我告訴你:“愛你何止三千遍”

目前主流的3D計算機視覺有三種技術路徑:雙目法、結構光和TOF。

雙目法是指採集圖像中的特徵點,構建物體的幾何模型,這種方法誕生最早,應用最久也最廣泛。因為雙目法採集的是正常攝像頭所拍攝到的畫面,這對硬件的要求較小,成本也最低。不過雙目法以2D圖片為識別對象,特徵較少,從精準度上來說,也是最低的。不過也正是它不需要專業設備即可識別圖片的特性,決定了它具有極強的延展性和豐富的應用場景。

結構光目前已經應用在OPPO R11/R15、iPhone X中,這種技術採樣準確,識別精度也相當高,在設備和算法的支持下,即對物體材料也能夠識別。3D結構光檢測技術利用空間位置編碼技術結合三角測量法可實現3D形貌的精確檢測,具有速度快、部署效率高、光學結構簡單的優點。

TOF是飛行時間(Time of Flight)技術的縮寫,即傳感器發出經調製的近紅外光,遇物體後反射,傳感器通過計算光線發射和反射時間差或相位差,來換算被拍攝物體的距離,以產生深度信息。簡單來說就是,發出一道經過處理的光,碰到物體以後會反射回來,捕捉來回的時間,因為已知光速和調製光的波長,所以能快速準確計算出到物體的距離。TOF技術優勢在於成本低,測量距離和抗干擾能力也強於結構光技術。但TOF分辨率低於結構光,其精準度不及結構光。

就目前工業生產檢測所需的精度要求來看,產品的誤差範圍要求都是微米級,工作環境也要求所採用的技術適應性要強。不難發現,3D結構光是最適合工業級別的3D視覺檢測的。也正因為3D計算機視覺在工業生產中的重要作用,目前已經開發出基於3D計算機視覺的專用AI芯片(FPGA),該技術利用FPGA實現動態視覺採集與分析處理,在成像過程中僅關注圖像的變化部分,極大降低數據帶寬消耗,從而大幅提升圖像的處理速度。而計算機視覺技術的進一步提升將在工業生產中的定位、引導、檢測和質量控制等領域發揮更強的提升和替代作用。

解鎖多樣化應用場景

安全支付、三維建模、遊戲互動、數據採集,光學識別技術在拍照、美顏、視頻、互娛、展覽等領域落地應用。以下側重從新零售、展覽展示兩個場景領域展開。

新零售。目前該領域與視覺相關的主要包括人臉識別支付、商家結算收銀。而在結算這塊,相關的還有RFID、重力感應等方式。RFID射頻設別技術與AI視覺識別支付的區別,可以從有無RFID標籤,攝像頭等外部功能來辨別。但現有視覺識別結算技術在物品疊放、超越視覺區域等方面仍然存在侷限。此時便需要其他技術如重力感應等來輔助確認。

展覽展示。廣告傳媒、娛樂互動領域的應用可以分為兩個層面:第一層面單向視覺傳播;第二層面傳感器互動感應,人工智能算法及時互動。技術難易度上,後者雙向技術複雜綜合,而目前雙向技術應用較多的主要通過紅外線、雷達感應互動,此外語音互動也是一大互動入口點。即用戶最終看到的是AI視覺識別+傳感器+手勢互動+語音互動+……技術應用疊加,人工智能化。

不論是復聯裡出現的3D投影對話,還是現實中結構光與TOF技術在手機端的應用,可以發現的是3D計算機視覺正深入多個場景,解鎖多樣化應用場景。此外,5G技術趨勢也在為視覺識別影像技術的應用提供技術環境沃土,人工智能項目百舸爭流。

文章為鉛筆道專欄作家原創作品,轉載請與原作者聯繫,未按照要求轉載者,鉛筆道保留追究相關責任的權利,本文僅代表原作者觀點。

創業者報道通道: wujinna1015 (添加微信請註明項目名稱、職位)

項目融資加速通道: jiazongchaopku (添加微信請註明項目名稱、職位)


分享到:


相關文章: