騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018

12月4日到7日,第11屆SIGGRAPH Asia在日本東京舉行。作為國際頂級專業學術會議,SIGGRAPH Asia從2008年起每年召開,這也是有計算機圖形圖像研究領域“奧斯卡”之稱的SIGGRAPH唯一的分會。SIGGRAPH Asia 2018匯聚了全球從事科研(硬件、軟件)、電影、遊戲、藝術、動畫、人機交互、教育和新興技術等方向的最前沿的專家、創意人員以及愛好者,大家齊聚一堂,展示世界頂尖的科學、技術、創新與思想。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


以這一世界級舞臺為窗口,“清華大學-騰訊聯合實驗室”聯合騰訊AI Lab、互娛NEXT技術中心、優圖實驗室、音視頻實驗室、騰訊視頻、自動駕駛中心等多個騰訊頂尖AI團隊,參與SIGGRAPH Asia 2018的展廳展示及Exhibitor Talk環節,為近萬名來自60多個國家的參會者,帶來了高保真可交互的虛擬人Siren、自動生成日系二次元頭像的AI畫師YUI、基於人眼視覺的騰訊麗影、基於人臉人體識別技術的智慧商超、防遮擋的視頻智能彈幕、基於智能物聯的微派機器人、自然場景漢字的自動識別等多項行業頂尖AI體驗。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


一、高保真可交互虛擬人Siren – 騰訊互娛NEXT技術中心 & AI Lab

近年來,AI技術的日漸成熟促進了IoT設備的爆發式增長,語音助手、聊天機器人逐漸走進我們的生活。為了給用戶創造出更生動的交互體驗,騰訊互娛NEXT技術中心與AI Lab聯合研發的Siren AI,賦予虛擬人AI的大腦和具體的形象,讓虛擬人能聽會道。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


基於虛擬人的語音交互是一個複雜的過程,涉及多個AI研究和工程領域:語音激活檢測(VAD),語音識別(ASR),自然語言處理(NLP),語音合成(TTS),語音驅動面部動畫(ADFA)。在虛擬人Siren的研究中,基於騰訊已有的AI解決方案,主要攻堅的是語音驅動面部動畫(ADFA)相關技術。在解決實時驅動虛擬人的技術難點時,團隊注意到Siren具有精巧的Rig Logic,能將80維左右的Rig Controls參數映射到數千維的臉部Rig Elements參數(Blend Shapes, Joints, Wrinkle Maps, etc. )。基於規則的映射,研發團隊將語音驅動模型輸出並抽象到80維左右,大大縮減了模型規模,同時降低了訓練難度。在訓練中,團隊在面部動捕的同時採集音視頻數據和Rig Controls序列數據,然後離線處理成一一對應的訓練數據,並採用Time Code和專業的音視頻採集設備數據解決對齊和掉幀的問題。

二、自動生成日系二次元頭像-AI畫師YUI – 騰訊AI Lab

圖像轉換(Image Translation)是目前計算機視覺領域最熱門的研究方向之一。騰訊AI Lab運用這一技術,自主研發了“畫師YUI”,可以將用戶的真人頭像轉換成萌萌的二次元頭像。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


YUI背後的核心技術是AI Lab自研的 “堆疊式循環一致性生成對抗網絡”。它首先學習低分辨率的圖像轉換,然後基於低分辨率的轉換結果在更高分辨率下學習圖像轉換,進而提高圖像轉換質量。團隊採用了基於生成對抗網絡(GAN)的方式來訓練 YUI 的轉化網絡。這一生成對抗網絡由生成器和判別器兩部分組成。生成器不斷地學習如何生成更高質量的二次元形象來欺騙判別器,同時判別器也不斷學習如何更好地區分原始的二次元形象和生成的二次元形象。兩者相互促進,最終使生成器能夠根據輸入人像生成接近人類畫師水平的二次元形象。目前,用戶可以通過微信小程序利用該技術將自己的真人頭像轉換為二次元頭像,未來YUI將支持更精細的畫風適配,甚至擴展至視頻應用中。

三、更小更漂亮的視頻魔術師“騰訊麗影” – 騰訊音視頻實驗室

騰訊麗影是騰訊音視頻實驗室推出的基於人眼視覺標準的視頻服務平臺,能將人眼視覺標準,貫穿視頻處理服務的七大模塊:分析、理解、修復、處理、編碼、傳輸和評估,讓每一個環節都以人眼視覺最優為目標。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


騰訊麗影的人眼視覺識別

利用人眼視覺的特性,騰訊麗影可以自動找出視頻中人眼感興趣的部分,然後將視頻分成人眼關注區域和非關注區域分別壓縮和處理。同時,平臺還能融合多種視頻增強技術來提升視頻感官質量,如去除可見噪點、低照度增強、去抖動、銳化增強、超分增強(SD->HD 2K->4K)、去除原始編碼失真、去除毛刺、去除鋸齒、幀率上採樣、去除運動模糊、HDR等等。經騰訊麗影壓縮處理後的視頻,人眼的畫質觀感不但不會變差,反而可以超越源視頻,達到視頻修復並增強的效果。

四、智慧商超中的人臉人體識別 – 騰訊優圖實驗室

在城市生活方面,騰訊優Mall智慧零售系統通過大數據AI,賦能智慧零售。該技術基於人臉檢測配準、人臉識別、人體Re-ID、人流密度分析以及人臉人體聯合追蹤等計算機視覺技術,通過騰訊優Mall智能零售系統,為消費者提供從進店、逛店到購買的全方位更優質的消費新體驗。與此同時,零售商家可以通過VIP及老客到店識別、細粒度客流統計、客流軌跡統計等全面刻畫場內用戶行為,實現精準營銷。目前,騰訊優Mall已經與百麗國際、永輝等客戶達成合作。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


優圖智慧商超解決方案中的客戶動線分析和停留路線統計

此外,騰訊優圖聯合騰訊雲、每日優鮮最新推出的智能貨櫃解決方案,基於商品識別技術,可實現取物關門後自動生成訂單結算,為用戶提供“即拿即走”的流暢購物體驗,準確率達99%以上。

五、智能防遮擋彈幕 – 騰訊視頻

此次SIGGRAPH Asia中,在交互體驗上,騰訊視頻展示了為用戶提供了智能防遮擋彈幕技術和“只看他”功能。智能防遮擋彈幕技術通過對視頻內容的分析,分割出視頻中的人體區域,讓彈幕在經過人體區域時被遮擋,使用戶可同時享受觀看彈幕和視頻的樂趣。同樣基於AI技術對視頻內容分析的“只看他”和臺詞提取與分享功能,也讓視頻用戶獲得更有趣的交互體驗。

在觀看體驗上,TIE(鈦)視頻增強技術能給用戶提供更細緻的視頻觀看體驗。它在SDR的基礎上,自適應地對視頻內容的對比度、飽和度優化,讓呈現的畫面色彩更鮮豔,層次更分明。結合視頻超分辨率技術、HDR10 轉換和增強技術,和ROI(感興趣區域)編碼,騰訊視頻能為用戶提供畫面更清晰,視覺效果更好的觀看體驗。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


六、基於智能物聯的微派機器人 – 騰訊自動駕駛業務中心

本次大會上,騰訊自動駕駛業務中心展示了由騰訊自主研發的AI技術與物聯網高度融合的智能配送機器人 – 騰訊微派。 根據末端配送應用場景,提供包裹分發、智能運輸、便捷簽收等一體化定製服務,真正做到在室內環境下將包裹安全、高效送達。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


騰訊微派集成深度定製化的機器人操作系統,依靠自主研發的高性能SHIELD 模塊化自主定位導航算法,結合多傳感器融合感知解決方案,自研圖像識別引擎、多模態人機交互等機器人核心技術,已實現在複雜大場景下構建地圖、智能網聯、規劃軌跡、自主行走與避障,並具備調度物聯設備的綜合服務能力。

七、自然場景漢字的自動識別 – 清華大學-騰訊聯合實驗室

在自然場景照片上,文字會出現遮擋、透視變換、陰影、字體不一致等複雜情況,在此情況下識別漢字要比在掃描文檔上識別困難得多。

清華-騰訊聯合實驗室可視媒體智能處理團隊利用字符級別標註的特點,將物體檢測和識別的神經網絡(包括AlexNet、OverFeat、Google Inception、ResNet和YOLOv2等模型)應用到街景漢字檢測和識別中,從而實現室外街景漢字的高準確度檢測和識別。這項技術可以用於街景中POI信息的自動提取,豐富地圖中POI信息的細節。

騰訊多項行業頂尖AI黑科技亮相 SIGGRAPH Asia 2018


為了給神經網絡訓練提供大量漢字數據集,清華-騰訊聯合實驗室在騰訊街景照片中挑選了32285張照片,並標註了超過100萬個漢字及其屬性信息,共創了迄今為止最大的真實場景漢字數據集。

據瞭解,騰訊董事會主席兼首席執行官馬化騰曾表示,AI、雲計算、大數據是騰訊關注的重點,將持續與學術界、產業界開展各種合作。成立於2010年的清華-騰訊聯合實驗室,就是騰訊在產學研結合新模式上的探索:騰訊攜手清華大學共同承擔國家重大科研項目,探索原創性的技術成果,培養和吸收一流的高素質人才。在深入合作的AI、社交網絡、大數據、安全、互聯網+等領域,聯合實驗室取得了豐碩成果,共同研發的幾十項科研成果現已在騰訊業務上得到實際應用。未來雙方將在更廣的領域、更深的層面開展更緊密的合作,為騰訊的業務發展、為清華大學的學科建設做出更多貢獻。

騰訊更多AI黑科技 一起期待吧…


分享到:


相關文章: