有了 3D 形象的微軟小冰,終於要跨步向前了

有了 3D 形象的微軟小冰,終於要跨步向前了

摘要:提出 Dual AI 戰略,同時宣佈商業落地,微軟小冰開始駛入發展的快車道。

在科幻電影中,導演們經常會設定擁有人類情感的機器人角色,這大概也是絕大多數人心目中未來機器人應該有的樣子。而在目前眾多的人工智能平臺中,微軟小冰可能是距離該目標最近的一個。

作詩、唱歌、陪人聊天,即便客觀層面上小冰做的依舊並不完美,比如你和她聊天的時候,總會收到一些無厘頭的回覆,但她正在一步步向著人們理想中的人工智能靠近。

7 月 26 日,微軟在北京召開了第六代微軟小冰年度發佈會,不僅小冰團隊,微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋博士也親自來到現場為其「站臺」。

有了 3D 形象的微軟小冰,終於要跨步向前了

提出 Dual AI 戰略,完成商業落地

第六代微軟小冰年度發佈會是小冰為數不多在微軟總部大廈之外場地舉辦的發佈會,這也從另外一個角度說明了此次發佈會的重要性。

與國內很多其它同樣在做人工智能相關技術研發的廠商有所不同,微軟小冰在過去的幾年裡,一直沒有提「平臺」這個概念。去年六月份,在與微軟亞洲互聯網工程院副院長李笛的對話中,他也曾提到,「我們更願意將小冰成為體系,而非平臺。」

時隔一年之後,微軟在第六代微軟小冰年度發佈會上釋放出的第一個重要信息就是,提出 Dual AI 戰略。某種角度上來看,這也意味著至少現在來看,微軟對於其在人工智能技術方面,已經有了足夠的信心。

有了 3D 形象的微軟小冰,終於要跨步向前了

具體來講,Dual AI 戰略的具體實施將會由三部分組成。具體包括微軟提供小冰的整體框架能力,去幫助合作伙伴平臺的自有 AI;微軟小冰作為該合作平臺的輔助 AI,融入該平臺生態;微軟通過技術、產品與運營,圍繞該合作平臺的差異化特點,推出合作的應用和產品。

簡單來講,Dual AI 戰略的整體思路並非以自身為核心去打造一個新的人工智能生態,而是通過輸出技術的路徑,去融入到其它已有的 AI 平臺中。換句話說,微軟想要做的是去中心化。

在我們看來,在國內各家人工智能平臺已經逐漸開始走向成熟的今天,微軟的做法顯然更容易讓小冰實現商業落地,這同時也將幫助它更加快速地走向成熟。

按照發佈會上發佈會上公佈的信息,目前微軟小冰已經與網易、小米米家生態鏈、騰訊以及華為四家廠商達成了合作。

內容上,其與網易雲音樂合作推出了小冰電臺,並且幫助網易雲音樂打造了兩個專屬 AI 人物(多多與西西)此外,微軟與網易新聞客戶端合作帶來了讀新聞小冰,已於兩個月前突破 1000 萬次新聞閱讀評論。

包括兒童故事、音樂等多個領域的深度提高、全雙工語音技術的升級等,對 Yeelight 語音助手硬件產品中的小冰進行了大幅度更新。同時,發佈會上微軟宣佈,小冰與小米人工智能語音助手小愛同學將在未來進一步緊密合作。

繼續加強與騰訊的合作,除已合作的 QQ 小冰之外,微軟小冰已經開始為騰訊 BabyQ 提供部分人工智能技術和產品支持。就目前而言,微軟與騰訊合作,為 QQ 小冰及 BabyQ 打造了超過 40 項平臺專屬技能。

另外,這次發佈會上,微軟首次對外公佈其與華為建立了合作關係,包括華為以及榮耀品牌手機在內,其都將內置微軟小冰上線,所有升級至智能助手 8.2 版本及以上的用戶都能體驗到該功能。

值得一提的是,在華為已經榮耀手機上,小冰除了提供各平臺通用的小冰產品體驗外,還為特別推出了幫助用戶記錄信息等多個任務完成型產品技能(目前已經上線)。

上線全新共感模型

機器人與人類進行對話在今天並不是一件稀奇的事情,包括兒童早教機器人以及智能音箱在內的絕大多數智能硬件產品都可以實現。

但在實際使用過程中你會發現,很多此類產品依舊處於問答式交互,機器人答案的受限於已有的對話語料庫。也就是說,其最終的交互內容其實還是來自於人類的設定。

所存在的侷限性是,即便耗費大量的人力資源,也很難將世界上所有人的溝通習慣用語進行收錄,最終反饋到用戶體驗上,也必然無法做到最好。

有了 3D 形象的微軟小冰,終於要跨步向前了

對此,在今天發佈會上,微軟宣佈正式上線全新的共感模型,同時開始公測一種融合了文本、全雙工語音與實時視覺的新感官,它融合了共感模型的對話引擎、全雙工語音和實時視覺三個類別的全新感官。

而「共感模型」所要解決的,正是上邊我們提到的這個問題。簡單來講,小冰可以自己創造回應,不需要從已有的對話語料庫中檢索而得,通過自創回應,小冰能夠實現牽引對話向她所希望的方向進行,整個對話邏輯更加接近於人類。

提及創造,這次在發佈會現場,微軟談到了其對於人工智能未來發展趨勢的看法。微軟認為,利用人工智能技術,學習人類並進行與人類質量水平相當的內容創造,是目前尚未被行業注意到的未來趨勢。

而在這部分,正如文章開始我們講到的,微軟小冰已通過人工智能技術,實現了詩歌和金融等領域的文本內容生成、歌曲及有聲讀物等領域的有聲內容生成,以及電視電臺節目和可交互式電臺等串流內容領域的生成工作,並分別完成了不同程度的落地。

同時,發佈會上微軟也微軟推出了第四版人工智能歌曲 DNN 模型。對比上一代模型,其能夠進一步快速合成接近人類歌手演唱的歌曲。特別的是,該技術還能夠完整吸收並複製特定人類歌手的演唱特質(比如嗓音、韻律等),使小冰具備代替原人類歌手完成新作品的創作的能力。

新形象與新路程

如果你之前對微軟小冰有所瞭解,應該知道它是以現實中的人類作為形象的。現在,微軟將小冰的外形替換為了全新的 3D 模型(如下圖)。

有了 3D 形象的微軟小冰,終於要跨步向前了

在形象改變的背後,包括與網易、騰訊、小米生態鏈以及華為的合作,從這場發佈會上我們可以得到一個清晰的信號是,微軟小冰已經走過了初期基礎技術積累階段,開始進入新的發展階段。

通過加速在實際應用場景中的落地,不僅可以幫助小冰更快速地完成數據積累,更重要的是能夠根據用戶反饋,來更好地實現自我進化。

就目前看來,微軟小冰在各個平臺上所展現出的能力還是有些碎片化。但如果從長遠的角度出發,一旦其在各個方面都做到了比擬人類的水平,小冰很有可能成為最先接近於人們理想中未來的機器人。

到那時,以往我們只能在科幻電影中才能看到的場景,也許將成為現實。而人工智能時代最終的幾個贏家中,也一定會有微軟。


分享到:


相關文章: