百度Duer OS 3.0 是「新一代」的作業系統?還差點兒

一年後,同樣的地點,李彥宏重新回到臺前,大聲宣告“Everyone Can AI”,並展示了各個業務線上的成果。

相較於上面的種種成果,去年重磅發佈的Duer OS今年顯得存在感稀薄,因為除了“打通商業模式閉環”啟動商業分成這一點外,並沒有吸引到媒體的關注。

但實際上,Duer OS 3.0不僅帶來了核心技術方面升級,還提供超過20多個跨場景、跨設備的解決方案,同時為合作伙伴打造平等賦能的生態環境並努力構建商業模式的閉環。就如同官方所說,Duer OS 3.0是“新一代的操作系統”。

百度Duer OS 3.0 是“新一代”的操作系統?還差點兒

渡鴉輸掉了戰役,但Duer OS沒有輸掉戰爭

渡鴉音響徹底涼了,而無論是天貓精靈、小米小愛還是騰訊聽聽,都在用的是思必馳的解決方案。渡鴉輸掉了戰役,但是Duer OS並沒有輸掉戰爭。因為除了智能音箱外,Duer OS還和美的、海爾、聯想、VIVO、TCL等眾多領域的知名企業達成合作,將DuerOS的對話能力應用到了多場景。

截止 2018 年 6 月,Duer OS智能設備激活量已經超過 9000 萬,月活躍設備超過 2500 萬。Duer OS平臺生態持續擴大,合作伙伴數量已經超過 200 家,搭載 Duer OS落地的主控設備超過 110 多款,在 DuerOS 平臺上的開發者群體已經超過 16000 人,這三個數據均為國內第一。

劃時代的自然對話交互

劃時代的自然對話交互是兩方面的,一個是核心技術的提升,另一個是跨場景跨設備的解決方案。

在核心能力的部分,Duer OS 3.0帶來了情感語音播報、聲紋識別、智能引導與糾錯、視覺搜索能力、視頻理解能力等自然語言交互技術的全面升級。

WaveNet+拼接讓小度播報的流暢度和自然大幅度提升,聲紋識別為用戶提供個性化的交互體驗,系統增加了為孩子設計的兒童模式以及支持連續對話無需重複喚醒的極客模式,另外增添了視覺搜索能力與視頻理解能力。

最讓現場觀眾驚歎的是兒童模式與視頻理解能力。在主辦方的演示中,兒童模式不光聲音、內容與交流方式不同,而且在播放視頻的時候還能智能跳過不適合少兒觀看的鏡頭。而視頻理解能力支持實體識別、場景識別、動作識別與視頻生成,在演示中,可以實現視頻中的臺詞甚至劇情的搜索跳轉。

在場景與解決方案的部分,Duer OS 3.0提供包括有屏設備解決方案、藍牙設備解決方案和行業解決方案等在內超過20個跨場景、跨設備的解決方案。 有屏設備解決方案不只是增加了一塊屏幕,實際上很多機器對人的輸出最高效的實現形式其實是圖文視頻,比如導航線路的規劃,如果語音播報,可能需要花費一分鐘以上。

Duer OS的有屏設備解決方案,是一個以語音交互為中心、軟硬一體化的全鏈條解決方案。通過一塊只有名片大小的模組方案,合作伙伴的屏幕設備就可以被打造成一個可以對話的有屏設備。同時,DuerOS還聯合洛可可,為合作伙伴提供不同場景、完整的有屏設備參考設計。

百度Duer OS 3.0 是“新一代”的操作系統?還差點兒

Duer OS行業解決方案,已逐步覆蓋酒店和養老場所等場景。以洲際酒店為例,賓客可以通過語音控制客房智能家居控制、設鬧鐘、查信息、獲取酒店應用服務等。

此外,Duer OS還提供安卓APP的語音交互解決方案,通過音語義一體化、場景註冊等技術,實現場景自適應,降低安卓開發者進入AI行業的准入門檻。如在麻將類遊戲中,通過吃、碰等語音進行操作。

對話式內容服務生態

AI時代,用戶獲取內容與服務的門檻越來越低,Duer OS技能開放平臺支持以自然交互為主、多設備、多形態的技能開發,以需求為中心,打造直達用戶、張口即得的用戶體驗,併為開發者打造健康、開放、共贏的生態。

Duer OS 3.0提供包含基礎工具、有屏技能工具和付費技能開發等全面的技能開發工具;推廣方面,以技能商店、小度在家home card與query推廣作為分發入口,精準推廣來自開發者的優質技能。

作為國內首個支持帶屏技能開發的開放平臺,Duer OS技能開放平臺/小度技能開放平臺已彙集超過16000名開發者,上線技能超過500個,技能類型數量超過15種,成為國內最具活力的技能開放平臺。

用戶只需說出“我想唱歌”,搭載Duer OS的設備就可以打開“唱吧”, 用戶說一句“我想學英語”,在線少兒英語平臺VIPKID就會打開。隨時隨地,不需要像在其他設備上打開特定的APP。

百度Duer OS 3.0 是“新一代”的操作系統?還差點兒

打通商業閉環

Duer OS 3.0有兩種變現形式,一種是技能內付費,另一種是付費技能,相當於內購制與買斷制。開發者可以自行選擇。會上Duer也宣佈了與凱叔講故事和Discovery的合作。

為了更好的鼓勵開發,Duer OS還提供了對話技能大賽以及億元開發者支持計劃,提供開發資金傳播資源,雲服務器教育成長以及流量支持孵化基金等形式的支持。

觀察:商業閉環與屏幕共享仍需努力

未來圖靈認為Duer OS 3.0的確可以稱得上是新一代操作系統,但是在兩個方面仍然需要努力。 第一個方面是商業閉環的部分,用戶付費的實現的形式是掃描屏幕的二維碼支付,而不是聲紋支付。官方解釋說,這是為了避免操作失誤。但這個理由的確很牽強,因為如果聲紋技術足夠好的話,這個問題是不存在的。更何況,官方也承認,想利用戶的“衝動消費”,明明可以“一句話的事”,卻要讓用戶拿起手機掃二維碼,那種衝動又不知道要冷卻多少。

商業閉環的第二點,就是是否有足夠的動力讓用戶內購。官方的宣傳片中,用戶在一個聽歌曲猜歌名的遊戲中購買了道具。手機上的遊戲、小程序的內購,有一個重要的因素就是社交分享系統,可以購買道具刷分然後炫耀。但是智能音箱卻不存在社交的要素。如果是一般用戶的話,在聽歌曲猜歌名的時候遇到問題,拿起手機後,想到的應該是用手機上的聽音識曲軟件去識別,而不是去付錢。缺少了社交的要素,很多的內購其實是不存在的。

商業閉環的第三點,就是場景不佳的問題,在官方的宣傳片中,家長和孩子要看Discovery,告訴帶屏幕的智能音箱,購買後兩個人圍著智能音箱去看,這其實是很魔幻的一件場景。如果能夠實現屏幕共享,完全可以在手機上或是OTT大屏上去看,畢竟靠在沙發上看大屏,比彎腰盯著智能音箱的小且分辨率不高的屏幕要舒服的多。

第二個方面就是剛才提到的屏幕共享。實際上屏幕共享是去年穀歌就提到的一項技術。用戶可以將Google Home的任何信息投射到自家電視上或者手機上以及一切和谷歌相連接的智能終端上面。

優質的內容可以投屏到電視或使用手機獲取,另外一些日常的工具,屏幕共享也有很大的用處,以導航為例,當我們對智能音箱說導航時,我們的確想知道具體的路線,但是如果這條信息顯示在手機上,或者是智能汽車上,會更加的方便。


分享到:


相關文章: