一部音箱,一個平臺,亞馬遜開創的「語音交互時代」

一部音箱,一個平臺,亞馬遜開創的「語音交互時代」

摘要:別調戲各路中文語音助手了,瞭解 Echo 和 Alexa 才是正經事。

語音時代核心硬件形態:Echo 定義

四年前,搭載語音助手 Alexa 的亞馬遜智能音箱 Echo 問世,伴隨其出現的,還有一個全新的概念,「Voice First」。當時亞馬遜 Echo 的負責人 Mike George 認為,語音交互具有完全無門檻的易用性和高度直覺化的引導,所以人機交互的未來將圍繞著「語音」展開。這套理論在當時並沒有得到廣泛的認可,畢竟彼時 Siri 問世已有 3 年,並沒有做出什麼實質性的成績,人們對 Siri 的使用更多是停留在「調戲」的層面,很少有人會真的從實用的角度去討論如何使用 Siri。

人們對語音交互有著天然的不信任,也很難從過去幾十年的圖形界面的舒適區中馬上走出來。亞馬遜卻認為問題並不出在「語音交互」本身。它通過 Echo,大刀闊斧地砍掉了「圖形界面」的存在,用音箱這種形式,「強迫」用戶通過語音去和這樣一個計算設備進行交互。

在屏幕消失之後,用戶開始發現其實語音交互在一些場景下反而相當方便且高效。早上起來一邊刷牙一邊問問 Alexa 今天的天氣,讓 Alexa 播放自己喜歡的音樂。Echo 的誕生讓人機之間的「有效交互距離」被顯著延長了,你不需要將手放到鍵盤鼠標上,不需要將手指放到觸摸屏上,就可以「隔空」和一個計算設備進行交互,這是智能音箱的核心產品優勢。

一部音箱,一個平臺,亞馬遜開創的「語音交互時代」

後來的故事我們都知道了,谷歌、蘋果反而成為了跟隨者,Google Home、HomePod,是這兩大巨頭對「Voice First」理論的認可。蘋果在 HomePod 的產品設計上主打音質而非「智能助手」,且在發售時間上姍姍來遲,緊隨其後的消息就是其銷量上的滑鐵盧。三個月 60 萬臺的銷量,使蘋果在智能音箱這個新戰場上僅僅佔據了 6% 的市場份額。而同期 Echo 的銷量卻高達 400 萬臺。

Echo 在語音交互世界裡,為亞馬遜獲得了產品形態的領先,最新的數據顯示,Echo 已經佔據了這個市場 73% 的份額。亞馬遜也在過去的幾年裡儘自己所能,讓 Alexa 進入越來越多的硬件。無論是智能家居還是車載智能系統,亞馬遜希望 Alexa 無處不在。

谷歌也是這麼想的,所以從去年到今年的 CES 上,亞馬遜和谷歌圍繞著第三方硬件支持展開了一場軍備競賽,越來越多的第三方硬件開始支持 Alexa 或 Google Assistant,正在漸漸形成一種「一呼百應」的態勢。

從 Skills 到 Blueprints,Alexa 開始做得更多更好

但亞馬遜深知,硬件層面的產品形態只是「Voice First」的第一步。更關鍵的深層次問題仍然在於軟件的體驗,如何讓 Alexa 可以做的事情越來越多,最終圍繞著語音交互搭建起一個豐富完備的平臺,逐漸開始生態化,才是亞馬遜完成這樣一個「語音烏托邦」的關鍵。

所以亞馬遜為 Alexa 打造了「Skills」(技能)。Skills 允許第三方開發者針對 Alexa 開發應用和功能,讓用戶可以藉由 Alexa 使用第三方的服務。(類似於開發者為蘋果生態開發的可在 App Store 下載的 App。)到去年,Alexa 上的 Skills 數量超過了 15000 個,遠超谷歌的同類產品「Action」(動作)。更不必說蘋果必須配合 App 才能工作的 SiriKit,在發佈兩年之後還處於一個幾乎未起步的狀態。

第三方開發生態的蓬勃發展,讓 Alexa 在第三方服務接入的生態豐富性上一騎絕塵。但這並不代表 Alexa 的體驗能夠碾壓 Google Assistant。Alexa 的平臺上仍然存在著大量沒什麼人用的冷門 Skills,市場調研結果也顯示,絕大多數情況下用戶仍然只用亞馬遜本身開發的那些簡單的基礎功能。而論基礎功能,Alexa 和 Google Assistant 甚至 Siri,在體驗上並沒有很大的差別。

一部音箱,一個平臺,亞馬遜開創的「語音交互時代」

這可能是 Blueprints 誕生的源動力。

一個月前,亞馬遜為 Alexa 帶來了 Skill Blueprints 功能。直譯過來的意思就是「技能藍圖」。Blueprints 有點像針對 Alexa 的 Workflow,用戶不需要任何編程語言知識,就可以利用 Blueprints 中預設的模版,將你想要提供的信息以「答案」的形式寫進已經準備好的「問題」裡,打造屬於用戶自己的「技能」。

儘管目前 Blueprints 所支持的預設功能還非常有限,只能在預設的模版下,為特定問題預設答案。這使其在應用層面沒有太多的靈活性,僅僅能用它來製作一些「問答遊戲」。包括其中一個比較實用的功能是,讓來到家裡的訪客可以問 Alexa 家裡的 Wi-Fi 密碼,以及如何使用電視這樣的問題。目前製作好的「藍圖」也不能被髮布或分享,嚴格與製作者的亞馬遜賬號綁定。

但 Blueprints 的產品邏輯使其完全有潛力成為亞馬遜自己的 Workflow 或 IFTTT,通過設置一系列的條件和操作,其完全可以讓 Alexa 平臺上的眾多功能更加有機地結合起來。

想象一下,你對 Alexa 喊出「我要去上班了」,Alexa 就可以自動關閉家裡的燈、在關門後自動落鎖,開啟洗衣機,然後自動為你叫一輛 Uber。這在未來將成為 Alexa 上眾多功能的粘合與催化劑,也會讓目前的語音交互到達一個全新的次元,在定義上也將更加接近於「系統」的概念。

語音時代:將語音交互的邊界推向更遠的遠方

在「培養用戶的語音交互習慣」取得了初步成果之後,亞馬遜推出了帶屏幕但主要交互仍基於語音的 Echo Show。而在今年 Google I/O 的首場 KeyNote 上,谷歌也宣佈其將在今年力推帶屏幕的 Smart Display 產品。在消費者已經開始慢慢習慣與智能設備進行語音交互之後,帶屏幕的 Smart Display 存在的產品意義很明顯,就是要拓寬這樣一個語音交互世界的版圖,讓智能助手有更強大的信息展示功能。當用戶問接下來一週的天氣時,與其將每一天的天氣用語音播報出來,直接在屏幕上顯示一張氣溫折線圖,一定是更高效的。將語音交互和圖形界面進行更深度的結合,有助於將智能語音助手進一步打造成一個完整的,擁有強勢功能的「下一代操作系統」。

作為語音交互領域的領軍者,亞馬遜已經繪出了一副完整的藍圖,描繪了這樣一個「語音烏托邦」。無論未來的世界是否將被語音交互所主導,它至少會成為一塊誰都不可忽視的大蛋糕。今年的 CES,亞馬遜和谷歌在智能硬件領域仍打得熱火朝天,兩邊都想獲得這樣一個「語音烏托邦」的主導權。

有一種觀點認為,亞馬遜之所以要搶佔語音交互領域的先機,其中的最關鍵原因在於,作為一家零售商,亞馬遜想要佔領一個「最簡單、最直接的指令入口」。這種解釋是很合理的,在語音交互的抽象世界裡,「默認選項」的壟斷力量只會比圖形界面更強大。如果人們習慣了對著智能音箱喊一句指令就可以買東西的生活,將這些指令接入到亞馬遜自身零售業務的重要性是不言而喻的。

無論是作為「下一代人機交互標準」,還是作為「零售行業的重要入口」,亞馬遜成功地驅動了用戶和計算機「說話」的慾望。人機交互的公式被圖形界面定義了數十年之久,整個行業也幾乎被巨頭們籠罩得嚴嚴實實。亞馬遜通過自己敏銳的產品洞察力,在其之上撕開了一個大裂口。而如何將新的交互方式與自身的業務線有機結合,將會是亞馬遜未來 5 - 10 年的機遇與挑戰。

剛剛過去的 Google I/O,谷歌在語音助手這一塊展現出了空前的重視程度。而接下來的 WWDC 18,蘋果也將在這個領域交出一份自己的答卷。無論是把握著互聯網軟件服務的谷歌,還是把握著硬件製造和銷售主導地位的蘋果,都不希望看到計算機交互的未來被把握在亞馬遜的手上。而 Alexa 能否成為亞馬遜走向美國科技界制高點的關鍵動力,會是未來幾年內不可忽視的重要話題。 ■


分享到:


相關文章: