10.08 五年前,是什麼讓李彥宏相信了AI?

大部分人的思考習慣,是看到一個東西成功了,就感嘆成功者的運氣。卻很少人願意去回溯,到底一件事從想法到現實,經歷了怎麼樣的思考和判斷,以及自我完善的過程。

把時間倒回過去來思考,其實是件很有意思的事情。比如今天我們已經知道押注AI,可以說是百度做的最正確選擇之一。如今AI已經和百度融為一體,甚至成為中國科技界的一張名片,這都應該沒有什麼人反對。

而與廣大科技企業近兩年突然轉型AI不同,李彥宏和百度早早就選擇了相信AI,甚至很早就判斷清楚了AI即將在哪些具體領域爆發。

五年前,是什麼讓李彥宏相信了AI?

比如2013年的時候,李彥宏表示“語音技術會根本性地改變人們使用互聯網和手機的方式”;同年,他還認為“人機對話的問題,最近幾年會很快進入實用階段。”在2014年,他又提出“5年後語音搜索會超文字搜索”,隨後2015年百度推出了度秘。

顯而易見,今天來看這些判斷都實現了。但在五年前,似乎還沒有多少人關注智能語音交互。這裡我們可以做個有意思的遊戲:回到五年前李彥宏的視角,看看有哪些因素讓他選擇相信AI。尤其是相信AI能夠帶來商業價值,並判斷AI將以何種形態帶來商業價值。

不難看出,當時的李彥宏,至少可以發現智能語音正在改變三件事。

一、效率

2013-2015,是中文語音識別率快速攀升的三年。這一段時間裡AI的中文語音識別成功率,成功超過了人類語言交互效率。另一方面,NLP和語義理解技術開始因深度學習而成熟,AI能夠“聽懂”人類,出現了可能性。

這樣的技術指數,雖然對於普通人來說在當時並不意味著什麼,但就產業發展趨勢而言,意味著三件事必然在未來發生:

1、鍵盤可以被取代。打字輸入固然也很方便,但其存在的核心價值在於效率。在語音識別率大幅攀升,可以彈性識別人類語言的情況下,鍵盤輸入的必要性也將受到挑戰。尤其在手機端,語音輸入優勢空前。

2、按鈕將逐漸被取代。生活、生產中有無數的按鈕,這些按鈕存在的價值是因為人需要操縱某個機器,比如說電視遙控器。但在語音識別與語句理解能力攀升後,按鈕的地位可以被動搖。當然從而產生的經濟價值也是難以估量的。

五年前,是什麼讓李彥宏相信了AI?

3、冗務被替代。今天社會中的很多工作,無非就是聽、記錄和反饋。尤其其中相當大一部分是效率低下的冗務,在AI識別說話的準確度達標後,大量類似工作將被取代,人類獲取服務的效率將大幅提升。

這些互聯網生活中的基礎效率改變,意味著巨大的市場調節和生產力升級。智能語音交互作為這一切的基礎,其根基來自於技術升級。這對於技術立身的百度來說是比其他風口更好的機會。去年李彥宏談論AI時提出AI時代更適合百度這樣的技術公司,他認為“僅僅兩年的時間,大家就知道了深度學習,算法在迅速地發生變化。外界既然都認識到了AI的重要性,那麼對於百度來說,成功的機會自然變大”。

AI的技術積累來自百度更早的投入,而在此之前,則是企業家對於“技術到底能換取什麼價值”這件事的預判,這或許也是DuerOS最初的思考邏輯。

二、“搜索-答案”的關係

百度的核心業務是搜索,那麼在上述邏輯中,智能語音帶來輸入效率提升和長句理解能力後,搜索業務勢必面臨巨大的迭代。這或許帶給思考“搜索的未來”的李彥宏,另一種可能的發展方向。加上一門叫做知識圖譜的AI技術,已經開始廣泛投入應用,搜索的變革也就自然而然孕育在了AI之中。

智能語音的進場,最直接的改變是用戶從習慣於搜索關鍵詞,開始向習慣於輸入大容量語句,也就是向搜索引擎進行提問過渡。那麼隨之而來的,也就是用戶期待的不僅是帶有關鍵詞的搜索結果和百科,還有對問題的解答,甚至對問題的再提問。

所謂搜索,核心價值是連接了人與信息,但信息不僅是關鍵詞,更多時候信息隱藏在問題背後。這樣的搜索習慣必須以用戶能夠提出複雜問題為開始,而智能語音正好帶給用戶以培養提問習慣的機會。

五年前,是什麼讓李彥宏相信了AI?

此外,用語言對事物進行描述,更符合人類習慣。進行抽象的、非關鍵詞的搜索服務,也難以離開語音交互的支持。

而從問答式搜索去到更遠一點的地方,很多時候我們需要的甚至不僅是答案,而是建議,甚至是反問和辯論。這樣的搜索效果有可能實現嗎?假如可以的話,核心當然需要更智能的系統。但高度純熟的自然語言理解與自然語言處理,帶來人機對話的完整性,當然是另一項基礎工程。

按照搜索的進化來思考,我們很容易發現搜索業務是離不開語音交互的。那麼智能語音為什麼對百度如此重要,當然也就不難理解了。用李彥宏自己的說法,在移動互聯網普及之後,“要麼think AI,要麼 say goodbye”。

三、人機關係

更大的機會,在於人機關係正在因為“人機對話”模式的到來而改變,這也是李彥宏早在幾年前就做出的判斷。AI可以讓人類與系統交談,系統的理解可以轉化為命令,命令是機器執行的根源——那麼人機交互必須以手觸發的現狀,也就很可能成為歷史。

我們很難低估以語音操控機器的潛力。在最普通的家居環境中,有個說法是你不換智能家居的時候不會多想它,可一旦換了就再也回不了頭。這是因為操作的簡便性和準確度來說,語言遠遠超過一個個開關。尤其是能夠在空間中行使命令,這是天然更符合人性的人機交互方式。

家居之外,人機交互的價值迭代還發生在近乎每一個生活中的核心場景:工廠中很多工作可以由工人指揮機器完成,帶來巨大的效率提升;辦公場景里語音交互可以升級為助手,取代海量的協同工作;駕駛場景中,如果能說話控制方向盤以外的一切,那麼對使用體驗是巨大的解放,更遑論無人駕駛場景裡,人機交互只能靠語音來完成。

在語音識別和理解能力成熟後,這些市場自然會顯現出價值。這對當時的百度來說是一個巨大的機會。於是我們看到了百度並沒有慌忙搶佔音箱風口,而是搭建底層平臺,逐步完善對人機交互種類的覆蓋。這是因為在百度的優勢中,設備不是核心,技術帶來的人機關係改變才是。

結論

退回到五年前,我們站在李彥宏的視角中可以發現有三個準確出現的現象:智能語音技術正在成熟、智能語音對於百度的核心業務影響巨大、語音交互背後隱藏著巨大的新市場。這三件事支撐百度準確找到了AI時代的核心方向。今天DuerOS連接的設備已經過億,智能語音也成為了核心基礎技術。

但或許我們應該問的是:智能語音已經來到頂峰了嗎?退回去看百度與李彥宏當年的判斷,或許答案應該是:還沒有。

無論是搜索、信息流、內容,還是人機協作與泛社會應用,智能語音在今天只是打開了市場,搭建了更牢靠的基礎。語言的魔力與紅利,都還沒有完整來到商業世界。百度的對話式AI之戰,可能也還要跨過更遠的山樑。

同時我們也可以發現,計算機視覺在這兩年也正在爆發。而李彥宏恰好在2016年曾預言過,計算機視覺將是無人駕駛的最後一公里。因此我們也可以判斷,在Apollo平臺的搭建中,計算機視覺將成為其中的重要部分。而種種跡象表明,這一預測或許不再需要另一個5年,正在快速向我們駛來。

退回原點,往往可以看到更多。在我們今天猜測AI未來的時候,這個方法或許格外有用。今天,又有哪些技術原點,可以幫我們透視未來呢?


分享到:


相關文章: