01.15 百度,技術求道二十年

一家公司,可以靠技術走到多遠?

1996年的李彥宏是否認真想過這個問題,我們不得而知。但他做的一些事,已經為這個問題作了回答。當時還在華爾街工作的李彥宏獲得了超鏈分析的技術專利,這項技術創造性地把互聯網頁面引用相關性納入了搜索引擎的考慮範疇。

在此之前的搜索引擎世界,你輸入某個詞,可能搜索出的第一個結果是某個無聊的人,在網頁上把這個詞打了一萬遍。而超鏈分析的加入,讓最權威、最官方、最熱門的搜索結果有可能第一時間展現在用戶面前。

憑藉著這個信息學技術與互聯網應用“天馬行空”般的結合,李彥宏創造了進入21世紀之後新一代搜索引擎的關鍵技術,也創造了百度。

百度,技術求道二十年

從這個角度看,百度就是誕生於技術創新之上的。它因技術車輪的轉動而生,也在技術引擎的呼嘯聲中不斷向前。而今超鏈分析作為百度的原創技術,已經在全球所有搜索引擎中服務這個世界,而百度究竟有過多少種技術創新,恐怕也需要某種厲害的技術才能統計清楚。

今年是百度成立的第二十年。不知道從什麼時候開始,互聯網圈子裡開始說這樣一句話:騰訊的產品,阿里的運營,百度的技術。

而當時針悄然劃到2020,從搜索到AI,從互聯網浪潮的崛起到智能時代的晨曦。這家名叫百度的公司,已經行走於,篤信於、開墾於技術,整整二十年。

這是百度從未休息過的技術創新二十年。

技術就是閃電

“眾裡尋他千百度”。百度這個名字,可能註定就是要探索更多未知。

可能很多人已經不記得,初生時的百度就是一家技術服務提供商。2000年6月,百度首次為門戶網站提供搜索技術服務,隨後又提供中文網頁信息檢索服務。此後不到兩年時間,百度就佔據了全國80%的網站搜索技術服務市場。回憶一下,會發現技術優勢是百度誕生之源,而在眾多互聯網公司中,百度可以說是先天具備to B基因那一家。

百度,技術求道二十年

隨後,李彥宏決定迅速調整戰略,將業務模型從提供搜索技術服務,轉向到自行經營搜索引擎。在這場從企業市場走向消費市場的變革中,技術依然是百度的主幹道。

在所謂“互聯網模式還未興起”,中國還沒有流行“微創新”的時候,也很少有人相信依靠硬技術,一家中國公司可以幹掉全球化佈局、技術遙遙領先業界的谷歌。

但李彥宏卻相信可以。而這之後的故事證明,這真的是一個非常樸實的技術判斷。

在2002年,李彥宏親自發起了能刻上《搜索引擎史》的“閃電計劃”,即要求百度在9個月內,將日訪問頁面提升10倍,頁面反應速率達到和谷歌一樣快,內容更新頻率全面超越谷歌。

百度,技術求道二十年

在閃電計劃的最後幾個月,李彥宏親自下場帶領小組成員進行研發。經過對搜索引擎大幅度的技術優化,兼容吸收了眾多前沿技術之後,到2002年年底閃電計劃目標已經完成。在那之後,百度一舉奠定了技術體驗最好引擎的交椅,也為飛馳的中國互聯網產業拉開了序幕。

那時候,李彥宏經常把搜索引擎比作CPU。沒有CPU電腦無法工作,沒有搜索引擎互聯網也就無法完成信息的傳輸和交互。CPU是電腦中最精密、技術難度最高的部件,搜索引擎也如是。

在百度看來,搜索引擎的技術進化是無止境的。在2005年,百度提出了“更懂中文的搜索引擎”這一口號,實質上已經開啟了搜索引擎與語義理解、語言分析等智能技術的結合。從搜索到智能,百度技術之道“一以貫之”。

框計算的未來屬性

二十年時間,會沉澱眾多關鍵改變的發生節點。對於百度來說,2009年的百度技術創新大會可算一個。

那時智能手機還沒有興起,中國互聯網產業普遍更多關重營銷和渠道,鮮少有大會提及技術。這時,李彥宏卻首次提出了“框計算”概念。所謂框計算,是指用戶在“百度框”中輸入服務需求,系統就能明確識別這種需求,並將該需求分配給最優的內容資源或應用提供商處理,快速反饋給用戶精準結果。比如用戶輸入“搞笑的句子”,搜索引擎將為用戶送上這些句子,而不是帶有這句話的網頁。

百度,技術求道二十年

即使在今天,框計算依然代表著非常高級的人機交互方式。回到2009年,這一技術理念更是具有絕對說服力的前瞻性技術。

“框計算”的本質,就是AI技術中非常關鍵的需求識別與知識圖譜。實現框計算,既需要極具前瞻性的AI技術探索,同時也需要強大的搜索引擎技術作為支撐。比如搜索“搞笑的句子”這句話就要通過3億次計算來識別需求,並在100億個網頁資源中檢索並進行需求分配,整個過程要在不到十分之一秒內完成。

這項跨越了兩個代際的超前技術,不止展現出百度的技術厚度,同時也充分釋放了百度對未來技術世界的構想與判斷。如今擔任百度CTO的王海峰,在當時已經是享譽國際的AI科學家,他就是了解到百度在框計算領域的投入和篤定,才決定加盟這家成立不到十年的互聯網公司。

百度,技術求道二十年

對於技術信仰者來說,遠見是最有吸引力的一種品質;當你拿出一項技術時,也就完成了與時代的無聲交流——這也是在技術世界中,百度始終是那座高塔的原因。

看到AI,探索AI

到了2010年前後,中國互聯網用戶規模突破了4億,智能手機剛剛完成了3G網絡的普及。那時你與99%的中國互聯網從業者討論AI,他大概都會聊起電影和文學。

而百度,竟然真的在那時開始佈局和構建AI了。

百度與AI結緣之早,至今是眾多互聯網愛好者眼中的“未解之謎”。但是如果從技術發展的趨勢看,卻可以看出百度的誕生就建立在將搜索引擎智能化的基礎上。開拓期的十年間,智能化也成為百度眼中最清晰的未來。

百度,技術求道二十年

而王海峰的加盟,某種意義上代表著百度技術開啟了新的階段:科學家與互聯網公司攜手合作的日子開始了。

如今,科學家的多少已經成為了互聯網公司的某種“指標”。但在2010年,大部分互聯網公司還是一股“草莽味道”。這時間的百度,卻走向了產學研高度結合的技術迭代之路。

隨著王海峰的到來,百度在隨後移動時代與智能化浪潮中的技術組織布局接連啟動。比如後來被稱為“技術鐵軍”的 “百度自然語言處理部門”成立,以服務搜索引擎中發生的NLP需求與智能化升級趨勢。隨後在語音、圖像的智能化領域,百度“多媒體部門”誕生,接著非常重要的知識圖譜系統也被確定。

在百度業務體系中佈局AI技術組織之外,還誕生了另一個百度技術史上的關鍵節點——百度深度學習研究院(IDL)的成立。

百度,技術求道二十年

當時,深度學習對於互聯網產業來說還是極盡陌生的名詞。我們似乎無法想象,會有一家公司能夠像百度一樣,在2012-2013年間就開始佈局深度學習。

奇妙的是,李彥宏和王海峰關於在百度開展深度學習基礎研究的想法一拍即合。就這樣,深度學習在中國的齒輪開啟了轉動。

這之後,前瞻性技術與產學研高度一體化研究,開始成為了百度技術的標配。2013年初IDL成立後,百度又陸續成立了大數據實驗室BDL、硅谷人工智能實驗室SVAIL等,並將這些研究團隊,逐漸打造成負責前瞻性科學探索研究的百度研究院。

2019年底,國家工業信息安全發展研究中心發佈了《人工智能中國專利技術分析報告》。報告顯示 ,百度以5712件位居AI專利申請量榜第一。成績的果實背後,總有關於技術的洞察、佈局和經年磨礪作為前因。

搜索與智能合流

在百度技術史中,是無法把搜索引擎和AI徹底區分開的。確切來說,AI作為一種通用底層技術,可以廣泛融入和支撐起作為應用技術的搜索引擎。

從2014年開始,百度開始基於知識圖譜、圖像識別、語音識別、自然語言處理等技術,開始進一步加碼對搜索技術的升級。並且開始將深度學習技術引入搜索引擎之中,讓搜索的智能體驗更加準確和自然。

接下來的幾年間,百度搜索推出了語音搜索、圖像搜索和拍照搜索功能,並且建立了全球最大的中文知識圖譜。這些技術的攀爬,推動百度搜索不再僅僅是單一的搜索引擎,同時變成了用戶瞭解世界、探索世界的入口。

百度,技術求道二十年

與此同時,百度AI在移動互聯網領域也加速了技術推進。比如百度信息流產品上,百度的AI技術支撐起了領先業界的內容抓取準確度和用戶推薦模型精準度。又比如這一時間由語音搜索功能孵化出了度秘,這一技術體系成為百度移動生態、百度輸入法,乃至後來整個小度軟硬件體系的起點。

到2019年第三季度,百度搜索的首條滿足率已經達到了56%。搜索引擎已經能夠準確理解用戶需求,提供直觀、準確的信息、知識和服務。百度APP多輪語音對話問答和真人聊天幾乎無區別,點開相機圖標就能自動識別超過1000萬種物品,30+場景識別。

而百度的技術之路,也開始指向下一個宏偉的時代。

智能時代的基座

從貝爾實驗室到IBM,技術公司的前行往往會經歷這樣一個過程:從應用技術不斷向底層技術、基礎技術發展,最終通過底層技術的突破和發展,孕育下一個產業時代。

相比從搜索到AI的明線,從應用到底層技術的層層突圍,可能是百度較少為外人所知的技術暗線。在百度開始佈局AI等前瞻技術的同時,也開始堅定推動相關技術的平臺化,打造技術基礎設施。而當AI時代真正到來,整個中國社會會在產業智能化道路上,發現對關鍵基礎基座的戰略性需求——而此時,百度已經準備好了那個支點,是謂中國AI的“百度紅利”。

百度紅利的最典型體現,就是飛槳的創生與成長。

如今,AI開發需要基於深度學習框架,幾乎變得家喻戶曉。但在2012年,深度學習框架的概念在中國幾乎是完全的空白。在歐美主流框架也剛剛開始發展的彼時,百度卻已經著手開發了飛槳這款中國第一個、也是目前唯一一個完全意義上的深度學習開發框架。

百度,技術求道二十年

當時開發飛槳,百度的初心其實無比簡單。就是當時主流歐美開發框架僅支持單一GPU,無法進行大規模數據處理的問題。於是百度帶著技術公司獨特的剛猛,決定乾脆自己造地基,經過長期內部應用後,飛槳在2016年正式開源。

這也讓百度成為繼谷歌、Facebook、IBM之後,全球第四家、中國第一家開源深度學習開發框架的科技公司,從而讓中國在這個關鍵領域沒有陷入長期滯後。

2017年秋天開始,百度開始給予飛槳強力支持。2018年7月,百度調集精兵強將,成立了深度學習技術平臺部。到了2019年,飛槳的升級速度已若雷霆。通過對大量技術、服務、定製工具以及預訓練模型的集成,飛槳成為了以深度學習框架為核心的深度學習平臺,下接芯片,上承各種應用,是名副其實的“智能時代的操作系統”。

作為國內唯一開源開放、功能完備的深度學習平臺,飛槳已經走向了標準化、自動化和模塊化的發展階段,可以滿足產業開發者複雜多樣的AI開發需求,並且具備開發便捷的產業級深度學習框架、超大規模深度學習模型訓練技術、多端多平臺部署的高性能推理引擎、開源開放覆蓋多領域的產業級模型庫四大全球領先的核心技術。

如果說飛槳是AI時代的操作系統,是開發者隨時可用的工廠;那麼百度大腦就是AI時代技術集大成的代表,是可以滿足各種產業智能化需要的AI超市。

百度,技術求道二十年

早在2016年的百度世界大會上,百度大腦正式對外發布。這一舉動標誌著百度將積累數年之久的AI核心技術和AI平臺對外開放。到了2019年互聯網公司開始講技術中臺,而百度的技術平臺化卻能上溯到幾年前,並且通過百度大腦之名完成了對社會的開放賦能。

AI技術的企業,不可能像百度一樣從頭開始研發AI技術。能站在百度的肩膀上進行技術和應用創新,對剛剛興起的中國AI產業來說是一個關鍵利好。

為了讓AI技術的應用者,不必從頭建造輪子,百度大腦從開放開始,每年都完成著幅度巨大的進化。2017年7月的百度AI開發者大會上,百度大腦2.0正式發佈,這一版本開放了包含基礎層、感知層、認知層和平臺層在內的完整AI技術體系;開放了語音、圖像、視頻、增強現實、自然語音處理等60多項AI核心能力,讓AI賦能開發者和行業應用有了足夠多的技術支撐。

到2018年的百度AI開發者大會,百度大腦宣佈升級至3.0,所開放的核心AI技術達到110多項,形成了從芯片到深度學習框架、平臺、生態的AI全棧技術佈局。尤其“多模態深度語義理解”的技術突破,讓百度大腦走向了世界AI產業的技術最前沿。

百度,技術求道二十年

2019年,百度大腦又進一步得到了跨越式的升級。在百度大腦5.0版本中,語音、視覺、語言和知識等核心算法都得到了再次突破。例如語音方面,流式多級的截斷注意力模型(SMLTA)使語音識別速度和識確度大幅提升,並可解決中英文混合語音的識別難題;風格遷移的語音合成技術,僅需20句話就可以製作一個人的專屬聲音,不僅保留語音中的音色、風格、情感等要素,使用時還可任意組合、靈活控制。

自2016年至今,百度大腦已經開放了228項領先AI能力,開發者數量超過150萬,日均調用量突破1萬億次,語音、人臉、NLP、OCR調用量中國第一,是業內最全面、最領先、服務規模最大的AI開放平臺。百度大腦成為了具備深度學習框架、場景化AI能力、定製化訓練平臺到軟硬一體模組和解決方案等,可以為多樣性的AI需要提供技術支撐。

假如說,搜索引擎的核心突破,讓百度成為了互聯網時代的“CPU”;那麼從飛槳到百度大腦的AI基座建設,則讓百度有機會成為智能時代,千行萬業的“發動機”。

用技術改變時代這件事,百度習以為常。

超級綻放

剛進入21世紀的時候,大部分中國人還無法想象有一天可以用搜索的方式瞭解世界。那時候的中國,正在等待百度用核心技術表演一次“信息綻放”。

當時間來到21世紀的20年代,這個對我們所有人來說都很陌生的時代。百度走過了屬於技術的二十年,從百度用AI完成的各種改變中,我們已經可以略微猜到接下來準備開啟的“超級綻放”。

2017年百度AIG的成立,標誌著百度是國內第一個將人工智能技術作為獨立部門運作的大型科技公司。依託於AIG提供的技術支持,百度原有業務體系得到了飛速強化、新業務戰略觸發點走向成熟。

百度,技術求道二十年

比如,2017年,百度發佈了全球首個自動駕駛開源項目Apollo自動駕駛開放平臺。目前,百度Apollo平臺已經匯聚了全球177家生態合作伙伴;在全球有97個國家超過3.6萬名開發者使用Apollo開源代碼,開源代碼數量超過56萬,Apollo自動駕駛平臺已成為全球最強大、最開放、最活躍的自動駕駛平臺。2019年,百度Apollo公開了國內唯一的純視覺L4級自動駕駛解決方案Apollo Lite,為自動駕駛這個人類夢想提供了堅實的新發展契機。

在對話式AI領域,最早從智能化搜索技術的路徑孵化出的小度助手,已經成為了國內技術體驗最好、生態最廣泛的對話式AI平臺。小度技能開放平臺為超過3.7萬開發者,提供3500多種技能支持;小度助手的合作伙伴數量已經超過500家,可以控制的IoT智能家居設備已經超過了7000萬。2019年,小度助手5.0還發布了全球領先的全雙工免喚醒能力,實現了“一次喚醒,多輪交互”免喚醒詞連續對話,真正實現了全球智能語音交互的領先。

在百度地圖上,2019年推出的全球首個地圖語音定製功能,讓每個人都能擁有專屬語音包;智能語音助手讓很多人習慣了出行 “動口不動手”,累積用戶量達到了3億,穩居行業第一。依靠AI技術能力的加持,作為新一代AI地圖的百度地圖,已經徹底在體驗上領先業界。

這種種綻放開的技術之花,僅僅是AI技術在百度體系內的“試驗田”。在整個社會範圍內,百度的AI技術已經滲透到各產業、各領域,為產業智能化時代的“超級綻放”做好了準備。

百度,技術求道二十年

回望百度技術變遷的二十年,這個過程就像個小孩子,因為喜歡、熱愛,以及對宏偉未來的無盡想象,而專心用積木搭建他心愛的城堡。慕然回首時,燈火闌珊處已經是廣廈萬間、桑林稻畝,他欣慰一笑,繼續埋頭於新的探索。

李彥宏在華爾街工作時,是憑藉靈感和天才般的想象,把信息學與搜索引擎結合到了一起;王海峰加入百度時,看到的是互聯網公司也能發展人工智能的驚喜;無數科學家、工程師走進百度,是因為他們相信這裡是最能夠純粹做技術的地方,這裡有最多的數據、最佳的算力、最領先的算法,也有最初的那顆心。

永遠比時代超前兩步,永遠單純如孩子。技術塑造了百度,技術最終會改變一切。


分享到:


相關文章: