請翻譯:微軟如何下好AI這盤大棋

請翻譯:微軟如何下好AI這盤大棋

想象一下,咖啡桌旁兩人相對而坐,一位只會說中文,另一位只能講英語,可是他們卻聊得眉飛色舞,這是什麼情況?

有翻譯器!熟悉數碼產品的人一定會馬上說出答案。

的確,目前很多AI企業都推出了體積小巧、功能強大的即時翻譯器,這似乎並不是一個新鮮事物。那麼,如果旁邊突然又過來了一位說法語的,也和中國人攀談了起來,接著又加入了一位說日語的,對話卻依然在順暢進行,這又是什麼情況?

在前兩天的2018 微軟人工智能大會上,這樣的場景引起了很多與會者的好奇心。當天,小米生態鏈企業香蕉出行展示了基於微軟翻譯引擎的“魔芋AI翻譯器”,這款翻譯器能夠提供多達14種語言的實時語音翻譯。而通過遠場語音識別技術,兩個語言不通的人可以像朋友一樣,邊喝咖啡邊聊天,使用不同語言的人還可以通過語音進行語言模式切換,自由自在地進行多語種交流。

突然感覺,這款不到手機一半大小的小東西,很快將會成為出國旅行時的必備“利器”。

從一款翻譯器到一群生態夥伴

請翻譯:微軟如何下好AI這盤大棋

不過,顯然香蕉出行不僅僅是要打造一款旅行專用翻譯器,在公司合夥人及CTO於亮看來,魔芋AI翻譯器核心的武器是AI,而AI促使以往的翻譯能力突破了窠臼。“整個翻譯器市場火起來有個原因,語音(識別)的技術和翻譯的技術都達到了可以真正落地的水平。” 於亮在和懂懂筆記交流時表示,目前人們對於語言交流(翻譯)的訴求越來越多,“隨著整個社會的開放性,人們到達的地方將更多,開放合作的機會將更多,多元化的交流需求也會更多。”

關於產品,於亮坦言一直自己有一個夢想,就是能夠做一款世界上最好用的翻譯器。“關於核心技術,我們的思路是迅速落地產品,在翻譯、語音這方面藉助與微軟的合作,儘快實現技術積累。”

於亮所說的合作,來自於微軟今年2月與小米簽署的戰略合作備忘錄,內容包括微軟與小米在AI方面的多個合作項目,如計算機視覺、語音、自然語言處理、對話式人工智能、知識庫等AI技術,還有“兩位小姐妹”——小娜和小冰、SwiftKey、微軟翻譯Translator等方面的產品及服務。

可能有人會說,當天微軟人工智能大會上可是秀出了“18般武器”,你為什麼只關注小米生態鏈企業的這款翻譯器?

其實原因很簡單,這個有趣的產品背後透露出了兩個關鍵詞——技術落地和商業夥伴。

首先,微軟這幾年在AI技術方面的深耕正在開始全面落地;其次,除了小米,我們還看到國內大量的商業合作伙伴(生態體系)開始浮出水面。

這也正是2018 微軟人工智能大會上,值得業界關注的最重要的一些信息。

作為一名普通參會者,我們在大會上看到的,是微軟在語音語義、視覺、機器翻譯和“全雙工語音技術”等方面的新進展;ONNX項目及ML.NET背後正在建立的開源跨平臺AI開發框架;包括中國移動、小米生態鏈、大疆、唯品會等多家合作伙伴基於微軟AI技術展示的合作成果。而更多重要的信息,需要進一步剝繭抽絲。

三個令人動容的瞬間

懂懂筆記在微軟人工智能大會上感覺最有趣的,首先是三個人講的三段話。

“全雙工……谷歌動不動就喜歡吹牛。我們的系統不僅僅支持兩個人交流對話,還可以支持五個人(對話),這算是全武工(全五工)了?”在大會上,微軟技術院士黃學東這句半開玩笑的話語,引發觀眾席上的一片笑聲。

或許是因為前一段時間谷歌I/O大會上的那段“人機對話”在朋友圈霸屏,多少讓黃學東感覺有些不忿。微軟也對此表示,早在2017年微軟小冰就已經主動和人類撥打了第一個電話,遠遠早於谷歌。而黃學東提到的“全五工”,是指現場演示的微軟與Roobo合作研發的一款AI會議系統,這款開會“利器”可以同時支持五人對話和語音內容記錄。

可以看到,會議中交流的幾個人有時是一人一句,有時話題會被打斷或是有人插話進來,而這款“利器”能自動識別出說話的人和聲音,並把各方講話內容自動轉換為文字並記錄下來。這裡的“全五工”,指的是數據能同時在五個方向上進行傳輸,實現群聊識別及多輪對話記憶等功能。

在這段演示背後透露出的信息,是微軟即將在今年秋季推出一項開源計劃——全雙工語音感官技術(Full Duplex)。微軟將在中國和日本幫助開發者在開發相關應用時,能夠使用到包括語音喚醒、群聊識別(基本身份與聲紋)、控制器應答、多輪對話記憶等新的技術成果。

“有時候用戶冒犯了小冰,小冰也會打電話過去質問對方,有時能把用戶問蒙了。” 微軟 (亞洲) 互聯網工程院副院長李笛的這句話,引發了很多聽眾的興趣。小冰在很多場景中的應用以及越來越普及,而且這個“小姑娘”已經讓人真假難辨,聽不出是一個人工智能系統了。

李笛展示的內容,包括小冰在與一位用戶電話聊天后,判斷出對方的情緒不好,於是再次撥打電話,詢問對方情緒是否好轉,還溫馨提示用戶儘早休息,並預告了第二天的天氣狀況。這個小故事背後,體現的就是人工智能從語音識別到語義識別過程中的巨大進步。而從大會上透露出的中國移動與微軟合作內容來看,微軟已經將領先的語音技術應用到前者巨大的語音及數據運營環境中,同時雙方還將在機器翻譯等技術上打造出更多的應用場景。

請翻譯:微軟如何下好AI這盤大棋

大會上,最讓聽者動容的,還是微軟全球執行副總裁沈向洋的這一幕畫面:他與來自南京工業大學的碩士研究生宋昊旻的一段對話。宋昊旻自幼喪失聽力,發聲也非常困難,但他通過不懈努力,終於考上了南京工業大學的本科和碩士研究生。現場宋昊旻是通過微軟語音服務的協助,與沈向洋進行了對話。沈向洋介紹,針對宋昊旻聲音特點定製的語音識別模型,能夠將他努力發出的語音轉換成文字,而且可以同步翻譯成多種外語,真正實現無障礙溝通。

沈向洋在其新書《未來計算》中表示:人工智能的發展讓我們有機會,以前所未有的方式塑造我們的未來,我們必須以負責任的態度,確保打造一個所有人都能參與和分享的美好未來,讓人工智能為全人類造福。對於他講的這一點,我們深感認同。

而在當天的大會上,技術趨勢和亮點太多,我們所記憶深刻的這三個瞬間,也只是眾多精彩中的一小部分。正如沈向洋所總結的,微軟正在將認知服務擴展到智能邊緣,通過推出ONNX項目及ML.NET開源跨平臺人工智能開發框架,以及為微軟小冰賦予更多創意功能““將18項創新技術、工具、服務與合作伙伴分享,與開發者分享,共同把握數字化轉型機遇。”

多形態的合作伙伴=數據維度

請翻譯:微軟如何下好AI這盤大棋

關於大會上微軟這十八般武器,以及背後的底氣,我們認為不僅僅來自於技術的能力。

之所以這麼說,來自於對AI應用落地的理解。

在與眾多科技企業高管的以往交流中,可以得到這樣一個共識:AI不僅僅是算法、技術門檻,它還需要海量的(並且是打過標籤的)數據進行訓練,讓算法和模型在反覆訓練中變得更加“聰明”。更為重要的是,大數據的多維度、多樣化尤為重要。

反過來看,即便依靠微軟自家的數據積累,也不足以支撐起一個更加聰明的AI系統。這時候,更多的合作伙伴,更完善的生態體系也就彌足珍貴了,這裡的合作伙伴,包含開發者和合作商業企業。

以微軟認知服務為例,目前微軟已經在全球推出了覆蓋語音、視覺、語言、機器翻譯等功能的24項服務,並且有超過100萬開發者使用認知服務。而微軟智能雲上的Azure Batch AI服務,則允許數據科學家和人工智能開發者以非常簡單的方式利用包括GPU在內的Azure雲計算資源對人工智能模型進行訓練。數據科學家只需明確任務需求,設定輸入、存儲、輸出等設置,其它所有與基礎設施管理、規模縮放、批量工作任務相關的繁雜的後臺工作都能由Azure Batch AI自動完成。

而大會當天的眾多商業合作伙伴——中國移動、大疆創新、唯品會、遊族網絡、小米生態鏈企業等分享的案例中,我們也能看到開放和共贏的AI合作理念,對於微軟夯實自身在行業應用落地中的重要作用。

微軟大中華區副總裁兼市場營銷及運營總經理康容在與懂懂筆記的交流中這樣強調,“實力”與“態度”是微軟人工智能得以贏得廣大中國客戶、合作伙伴、開發者充分信任的兩個關鍵要素。“從認知服務、機器人框架到最新發布的ONNX和ML.NET,微軟正在不斷敞開胸懷,積極擁抱開放、開源、跨平臺開發。”康容總結。

他以和小米公司的合作為例,強調雙方強強合作的基礎是創造共贏:“小米是從客戶轉變成夥伴關係的,小米重在技術和產品落地,微軟則有AI和雲方面的身後積累,雙方的合作空間會不斷擴大。”

實際上,手握Azure這朵雲,微軟發力AI已經有了先天優勢,而要讓AI和雲落地應用,瞭解行業,深入行業已經成為必然,這也就可以理解,微軟不僅在中國市場,包括在全球市場去積極擁抱各行各業的企業客戶資源,積極拓展具有行業特點的應用場景的落地工作。

這也是CEO納德拉過去一年多來戰略變化的重點——不斷推進微軟研究院的研究項目轉換為實際應用和產品,加碼增值服務市場的增長勢能。至少從微軟2018年Q2的財報中,我們已經看到ABC(AI+BigData+Cloud)融合帶來的效果:Azure在全球雲計算市場的份額已經從 16%上升到了 20%。

當然,作為一名普通消費者,微軟財報的變化離我們太遠。而懂懂筆記籌劃的,是在下一場說走就走的“歐洲五小國自由行”裝備清單裡,加上那個能“講”14種語言的翻譯器了。


分享到:


相關文章: