語音畫像:提升人工智慧認知力的新入口

過去的互聯網和移動互聯網,在跟人的交互中,最重要的是你的手指。你需要輸入文字,或者至少在觸摸屏上點擊幾下。但是,不少科技公司都打賭,互聯網下一個入口的關鍵是語音。這也是為什麼智能音箱成為大公司和創業公司都紛紛涉足的領域。

不過,這還只是停留在把語音,也就是自然語言當做是發出指令和輸入信息的手段。

《財富》雜誌的一篇文章說,藉助人工智能技術,其實可以從一個人的語音中識別出這個人的幾乎全部信息,包括“情緒、社會地位、成長經歷、年齡、種族、體重、身高、面部特徵”。這項技術被稱作“語音畫像”。

語音畫像:提升人工智能認知力的新入口

2017年12月,卡內基梅隆大學的研究人員就僅憑分析語音,還原出講話者的面部三維影像。負責這項研究的科學家說:“你的聲音就像是你的DNA或者指紋。”

這項技術也開始被投入實際應用。美國海岸警衛隊就正在利用卡內基梅隆大學的技術,對惡作劇報警電話的人進行立案。海岸警衛隊每年會接到150個左右這樣的電話,它浪費了營救人員的時間和金錢。

把聲音指紋投入到安全應用中,可以彌補銀行目前人臉識別可能有的漏洞;也可以應用在汽車服務,開口說話,汽車就會識別出主人,解除防盜警報,根據你的喜好調節座椅、車內溫度等。

同樣的,所有那些把聲音作為入口的智能硬件,比如電視、音箱等,都可以識別出人的年齡、喜好,而不是僅僅聽從指令。比如,如果它識別出聲音的主人還是個小孩,可以拒絕按照聲音指令播放一些限制級電影。

技術研究機構未來今日研究所的創始人艾米·韋布的觀點是:“如果DNA可以定義你本人,那麼從你的聲音中就可以捕獲你的完整人格”。

總之,語音識別技術的進展讓人們意識到,聲音中包含的信息遠比語言表達出來的多。

大數據處理信息服務商金盛網聚WJFabric認為,以數據研究的方式識別、認定自然聲音並將其進行存儲以便進一步研究,這是發展人工智能新的切入點。聲音是人類能夠主動釋放出的,並且帶有鮮明個性的物質,因此對於聲音的研究完全可以成為了解人類的另一個維度。聲音所傳遞的不光是可書寫的內容,伴隨聲音一起體現出的語調、情緒等信息都能表徵發聲者的個性。因此,如果數據樣本收集得足夠多,那麼在識別發聲人,並對其狀態定位、需求預判方面將有極大的研究價值。


分享到:


相關文章: