線上|MIT在讀博士生趙行:像素之聲—圖像和聲音的跨模態自監督學習

线上|MIT在读博士生赵行:像素之声—图像和声音的跨模态自监督学习

溫馨提示:由於嘉賓在美國,本次分享時間的時間調整為北京時間6月6日晚上9點

活動信息

主題:像素之聲—圖像和聲音的跨模態自監督學習

時間:北京時間6月6日(週三)21:00

地點:將門創投鬥魚直播間

分享提綱

深度學習的出現使得利用不同模式信號之間的學習變得容易。但同時,由於神經網絡對數據量的需求,標註大量的跨模態的數據非常困難。在最近的工作中,我們利用視頻中圖像和聲音的內在關聯性,進行一系列的自監督學習。主要的應用有特徵學習,聲音識別,聲音分離,聲源在圖像中的定位等。

本次分享主要分為以下三個內容:

  • 聲音分離:通過自監督學習,分離出視頻中的物體的聲音

  • 背景:聲音信號的分析

  • 背景:自監督學習

  • 聲音分類與特徵學習:利用已有的圖像分類網絡,幫助聲音分類網絡進行特徵學習

  • 聲源定位:通過自監督學習,找到視頻中聲音的來源

嘉賓介紹

线上|MIT在读博士生赵行:像素之声—图像和声音的跨模态自监督学习

趙行

MIT在讀博士生

本科畢業於浙江大學,於麻省理工媒體實驗室完成碩士論文,現為麻省理工計算機與人工智能實驗室博士生。主要研究方向為場景解析,視頻識別,和跨模態學習。

觀看直播或加群

-The End-

將門是一家專注於發掘、加速並投資技術創新激活商業價值的創業公司的新型創投機構,旗下設有將門創新服務、將門技術社群以及將門投資基金。

將門創新服務專注於使創新的技術落地於真正的應用場景,激活和實現全新的商業價值,服務於行業領先企業和技術創新型創業公司。

將門技術社群專注於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。

將門投資基金專注於投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在兩年的時間裡,將門投資基金已經投資了包括量化派、碼隆科技、禾賽科技、偉景智能、杉數科技、迪英加科技等數十傢俱有高成長潛力的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我“門”: [email protected]

线上|MIT在读博士生赵行:像素之声—图像和声音的跨模态自监督学习

點擊右上角,把文章朋友圈

將門創投

讓創新獲得認可!

[email protected]


分享到:


相關文章: