溫馨提示:由於嘉賓在美國,本次分享時間的時間調整為北京時間6月6日晚上9點。
活動信息
▼
主題:像素之聲—圖像和聲音的跨模態自監督學習
時間:北京時間6月6日(週三)21:00
地點:將門創投鬥魚直播間
分享提綱
▼
深度學習的出現使得利用不同模式信號之間的學習變得容易。但同時,由於神經網絡對數據量的需求,標註大量的跨模態的數據非常困難。在最近的工作中,我們利用視頻中圖像和聲音的內在關聯性,進行一系列的自監督學習。主要的應用有特徵學習,聲音識別,聲音分離,聲源在圖像中的定位等。
本次分享主要分為以下三個內容:
聲音分離:通過自監督學習,分離出視頻中的物體的聲音
背景:聲音信號的分析
背景:自監督學習
聲音分類與特徵學習:利用已有的圖像分類網絡,幫助聲音分類網絡進行特徵學習
聲源定位:通過自監督學習,找到視頻中聲音的來源
嘉賓介紹
▼
趙行
MIT在讀博士生
本科畢業於浙江大學,於麻省理工媒體實驗室完成碩士論文,現為麻省理工計算機與人工智能實驗室博士生。主要研究方向為場景解析,視頻識別,和跨模態學習。
觀看直播或加群
▼
-The End-
將門是一家專注於發掘、加速並投資技術創新激活商業價值的創業公司的新型創投機構,旗下設有將門創新服務、將門技術社群以及將門投資基金。
將門創新服務專注於使創新的技術落地於真正的應用場景,激活和實現全新的商業價值,服務於行業領先企業和技術創新型創業公司。
將門技術社群專注於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。
將門投資基金專注於投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在兩年的時間裡,將門投資基金已經投資了包括量化派、碼隆科技、禾賽科技、偉景智能、杉數科技、迪英加科技等數十傢俱有高成長潛力的技術型創業公司。
如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我“門”: [email protected]
點擊右上角,把文章朋友圈
將門創投
讓創新獲得認可!
閱讀更多 將門創投 的文章