一週AI最火論文 | 模型遺忘了我刪除的數據?這個算法可以評估

一週AI最火論文 | 模型遺忘了我刪除的數據?這個算法可以評估

大數據文摘專欄作品

作者:Christopher Dossman

編譯:Junefish、Luna、Andy


嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!

AI ScholarWeekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊。

每週更新,做AI科研,每週從這一篇開始就夠啦!


本週關鍵詞:新冠數據、無監督學習、3D人臉檢測


本週最火學術研究


一種評估機器學習模型是否遺忘了數據的方法


考慮以下場景:有幾個提供者,正計劃為開發深度學習模型來解決分類任務提供數據。突然,提供者之一決定離開並要求刪除數據,但更大的問題是,怎麼確保該模型“忘記”這份數據。


在本文中,研究人員首次提出了一個具有挑戰性的問題:模型是否忘記了數據?他們假設了解查詢數據集和模型輸出激活的分佈情況,並建立了統計方法,將目標的輸出與使用不同數據集訓練的模型的輸出進行比較。


論文貢獻:

1.引入數據隱私和保留方面的新問題。

2.提供一種可用於檢測模型是否忘記了特定數據的解決方案,包括當數據源有重疊時這樣具有挑戰性的情況


研究人員將該方法用在了自動心臟診斷挑戰賽(ACDC)的中一個心臟病理學的診斷任務上,並試驗了幾種基準數據集(MNIST,CIFAR-10和SVHN)。他們希望能夠鼓勵人們調查模型保留的信息,並激發模型在更復雜的環境中的擴展。對細分或迴歸任務的擴展,計劃在未來完成。


閱讀論文全文:

https://arxiv.org/pdf/2004.10129v1.pdf


一個面向API的圖無監督學習開源Python框架


本文介紹了Karate Club,它是一個結合了30多種先進的圖形挖掘算法的Python框架,可以解決無人監督的機器學習任務。該框架由Karate Club設計,有著一致的應用程序界面、可伸縮性、易用性、合理的即用型模型行為、標準化的數據集提取和輸出生成等特性。該研究還通過實際示例討論了框架背後的設計原理。


該軟件包的主要目標,是使機器學習研究人員和從業人員可以方便使用社團發現,節點以及整個圖向量等算法。


研究人員表明,Karate Club在處理眾多現實世界中的聚類問題,分類任務效率很高,而且有很多實驗結果支持這個結論。


閱讀論文全文:

https://arxiv.org/pdf/2003.04819v2.pdf


探索機器人技術中的進化元學習


為了實現機器人在複雜多變的世界中的自主運行,學習適應性策略至關重要。在本文中,谷歌AI研究人員與哥倫比亞大學合作提出了一種新的元學習方法,該方法可以使機器人快速適應動態變化。


與依賴於二階梯度估計的元學習算法相比,研究人員引入了更耐噪聲的Batch Hill-Climbing適應算子,並將其與基於進化策略的元學習相結合。針對機器人應用中很常見高噪聲環境設定,該方法顯著改善了動態變化的適應性,。


與基於策略梯度的最新MAML算法相比,該算法具有更高的自適應性能。此外,研究人員在真正的四足機器人上驗證了該方法,經過模擬訓練的運動策略可以成功地適應兩個真實世界的機器人環境,它們之間的動力學有著巨大的不同


閱讀論文全文:

https://ai.googleblog.com/2020/04/exploring-evolutionary-meta-learning-in.html


大規模高質量的3D人臉數據集和詳細的綁定3D人臉預測


這項新研究提出了一個大規模的詳細3D人臉數據集FaceScape,並提出了一種新穎的算法,能夠從單張圖片預測出精準綁定3D人臉模型。


FaceScape數據集提供了18,760個紋理化3D面部,這些3D面部模型從938個主題中捕獲,每個面部都有20種特定的表情,包含經過拓撲統一化處理的毛孔級別的面部幾何圖形。這些精美的3D面部模型可以表示為適用於粗糙的形狀表示的3D可變形模型,還可以表示為用於詳細的幾何形狀的位移圖。


利用大規模和高精度數據集,研究人員進一步提出了一種新的算法,該算法通過深度神經網絡可以實現學習特定表達式的動態細節。自單個輸入的圖像起,所學習的關係就成為我們3D人臉預測系統的基礎。與以前的方法不同,預測的3D模型可以在不同的表達式下,與高度詳細的幾何圖形進行綁定。這些前所未有的數據集和代碼將向公眾發佈以供研究。


閱讀更多:

https://arxiv.org/abs/2003.13989v3


新冠:新冠開源研究數據庫


2020年3月16日,艾倫AI研究所(AI2)與白宮科學技術政策辦公室(OSTP)、國家醫學圖書館(NLM)、陳和扎克伯格基金會(CZI)、微軟研究院和Kaggle在喬治敦大學安全與新興技術中心(CSET)的合作下,一起發佈了CORD-19的第一版開源研究數據庫,簡稱CORD-19。


CORD-19旨在通過其豐富的元數據和結構化全文文件,來促進文本挖掘和信息檢索系統的開發。自發布以來,CORD-19數據庫中的資料已被下載超過75,000次,並已成為許多Covid-19文本挖掘和發現系統的基礎。在本文中,研究人員描述了數據集構建的機制、重點介紹了挑戰和關鍵設計方面的決策、概述瞭如何使用CORD-19、並預覽了圍繞數據集構建的工具和即將進行的共享任務。


他們希望該資源將繼續使計算界、生物醫學專家和決策者聚集在一起,來共同尋求針對Covid-19的有效治療和管理政策。


下載CORD-19數據庫:

https://www.semanticscholar.org/

閱讀論文全文:

https://arxiv.org/pdf/2004.10706v1.pdf


其他爆款論文


YOLOv4:目標檢測的最佳速度和準確性

https://github.com/AlexeyAB/darknet


新冠病毒信息是如何在社交媒體中被誤傳的

https://usc-melady.github.io/COVID-19-Tweet-Analysis/


端到端的視覺機器人操縱的高效適應:曾經學習的行為可以適應全新的現實世界嗎?

https://sites.google.com/view/efficient-ft/home


如何使用單視圖合成具有多平面的圖像

https://single-view-mpi.github.io/


數據集


Yoga-82: 人類姿勢細分類的新數據集

https://arxiv.org/abs/2004.10362v1


學習資源


五門你不能錯過的機器學習免費課程

https://www.technotification.com/2019/02/websites-to-learn-machine-learning.html?fbclid=IwAR0GKAkdHKjSbhFnTC2pMDbuV10OWBFsOHucpFEgm2HIqXdLBMGHICGvOq0


AI大事件


Facebook和亞馬遜合作發佈了兩個用於部署的新PyTorch庫:TorchServe和TorchElastic

https://ai.facebook.com/blog/facebook-ai-aws-partner-to-release-new-pytorch-libraries-


醫生用AI給19位新冠病毒患者分類

https://www.technologyreview.com/2020/04/23/1000410/ai-triage-covid-19-patients-health-care/


PyTorch 1.5帶著全新和升級的庫來啦,這裡還有與Python配合使用的C ++前端API

https://pytorch.org/blog/pytorch-1-dot-5-released-with-new-and-updated-apis/


AI助力COVID19:預測病床和呼吸機需求

https://www.zdnet.com/article/this-ai-tool-helps-hospitals-predict-covid-19-bed-and-ventilator-demand/


分享到:


相關文章: