再見,scikit-learn!終於等到新ML Python包

一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包

大數據文摘專欄作品

作者:Christopher Dossman

編譯:Olivia、Junefish、雲舟


嗚啦啦啦啦啦啦啦大家好,本週的AI Scholar Weekly欄目又和大家見面啦!

AI ScholarWeekly是AI領域的學術專欄,致力於為你帶來最新潮、最全面、最深度的AI學術概覽,一網打盡每週AI學術的前沿資訊。

每週更新,做AI科研,每週從這一篇開始就夠啦


本週關鍵詞:GAN、物理建模、物聯網設備識別


本週最佳學術研究


用於微調GAN的簡單有效基準——凍結判別器


生成對抗網絡(GANs)在大量計算機視覺問題中表現出色,但通常對訓練數據和計算資源的需求量大。轉移學習可以解決這個困難,但其間很容易導致過擬合或對分佈轉移的學習效果不好等問題。


一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包


為了應對這一挑戰,研究人員現在提出了一個簡單而有效的基準用於GAN的轉移學習。他們發現,微調網絡(生成器和判別器)的同時凍結判別器的底層效果出奇得好,因此凍結判別器就誕生了。


在StyleGAN和SNGAN投影架構下和Animal Face、Anime Face、Oxford Flower、CUB-200-2011和Caltech-256數據集中,研究人員提出的凍結判別器基準在無條件和有條件GAN中的表現均明顯優於現有方法。


研究人員表示,使用者可以自行採用更復雜的設計來得到比本文提出的基準更優的結果,這表明該研究方向的前景可期。


Github傳送門:

https://github.com/sangwoomo/freezeD


https://arxiv.org/abs/2002.10964v1


用於計算物理的輕量級Python框架


這項工作描述了一種新開發的計算框架turboPy。它是一個輕量級的物理建模框架,基於使用了胞中粒子法(PIC)編碼的設計turboWAVE,來快速制定新的物理規範原型。

一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包

一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包


TurboPy實現了很多個類,包括驅動模擬並管理物理模塊之間交流的Simulation,處理問題各部分動態細節的PhysicsModule和處理常見的各種輔助問題的Grid和Diagnostic等。


turboPy框架的使用可以減輕計算科學家的認知負擔,同時實現新代碼的設計來完成所需工作流程。使用者只需將工作流程描繪成一個在時間循環中重複發生的過程,再簡單將其轉化成turboPy框圖即可。


創建GUI來開發turboPy框圖並完成問題設定,進而提供python軟件包便於用戶的安裝使用,如此turboPy可以更好地在將來的工作中發揮作用。


https://arxiv.org/abs/2002.08842


一勞永逸的兩級開放式詞彙語言模型


本文提出了一種神經語言模型,其中包含了用於單詞拼寫的生成模型。研究人員展示了在開放式詞彙NLP任務中,使用已知單詞的拼寫幫助處理未知單詞的過程。


這種方法可以用於擴展任何封閉式詞彙生成模型,但是本文重點考慮了神經語言建模的情況。該貝葉斯生成模型將兩個模型合併起來生成故事,其中標準的RNN語言模型用於生成每個句子中的單詞標記,而基於RNN的拼寫模型用於生成每種單詞類型中的字母。


一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包

一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包

和語言學中一樣,這兩個RNN各自捕獲的信息(句子結構和單詞結構)是分離的。再調用第二個RNN為上下文中的新單詞生成拼寫,開放式詞彙模型就完成了。


與基準相比,該模型的表現擊敗了之前的研究成果,並在多個數據集上得到了當前最優的結果。


這個兩級開放式詞彙生成模型不僅可以記住常用單詞的拼寫和嵌入信息,而且還可以根據詞彙或非詞彙的拼寫風格,聯繫上下文生成新的單詞類型。


該方法將來可以用在其他使用單詞嵌入的生成式NLP模型中,並且在諸如文本分類(特別是在資源較少的語言和領域)等任務中發揮極大作用。


https://arxiv.org/pdf/1804.08205v4.pdf


用於快速機器學習模型開發的Python API


在本文中,德國明斯特大學的研究人員介紹了他們所謂的PHOTON,它是一種高級Python應用程序編程接口(API)。針對當前最佳實踐的機器學習模型,它提供了一種方便使用且靈活的方法來實現快速,可重複且無偏見的效果。 PHOTON基於三個概念:設計,自動化和集成。

一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包

一週AI最火論文 | 再見,scikit-learn!終於等到新ML Python包


PHOTON旨在簡化和加速機器學習模型開發的過程。它可以設計基本和高級機器學習管道架構,並自動化重複的訓練、優化和評估工作流程。 PHOTON可以輕鬆訪問已建立的機器學習工具箱,還可以針對模型構建和評估過程的任何部分,實現集成自定義算法和解決方案。它在概念上與scikit-learn相似,但在核心功能方面進行了擴展。


PHOTON旨在簡化和加速機器學習工作流程,從而實現快速,可重複且無偏見的分析。它特別適合需要迭代評估新方法的環境,例如醫學和生命科學中的應用機器學習研究。研究人員未來希望擴展更多功能和可用性,並吸引更多的開發人員和用戶來建立一個繁榮的開源社區。


https://arxiv.org/abs/2002.05426


使用深度學習進行物聯網設備識別


廣泛採用的自帶設備(BYOD)策略允許員工將任何物聯網設備帶入工作場所,這增加了組織網絡被攻擊的風險。


研究人員日前第一次將深度學習技術應用於網絡流量的TCP有效負載,以進行IoT設備分類和識別。在這項工作中,他們提出了一種方法,該方法使用深度學習來識別網絡流量中的已知和未經授權的IoT設備,識別出10種不同的IoT設備以及智能手機和計算機的流量,其準確率超過99%,總體上達到檢測連接到網絡的未授權IoT設備的高於99%的平均準確度。


與以前的研究不同,該方法通過使用從物聯網設備的網絡流量有效載荷中構建的小圖像來表示物聯網設備的“通信行為”,不需要在網絡流量上應用複雜的特徵工程。


該方法在架構方面很簡單,並且沒有特徵工程的開銷。它可用於檢測網絡流量中列入白名單的IoT設備。該技術只需要一個TCP會話即可檢測到源物聯網設備,而現有方法則需要多個TCP會話才能進行檢測。


https://arxiv.org/abs/2002.11686v1


其他爆款論文


谷歌AI:致力於提升用於語言基礎任務的街景全景入口:

https://ai.googleblog.com/2020/02/enhancing-research-communitys-access-to.html


3D人體姿勢估計新解決方案,其性能優於先前在Human3.6M和MPI-INF-3DHP數據集上的最佳結果:

https://arxiv.org/abs/2002.10322v2


跨越Python理論與實際應用之間的鴻溝:

https://arxiv.org/abs/2002.11631


標籤指導的文本分類,朝著有效性與穩健性邁進:

https://arxiv.org/abs/2002.10772v1


醫學超聲圖像分割中的深度學習:

https://arxiv.org/abs/2002.07703v2


DNN迭代實例:改善Airbnb搜索的深度學習:

https://arxiv.org/abs/2002.05515


數據集


Google發佈了Open Images V6數據集,該數據集目前具有本地化敘述特徵,希望能刺激人們對真實場景的理解:

https://storage.googleapis.com/openimages/web/index.html


機器學習50個不容錯過的免費數據庫:

https://lionbridge.ai/datasets/the-50-best-free-datasets-for-machine-learning/


規則學習和評估工具的綜合數據集,助你生成各種數據集和評估規則學習系統,包括新的績效指標等:

https://arxiv.org/abs/1909.07095v2


最大的酒店推薦公開數據集:

https://github.com/Diego999/HotelRec


AI大事件


中國醫院部署AI,助力診斷Covid-19病例:

https://www.wired.com/story/chinese-hospitals-deploy-ai-help-diagnose-covid-19/


Google宣佈2019年Google大學研究獎獲獎者,資助150項有關機器學習,人機交互等方面的極具前景的提案:

https://ai.googleblog.com/2020/02/announcing-2019-google-faculty-research.html


Qure.ai籌集了1600萬美元,用於識別胸部和頭部掃描異常的人工智能研究:

https://venturebeat.com/2020/02/26/qure-ai-raises-16-million-for-ai-that-spots-abnormalities-in-chest-and-head-scans/


自閉症兒童福音:機器人可以教授社交技巧,幫助兒童更好地發展:

https://www.technologyreview.com/s/615288/ai-robots-teach-autistic-kids-social-skills-development/?utm_source=newsletters&utm_medium=email&utm_campaign=the_download.unpaid.engagement


豐田向中國自動駕駛創業公司Pony.ai投資4億美元:

https://www.msn.com/en-us/autos/news/toyota-invests-dollar400-million-in-chinese-self-driving-startup-ponyai/ar-BB10qQcy


分享到:


相關文章: