受量子多體物理研究啟發,研究者設計多尺度神經網絡架構

重正化群是物理學研究中的一個基本概念。它不僅是研究相變與臨界現象以及強耦合問題的有力工具,更塑造了物理學家的世界觀:物理學是關於不同尺度和能標下演生現象(Emergent Phenomena)的有效理論。

人們在深度學習的應用實踐中觀察到,深層神經網絡具有逐層提取特徵的能力。處於網絡深層的神經元往往對應於抽象而獨立的演生概念。如何充分理解並創造性地利用神經網絡的這一特性,是深度學習的核心問題之一,稱為表示學習(Representation Learning)。開展表示學習和重正化群理論的交叉研究,一方面有助於揭示深層神經網絡的工作原理,另一方面可將成功的深度學習技術應用於求解物理問題。

最近,中國科學院物理研究所/北京凝聚態物理國家研究中心凝聚態理論與材料計算重點實驗室T03組的博士研究生李爍輝和副研究員王磊提出了一類基於正則化流(Normalizing Flows)的多尺度神經網絡架構。這類網絡將微觀物理構型的概率分佈映射到隱變量空間的近高斯分佈。相反的,由於網絡的可逆性,也可以從高斯噪聲出發直接生成可能的物理構型。

作者從物理問題的裸作用量出發,利用變分原理端對端地訓練網絡。為了充分發揮表示學習的能力,他們進一步提出隱變量空間的哈密頓蒙特卡羅更新算法。這個神經網絡的結構設計受到了量子多體物理研究中的多尺度糾纏重正化張量網絡(Multiscale Entanglement Renormalization Ansatz, 即MERA)的啟發。在數學上,神經網絡重正化群相當於自適應地尋找降低變量之間互信息(Mutual Information)的非線性小波變換。

流向隱變量空間的正則化流有助於自動識別集體變量和有效理論,預計可以在統計物理、場論以及第一性原理分子動力學研究中發揮作用。此外,可逆的重正化流恰好契合重正化群理論的現代發展:保信息的全息重正化。因此,神經網絡重正化群也為研究全息對偶原理(Holographic Duality Principle)提供了新途徑。該工作於近期發表於Physical Review Letters雜誌(Phys. Rev. Lett. 121, 260601 (2018))。

此工作受到科技部(2016YFA0300603)和國家自然科學基金委(11774398)的資助。可參考王磊在美國物理學會編輯部“Physics Next: Machine Learning”會議上的報告 https://journals.aps.org/physics-next/2018/machine-learning-abstracts#Wang 和作者發佈的開源程序實現 https://github.com/li012589/NeuralRG 進一步瞭解此工作。

文章鏈接:

https://journals.aps.org/prl/abstract/10.1103/PhysRevLett.121.260601

http://www.iop.cas.cn/xwzx/kydt/201901/P020190107535434397653.pdf


受量子多體物理研究啟發,研究者設計多尺度神經網絡架構

正則化流實現了物理變量和隱變量之間的可逆映射


分享到:


相關文章: